OpenAI、コード品質向上を目指した新モデルCriticGPTを発表

AIbase

公開日AIニュース · 1 分で読めます · Jun 28, 2024

116

OpenAIの研究者らは木曜日、ChatGPTが生成したコードのエラーを識別し修正することを目的とした革新的なAIモデル、CriticGPTを発表しました。この画期的な進歩は、人工知能技術における自己改善と品質管理において重要な一歩を踏み出したことを示しています。

QQ截图20240628091656.png

CriticGPTの主な特徴

1. GPT-4シリーズに基づく：CriticGPTは、強力なGPT-4言語モデルを基盤として構築されています。

2. コードレビューに特化：主にChatGPTが生成したプログラミングコードを分析し、潜在的なエラーを指摘するために使用されます。

3. 人工知能と人間の協働：人間のトレーナーのAIアシスタントとして、コードレビューの効率と正確性を向上させます。

4. 強化学習：人間のフィードバックから学習することで（RLHF）、AIシステムの「整合性」を高めます。

QQ截图20240628091930.png

開発プロセスと成果

研究者らは、CriticGPTを開発するために革新的なトレーニング方法を採用しました。

1. データセットの準備：意図的にエラーを挿入したコードサンプルを使用してトレーニングを行いました。

2. 人間の参加：人間のトレーナーにChatGPTが書いたコードを修正させ、エラーを導入し、フィードバックを提供してもらいました。

3. 新技術の応用：「強制サンプリング束探索」（FSBS）技術を導入し、詳細なコメントと架空の問題の生成のバランスを取りました。

QQ截图20240628091944.png

実験結果

- 自然発生的なエラー事例の63％で、人間はCriticGPTの指摘をより好みました。

- CriticGPTは、無意味な「批判」や誤検知/幻覚の問題を削減しました。

- 以前は完璧だと考えられていた事例の24％で、CriticGPTはエラーを発見し、それが確認されました。

潜在的な応用と限界

CriticGPTは主にコードレビューを対象としていますが、研究によると、非コードタスクにも適用できる可能性があります。しかし、このモデルにはいくつかの限界もあります。

1. 比較的短いChatGPTの回答でトレーニングされているため、より複雑なタスクには適していない可能性があります。

2. 架空の行動は減少しましたが、完全に排除されたわけではありません。

3. 複数の部分に分散しているエラーの識別においては、まだ改善の余地があります。

将来展望

OpenAIは、CriticGPTのようなモデルをRLHFラベリングパイプラインに統合し、トレーナーにAIアシスタントを提供する予定です。これは、大規模言語モデル（LLM）の出力評価ツールの開発における重要な進歩を示しています。しかし、研究者らは、AIアシスタントがあっても、非常に複雑なタスクは人間の評価者にとって依然として困難であることを強調しています。

AI技術の進歩に伴い、CriticGPTのような革新は、AIシステムの正確性と信頼性を向上させる上で重要な役割を果たし、AIと人間のニーズのさらなる整合性を促進するでしょう。

アドレス:https://openai.com/index/finding-gpt4s-mistakes-with-gpt-4/

AI大規模言語モデル業界の動向：新技術と連携の継続的な推進

人工知能の急速な発展を背景に、AI大規模言語モデルの研究開発と応用は活況を呈しています。最近、この分野における複数の企業や機関の最新動向が広く注目を集めています。まず、ChatGPTが登場する前のNVIDIAの時価総額倍率はウォール街で大きな注目を集め、専門家らは、これが2008年のアップルの成功神話を再現する兆候かもしれないと考えています。同時に、国泰君安の最高情報責任者である俞楓氏は、AI大規模言語モデルの台頭により証券業界が「インテリジェント認知」時代に入るだろうと述べています。

世界のオフィス75.9％がChatGPTをワークフローに導入 AIによる職場改革

DeskTimeの最新調査によると、ChatGPTは世界中のオフィスで最も広く使用されているAIツールとなり、2024年末までに職場での採用率は75.9％に達すると予想されています。この調査は97社、2385人の従業員を対象に、2023年1月から2024年12月までの期間で行われました。AI技術の発展に伴い、ChatGPTの業務における活用範囲も拡大し、その利便性と効率性から従業員に広く歓迎されています。画像参照

AIトラフィックの巨大消費者：ChatGPTが世界トップ10サイトにランクインも、トラフィックシェアはほぼゼロ

Similarwebの最新データによると、ChatGPTは2025年2月のアクセス数が3億9050万回に達し、1月と比較して1.44％微増しました。前月比増加率は鈍化していますが、2024年2月と比較すると、前年比増加率は依然として堅調で137％に達しています。この継続的な成長により、ChatGPTは世界ウェブサイトランキングで順位を上げ続け、現在、世界デスクトップサイトで5位、デスクトップとモバイルトラフィックを合わせたランキングでは7位に位置しています。データは、ChatGPTが世界のネットワークトラフィックを占めていることを示しています。

マイクロソフトCEO、AIモデルはコモディティ化しつつあると発言　システム統合と製品開発が鍵

最近のポッドキャストで、マイクロソフトCEOのサティア・ナデラ氏は、言語モデルの成熟に伴い、AIモデルが標準化、コモディティ化しつつあると述べました。この変化により、企業のAI開発戦略の中心が、単なるモデル開発からシステム統合と製品開発へとシフトしていると指摘。ナデラ氏は、モデルだけでは不十分であり、企業は完全なシステムアーキテクチャと成功する製品に注目する必要があると強調しました。「現在のAI業界は、波のような活動の真っ只中にある」と述べ、2022年11月以降の状況を説明しました。

AIニュース