AIプログラミング能力の進化！大規模言語モデルを繰り返し「洗脳」することでコードの質を向上

AIbase基地

公開日AIニュース · 1 分で読めます · Jan 13, 2025

185

近年、人工知能（AI）のプログラミング能力は目覚ましい発展を遂げていますが、完璧には程遠いです。最近、BuzzFeedのベテランデータサイエンティストであるMax Woolf氏が実験を通じて、大規模言語モデル（LLM）に「より良いコードを書く」という指示を繰り返し与えることで、AIが実際により高品質なコードを生成できることを発見しました。この発見は大きな注目を集め、業界の著名なAI科学者たちもこのことに強い関心を示し、反復とプロンプト設計の重要性を強調しています。

Woolf氏の実験では、Claude3.5SonnetというバージョンのAIモデルを用いて、一連のプログラミングタスクを行いました。最初は、モデルに簡単なプログラミング問題を提示しました。「100万個のランダムな整数の中から、各位の数字の合計が30になる最小値と最大値の差を求める」というものです。Claudeはこのタスクを受けると、要件を満たすコードを生成しましたが、Woolf氏はコードに改善の余地があると判断しました。

そこでWoolf氏は、コードを生成するたびに「より良いコードを書く」という指示を与え、Claudeに反復的な最適化を行うようにしました。最初の反復の後、Claudeはコードをオブジェクト指向のPythonクラスにリファクタリングし、2つの顕著な最適化を実現し、実行速度は2.7倍向上しました。2回目の反復では、Claudeはマルチスレッド処理とベクトル化計算を追加し、最終的にコードの実行速度は基本バージョンの5.1倍に達しました。

しかし、反復回数が増えるにつれて、コード品質の向上は鈍化し始めました。数回の最適化の後、モデルはJITコンパイルや非同期プログラミングなどのより高度な技術を試みましたが、一部の反復ではパフォーマンスが低下しました。最終的に、Woolf氏の実験は、反復的なプロンプトの可能性と限界を明らかにし、AIプログラミングの未来について新たな考察をもたらしました。

この研究は、AIのプログラミング分野における応用可能性を示しただけでなく、AIは反復によってコードの品質を向上させることができるものの、実際の応用においては、プロンプトをどのように適切に設計し、パフォーマンスと複雑性のバランスを取るかが、依然として深く検討すべき課題であることを示唆しています。

大規模言語モデルの効率を1.7倍に向上：バイトダンスのCOMET技術がオープンソース化

バイトダンス傘下の豆包大規模言語モデルチームは先日、混合専門家モデル（MoE）アーキテクチャにおける主要なボトルネックを克服し、COMETという名称の重要な最適化技術をオープンソース化したと発表しました。この技術は、大規模言語モデルのトレーニング効率を大幅に向上させ、最大1.7倍の効率向上を実現し、トレーニングコストを40％削減することに成功しました。画像注記：画像はAIによって生成され、画像ライセンス提供サービスMidjourneyを使用しています。COMET技術は、バイトダンスの万規模GPUクラスタトレーニングで実際に適用されており、数百万GPU時間の節約に貢献しています。

智元、家庭用ロボットベースの大規模言語モデルGO-1を発表成功率が大幅に向上

3月10日、智元ロボットは、初の汎用具象ベースの大規模言語モデルであるGenie Operator-1（GO-1と略称）を発表しました。この発表は大きな注目を集め、特に家庭用サービスロボットの可能性という点において、将来の家事管理に新たな希望をもたらすものとして期待されています。智元ロボットの公式発表によると、GO-1大規模言語モデルは大量の人間のビデオ学習を通じて、コップの水を運ぶ、食事を作る、客を迎えるなど、多くの家事タスクをこなす優れた能力を示しています。技術性能に関しては、

国家スパコンインターネットプラットフォームが阿里巴巴の千問大規模言語モデルに接続、QwQ-32B APIを提供開始

報道によると、国家スパコンインターネットプラットフォームは阿里巴巴の通義千問大規模言語モデルへの接続を発表し、千問QwQ-32B APIサービスの正式提供を開始しました。本サービスを利用するユーザーは、最大100万トークンを無料で利用でき、多くの開発者や研究者にとって絶好の機会となります。千問QwQ-32Bは阿里巴巴通義チームが最近オープンソース化した推論モデルであり、優れた性能を誇ります。複数の権威ある評価データによると、千問QwQ-32Bの能力は「フルバージョン」の671Bと匹敵します。