OpenAIは12日間にわたる技術共有ライブ配信イベントの後、最終日に次世代推論モデルo3を発表しました。これは、以前発表されたo1推論モデルの後継となるアップグレード版です。o3モデルシリーズには、o3とo3-miniの2つのバージョンがあり、o3-miniは特定のタスクに合わせて微調整された、より小型で簡素化されたモデルです。OpenAIは、o3モデルは特定の条件下では、汎用人工知能(AGI)に近づくことができると述べています。つまり、人間が行えるあらゆるタスクを実行できるAIです。

ARC-AGIグラフ論理推論ベンチマークテストにおいて、o3モデルは記録的なスコアを達成しました。低計算シナリオでは75.7%、高計算テストでは87.5%を記録し、人間の能力レベルの基準である85%を上回りました。対照的に、o1モデルのスコアは25%から32%の間でしたが、o3のパフォーマンスはo1のほぼ3倍です。世界的に有名なコーディングコンテストプラットフォームCodeforcesでは、o3は2727点を獲得しましたが、o1は1891点でした。

微信截图_20241223134833.png

猎豹移动猎户星空の会長である傅盛氏は、OpenAI o3の発表は「人人プログラマー時代」の到来を告げるものだと述べています。ユーザーはPythonやC言語に精通していなくてもプログラムを作成でき、ニーズを伝えるだけで、大規模言語モデルがプログラミング作業を支援します。傅盛氏は、o3の発表は、大規模言語モデルのプログラミング能力が99.9%のプログラマーを凌駕することを意味すると考えています。Codeforcesの世界的なプログラミングコンテストでは、o3はトップ175位という素晴らしい成績を収めましたが、o1は約90%以上のプログラマーを上回ったのに対し、以前のGPT-4は11%のプログラマーしか上回れませんでした。

OpenAIは、来年1月末にo3モデルを正式にリリースする予定です。傅盛氏は、プログラマーが完全に消滅するわけではないものの、彼らの仕事はユーザーニーズの理解と大規模なロジックの構築にシフトし、ニーズをコードに変換する作業はAIが大幅に担うようになると指摘しています。この発表は、AIがプログラミング分野でより広く利用されるようになり、同時にプログラマーの働き方を変える可能性を示唆しています。