OpenAIが最近発表したo3AIモデルは、同社で最も強力なAI製品と見なされていますが、その運用コストは驚くほど高く、1回のタスクあたり1000ドルを超えます。

TechCrunchの報道によると、この新しいモデルは複雑な問題を処理する際に「テスト時計算」と呼ばれる技術を採用しており、答えを出す前により多くの時間を費やして思考し、複数の可能性を探求することを意味します。そのため、OpenAIのエンジニアは、o3が複雑なプロンプトに対してより質の高い応答を生成することを期待しています。

ChatGPT OpenAI 人工知能 (3)

ARC-AGIベンチマークの創設者であるFrançois Chollet氏によると、o3は強力な「高計算モード」で87.5%のスコアを獲得しており、前世代のo1モデルの32%のスコアのおよそ3倍に達しています。これは、o3のパフォーマンスの向上が著しいことを示しています。しかし、この精密な計算プロセスには莫大なコストが伴います。この高スコアを達成するために、o3の計算コストはタスクあたり1000ドルを超え、低消費電力版o3よりも170倍も多く計算能力を使用しており、タスクあたりのコストが4ドル未満だった前身モデルをはるかに上回っています。

この状況により、業界ではo3モデルのパフォーマンスとその運用コストの矛盾に対する懸念が生じています。一方で、o3のスコアの大幅な向上は、処理能力とトレーニングデータを増やす「スケーリング」の方法によって、AIモデルは依然として進歩できることを証明しているように見えます。しかし一方で、スケーリングによる収穫逓減に関する批判の声も高まっています。o3の向上は、単なるスケーリングではなく、その「推論」方法の改善によるものが大きいものの、その高額な運用コストは間違いなく懸念材料です。

低計算バージョンのo3でも、ベンチマークテストで76%のスコアを獲得しましたが、タスクあたりのコストは約20ドルに達しています。比較的安価な選択肢ではありますが、前世代の製品と比較すると依然として数倍高くなっています。さらに、ChatGPT Plusの月額料金がわずか25ドルであることを考えると、OpenAIはユーザーエクスペリエンスの向上において大きなコストの圧力に直面しています。

ベンチマーク結果に関するブログ記事で、Chollet氏は、o3は人間の能力に近づいているものの、「コストはまだ高く、経済的には実現不可能」だと指摘しています。彼は、ARC-AGIタスクを人間が解決するコストは約タスクあたり5ドルで、エネルギー消費量はわずか数セントであると述べています。しかし、彼は楽観的に、「コスト効率は今後数ヶ月から数年で大幅に改善する可能性がある」と述べています。現在、o3は一般公開されておらず、「ミニ版」は来年1月に発売される予定です。

要点:

🌟 o3AIモデルの1回あたりのクエリコストは1000ドルを超え、その高額な運用費用を示しています。

📊 ARC-AGIベンチマークテストで、o3は87.5%のスコアを獲得し、前世代のo1モデルのおよそ3倍となっています。

🔍 現在、o3は一般公開されておらず、「ミニ版」は来年1月に発売される予定です。