OpenAIは、新しいモデルシリーズOpenAI o1を発表しました。この新しいモデルは、推論能力において優れた性能を発揮し、以前のモデルと比べて期待以上の成果を見せています。

image.png

OpenAI o1:より強力な推論能力

これは、複雑な問題解決を支援することを目的とした、全く新しい推論モデルシリーズです。これらのモデルは、応答する前により多くの時間を費やして思考するように特別にトレーニングされており、科学、コーディング、数学などの分野において、これまで以上に困難な問題を解決できます。OpenAI o1は、まずChatGPTとAPIで利用可能になります。

新しいモデルはどのように機能するのでしょうか?公式の説明によると、これらのモデルは人間のように問題を考え、さまざまな解決策を試み、エラーを迅速に検出するように特別にトレーニングされています。

研究者によるテストでは、次世代モデルの性能は、物理学、化学、生物学などの高度なタスクにおける博士課程の学生の性能に匹敵し、特に数学とコーディングの分野では優れた成果を上げています。例えば、国際数学オリンピックの予選試験では、従来のモデルGPT-4oは問題の13%しか正しく解けませんでしたが、新しい推論モデルは83%を達成しました。コーディング能力においても、Codeforcesコンテストで89パーセンタイルという好成績を収めました。

OpenAI o1は、複雑な論理パズルを解きました:

OpenAI o1は、プロンプトに基づいてビデオゲームをコーディングしました:

OpenAI o1は、破損した文を翻訳しました:

ただし、初期モデルであるo1-previewは、ウェブ閲覧やファイルアップロードなど、ChatGPTの実用性を高めるいくつかの機能がまだ不足していることに注意が必要です。しかし、複雑な推論タスクの処理においては、これは確かに大きな進歩です。新しいモデルの能力に合わせて、研究者たちはセキュリティ対策を強化し、安全と整合性のガイドラインに従うようにしています。

これらの強化された推論能力は、科学、コーディング、数学などの分野で複雑な問題を解決するユーザー、例えば医療研究者、物理学者、開発者などに特に適しています。

OpenAI o1-mini

OpenAIは、より小型のモデルであるOpenAI o1-miniも発表しました。これは、コード生成とデバッグにおいて優れた性能を発揮し、コストも低いため、広範な知識を必要としない推論が必要なアプリケーションに適しています。

小型モデルであるo1-miniは、o1-previewよりも80%安価であるため、推論が必要だが広範な世界知識を必要としないアプリケーションに最適な、強力で経済的なモデルとなっています。

OpenAI o1の使用方法

本日より、ChatGPT PlusとTeamユーザーは、モデル選択でo1-previewとo1-miniの2つのオプションを選択できます。

その後、ChatGPT EnterpriseとEduユーザーもこれらのモデルにアクセスできるようになります。開発者の皆様は、API利用条件を満たすユーザーが、これらのモデルを使用してプロトタイプ開発を開始できます。

今後、公式はこれらの推論モデルを継続的に更新し、ウェブ閲覧やファイルアップロードなどのより実用的な機能を追加して、ユーザーに優れたエクスペリエンスを提供していきます。

image.png

ただし、この新しいモデルを最大限に活用するには、ユーザーはプロンプトの伝え方を調整する必要があります。なぜなら、OpenAI o1の動作方法は、GPT-4やGPT-4oとは大きく異なるからです。

OpenAIのAPIドキュメントによると、OpenAI o1モデルは、シンプルで直接的なプロンプトを好みます。

プロンプトエンジニアリングによる、モデルガイダンスの簡素化

つまり、以前のように複雑な指示や長文のコンテキストを与える必要はありません。以前のモデルはより多くのガイダンスを必要とし、ユーザーはより長いコンテキストウィンドウを利用してモデルにタスクを理解させようとしましたが、OpenAI o1は既に強力な内部推論能力を備えているため、これらの冗長な説明は不要です。

OpenAIは、o1モデルを使用する際に、以下の点に注意するようユーザーに警告しています。

- プロンプトはシンプルで直接的にし、過剰な指示は避けてください。このモデルは指示をうまく理解できます。

- 「思考連鎖」プロンプトの使用は避けてください。o1モデルは既に内部推論能力を備えています。

- 区切り文字(三重引用符、XMLタグ、章見出しなど)を使用すると、モデルはどの部分を解析しているかをより明確に認識できます。

- 特に拡張検索生成(RAG)タスクを実行する際には、追加のコンテキスト情報を制限してください。背景資料を追加しすぎると、モデルの回答が複雑になる可能性があります。

これは、OpenAIが以前ユーザーに推奨していたものとは全く異なります。以前は、OpenAIはユーザーに非常に具体的になり、詳細を含め、段階的にモデルを指示するよう推奨していましたが、現在のOpenAI o1はより自律的に思考し、問題解決策を見つけることができます。

ペンシルバニア大学ウォートン校のEthan Mollick教授のブログでは、初期ユーザーとして、OpenAI o1が計画が必要なタスクでより優れた性能を発揮し、自律的に解決策を導き出せることを述べています。

もちろん、プロンプトエンジニアリングはますます重要になり、重要なスキルであるだけでなく、新たな職業分野にもなっています。そのため、他のAI開発者も、ユーザーがプロンプトを設計しやすくするためのツールを開発しています。例えば、Googleが発表したPrompt Poetは、外部データソースを統合することで、より関連性の高い応答を実現しています。

OpenAI o1は新しいモデルであるため、ユーザーはまだ使用方法を模索しています。しかし、一部のソーシャルメディアユーザーは、人々がChatGPTとのインタラクションの仕方を変更せざるを得なくなるだろうと予測しています。

image.png

OpenAI o1はまだ新しく、使用方法を模索している段階ですが、ソーシャルメディアの一部のユーザーは、ChatGPTとのやり取りの方法を再考する必要があると予測しています。

公式ブログ:https://openai.com/index/introducing-openai-o1-preview/

製品入口アクセス:https://top.aibase.com/tool/openai-o1

要点:

- 🤖 OpenAI o1モデルには、複雑な指示ではなく、シンプルで直接的なプロンプトが必要です。

- 🧠 「思考連鎖」プロンプトの使用は避けてください。o1モデルは既に内部推論能力を備えています。

- 📑 区切り文字を使用して、モデルが解析している部分を明確にし、追加のコンテキストを制限して複雑な回答を避けてください。