OpenAIがまた新たな技術を発表しました!最新リリースのGPT-4o miniは、「最も経済的な」小型モデルとして注目を集めています。これは単なるモデルのアップグレードではなく、インテリジェント革命の始まりと言えるでしょう。今日は、GPT-4o miniの神秘的なベールを剥がして、どのようにしてAIをより身近なものにしているのかを見ていきましょう。
賢く、そして経済的に
OpenAIのビジョンは、AIをあらゆる場所に届けることです。GPT-4o miniはそのビジョンの最新の実践です。このモデルは、コストの大幅な削減と同時に、性能も全く劣っていません。価格は、入力トークン100万個につき15セント、出力トークン100万個につき60セントと、以前の最先端モデルよりも桁違いに安く、GPT-3.5 Turboよりも60%以上安くなっています。
GPT-4o miniの低コストと低遅延により、複数のモデルの連続または並列呼び出し(複数のAPIの呼び出しなど)、大量のコンテキストのモデルへの渡 (コードベース全体や会話履歴など)、迅速なリアルタイムテキスト応答による顧客とのインタラクション(顧客サポートチャットボットなど)といった幅広いタスクに対応できます。
現在、GPT-4o miniはテキストとビジュアルのAPIをサポートしており、将来的にはテキスト、画像、ビデオ、オーディオの入出力もサポートする予定です。モデルは128Kトークンのコンテキストウィンドウを持ち、各リクエストで最大16Kの出力トークンをサポートし、知識のカットオフ日は2023年10月です。GPT-4oと共有している改良されたトークナイザーのおかげで、英語以外のテキスト処理がより経済的かつ効率的になりました。
小さな体格、大きな知恵
GPT-4o miniは、学術的なベンチマークテストでGPT-3.5 Turboや他の小型モデルを上回り、テキストインテリジェンスとマルチモーダル推論の両方で優れた性能を示しています。また、GPT-4oと同じ言語範囲をサポートし、関数呼び出しにおいても優れたパフォーマンスを発揮します。これにより、開発者は外部システムからデータを取得したり、操作を実行したりできるアプリケーションを構築することができ、GPT-3.5 Turboと比較して、長いコンテキストのパフォーマンスが向上しています。
主要なベンチマークテストにおけるGPT-4o miniの成績は以下の通りです。
推論タスク:テキストとビジュアルを含む推論タスクにおいて、GPT-4o miniは82.0%を達成し、Gemini Flashは77.9%、Claude Haikuは73.8%でした。
数学とコーディング能力:数学的推論とコーディングタスクにおいても、GPT-4o miniは優れた成績を残しました。MGSM(数学的推論)テストでは87.0%を達成し、Gemini Flashは75.5%、Claude Haikuは71.7%でした。HumanEval(コーディング性能)テストでは87.2%を達成し、Gemini Flashは71.5%、Claude Haikuは75.9%でした。
マルチモーダル推論:MMMU(マルチモーダル推論評価)において、GPT-4o miniは59.4%を達成し、Gemini Flashは56.1%、Claude Haikuは50.2%でした。
組み込みのセキュリティ対策
セキュリティは、常にOpenAIのモデル開発の中核です。事前トレーニング段階では、OpenAIはモデルが学習または出力することを望まない情報(ヘイトスピーチ、アダルトコンテンツ、個人情報を主に収集するウェブサイト、スパムなど)をフィルタリングします。トレーニング後、OpenAIは強化学習と人間のフィードバック(RLHF)などの技術を使用して、モデルの行動をOpenAIのポリシーに沿ったものにし、モデルの応答の正確性と信頼性を向上させています。
GPT-4o miniには、GPT-4oと同じセキュリティ対策が組み込まれており、OpenAIは以前の準備フレームワークと自発的なコミットメントに基づいて、自動化と人間の評価によって慎重に評価を行いました。70名以上の社会心理学や誤情報などの分野の外部専門家がGPT-4oをテストして潜在的なリスクを特定し、現在、OpenAIはこれらの問題を解決しており、近日公開予定のGPT-4oシステムカードと準備状況スコアカードで詳細情報を共有する予定です。これらの専門家の評価による知見は、GPT-4oとGPT-4o miniのセキュリティ向上に役立っています。
可用性と価格
GPT-4o miniは現在、テキストとビジュアルモデルとして、アシスタントAPI、チャットコンプリートAPI、バッチAPIで使用できます。開発者は、入力トークン100万個につき15セント、出力トークン100万個につき60セントを支払います(標準的な書籍約2500ページに相当)。今後数日以内に、GPT-4o miniのファインチューニング機能を導入する予定です。
ChatGPTでは、無料、Plus、チームユーザーは本日からGPT-4o miniにアクセスでき、GPT-3.5に置き換えられます。エンタープライズユーザーも来週からアクセスできるようになり、これはOpenAIがすべての人がAIの恩恵を受けられるようにするという使命に沿ったものです。
将来展望
OpenAIチームは次のように述べています。「過去数年で、AIの知能は著しく進歩し、同時にコストは大幅に削減されました。たとえば、2022年にリリースされた機能の弱いtext-davinci-003モデル以来、GPT-4o miniのトークンあたりのコストは99%削減されています。私たちは、コストの削減を続けながら、モデルの能力を向上させることに尽力しています。」
「私たちは、モデルがすべてのアプリケーションとウェブサイトにシームレスに統合される未来を想定しています。GPT-4o miniは、開発者がより効率的かつ経済的に強力なAIアプリケーションを構築および拡張するための道を切り開きます。AIの未来は、よりアクセスしやすく、信頼性が高く、私たちの日常生活のデジタル体験に組み込まれていくでしょう。私たちは、この流れをリードし続けることを嬉しく思っています。」