OpenAI、GPT-4o miniを発表！API価格60%ダウン！AI業界の「お求めやすい価格」モデル

AIbase基地

公開日AIニュース · 1 分で読めます · Jul 19, 2024

311

OpenAIがまた新たな技術を発表しました！最新リリースのGPT-4o miniは、「最も経済的な」小型モデルとして注目を集めています。これは単なるモデルのアップグレードではなく、インテリジェント革命の始まりと言えるでしょう。今日は、GPT-4o miniの神秘的なベールを剥がして、どのようにしてAIをより身近なものにしているのかを見ていきましょう。

QQ截图20240719092011.jpg

賢く、そして経済的に

OpenAIのビジョンは、AIをあらゆる場所に届けることです。GPT-4o miniはそのビジョンの最新の実践です。このモデルは、コストの大幅な削減と同時に、性能も全く劣っていません。価格は、入力トークン100万個につき15セント、出力トークン100万個につき60セントと、以前の最先端モデルよりも桁違いに安く、GPT-3.5 Turboよりも60％以上安くなっています。

GPT-4o miniの低コストと低遅延により、複数のモデルの連続または並列呼び出し（複数のAPIの呼び出しなど）、大量のコンテキストのモデルへの渡 (コードベース全体や会話履歴など)、迅速なリアルタイムテキスト応答による顧客とのインタラクション（顧客サポートチャットボットなど）といった幅広いタスクに対応できます。

現在、GPT-4o miniはテキストとビジュアルのAPIをサポートしており、将来的にはテキスト、画像、ビデオ、オーディオの入出力もサポートする予定です。モデルは128Kトークンのコンテキストウィンドウを持ち、各リクエストで最大16Kの出力トークンをサポートし、知識のカットオフ日は2023年10月です。GPT-4oと共有している改良されたトークナイザーのおかげで、英語以外のテキスト処理がより経済的かつ効率的になりました。

小さな体格、大きな知恵

GPT-4o miniは、学術的なベンチマークテストでGPT-3.5 Turboや他の小型モデルを上回り、テキストインテリジェンスとマルチモーダル推論の両方で優れた性能を示しています。また、GPT-4oと同じ言語範囲をサポートし、関数呼び出しにおいても優れたパフォーマンスを発揮します。これにより、開発者は外部システムからデータを取得したり、操作を実行したりできるアプリケーションを構築することができ、GPT-3.5 Turboと比較して、長いコンテキストのパフォーマンスが向上しています。

主要なベンチマークテストにおけるGPT-4o miniの成績は以下の通りです。

推論タスク：テキストとビジュアルを含む推論タスクにおいて、GPT-4o miniは82.0％を達成し、Gemini Flashは77.9％、Claude Haikuは73.8％でした。
数学とコーディング能力：数学的推論とコーディングタスクにおいても、GPT-4o miniは優れた成績を残しました。MGSM（数学的推論）テストでは87.0％を達成し、Gemini Flashは75.5％、Claude Haikuは71.7％でした。HumanEval（コーディング性能）テストでは87.2％を達成し、Gemini Flashは71.5％、Claude Haikuは75.9％でした。
マルチモーダル推論：MMMU（マルチモーダル推論評価）において、GPT-4o miniは59.4％を達成し、Gemini Flashは56.1％、Claude Haikuは50.2％でした。

組み込みのセキュリティ対策

セキュリティは、常にOpenAIのモデル開発の中核です。事前トレーニング段階では、OpenAIはモデルが学習または出力することを望まない情報（ヘイトスピーチ、アダルトコンテンツ、個人情報を主に収集するウェブサイト、スパムなど）をフィルタリングします。トレーニング後、OpenAIは強化学習と人間のフィードバック（RLHF）などの技術を使用して、モデルの行動をOpenAIのポリシーに沿ったものにし、モデルの応答の正確性と信頼性を向上させています。

GPT-4o miniには、GPT-4oと同じセキュリティ対策が組み込まれており、OpenAIは以前の準備フレームワークと自発的なコミットメントに基づいて、自動化と人間の評価によって慎重に評価を行いました。70名以上の社会心理学や誤情報などの分野の外部専門家がGPT-4oをテストして潜在的なリスクを特定し、現在、OpenAIはこれらの問題を解決しており、近日公開予定のGPT-4oシステムカードと準備状況スコアカードで詳細情報を共有する予定です。これらの専門家の評価による知見は、GPT-4oとGPT-4o miniのセキュリティ向上に役立っています。

可用性と価格

GPT-4o miniは現在、テキストとビジュアルモデルとして、アシスタントAPI、チャットコンプリートAPI、バッチAPIで使用できます。開発者は、入力トークン100万個につき15セント、出力トークン100万個につき60セントを支払います（標準的な書籍約2500ページに相当）。今後数日以内に、GPT-4o miniのファインチューニング機能を導入する予定です。

ChatGPTでは、無料、Plus、チームユーザーは本日からGPT-4o miniにアクセスでき、GPT-3.5に置き換えられます。エンタープライズユーザーも来週からアクセスできるようになり、これはOpenAIがすべての人がAIの恩恵を受けられるようにするという使命に沿ったものです。

将来展望

OpenAIチームは次のように述べています。「過去数年で、AIの知能は著しく進歩し、同時にコストは大幅に削減されました。たとえば、2022年にリリースされた機能の弱いtext-davinci-003モデル以来、GPT-4o miniのトークンあたりのコストは99％削減されています。私たちは、コストの削減を続けながら、モデルの能力を向上させることに尽力しています。」

「私たちは、モデルがすべてのアプリケーションとウェブサイトにシームレスに統合される未来を想定しています。GPT-4o miniは、開発者がより効率的かつ経済的に強力なAIアプリケーションを構築および拡張するための道を切り開きます。AIの未来は、よりアクセスしやすく、信頼性が高く、私たちの日常生活のデジタル体験に組み込まれていくでしょう。私たちは、この流れをリードし続けることを嬉しく思っています。」

アリババ・ローンズがオープンソースで大規模な爆弾を投下！感情を読み取れる音声AIが登場。GPT-4oも戦慄するか？

阿里巴巴がオープンソースの音声大規模モデル「Fun-Audio-Chat-8B」を公開。超低遅延と自然な対話を特徴とし、GPT-4o Audioなどのクローズドモデルに匹敵する性能を持つ。リアルタイム理解と感情認識能力を備え、真のAI音声パートナーを目指す。....

GoogleとOpenAIの画像生成ツールが悪用される　ワンクリックで女性の不快なディープフェイク写真を生成可能

最近、Google GeminiやOpenAIのChatGPTなどの生成AIツールが悪意のある方法で利用されていることが明らかにされた。ユーザーは特定のヒントワードを使ってセキュリティチェックを回避し、通常の写真にある女性を露出したディープフェイク画像に変更していた。関連するチュートリアルはRedditなどのプラットフォームで広まり、AIのセキュリティの境界に対する懸念を引き起こした。

JanチームがJan-v2-VL-Maxをリリース！30Bのマルチモーダルモデルが長期間のエージェントタスクに特化しており、長時間のシーケンス処理でGemini 2.5 Proを上回る

Janチームは300億パラメータを持つマルチモーダル大規模モデルJan-v2-VL-Maxをリリースしました。このモデルは長期的な高安定性の自動化タスクに特化しており、GoogleのGemini 2.5 ProやDeepSeek R1を上回る性能を持っています。このモデルは、複数ステップのタスクにおける誤差累積や焦点の喪失といった問題を重点的に解決し、オープンソースのスマートエージェントエコシステムに強力な支援を提供します。

上海市に新規9製品の登録済み生成型AIサービスが追加

上海市ネットワーク情報弁公室は生成型AIの創新と規範を推進し、関連する管理規定に基づき、順序立ててサービス登録を行っています。APIなどの方法で登録済みモデルを呼び出し、世論の属性や社会的動員能力を持つサービスを提供する場合も、関係部門は登録を行います。現在、上海市には新たに9つの登録済みの生成型AIサービスが追加されています。

バイチューティアがSeed Prover1.5をリリース：形式的数学推論の新たな進展

バイチューティアのSeedチームが形式的数学推論モデルであるSeed Prover1.5をリリースし、大規模なAgentic強化学習により推論能力と効率を著しく向上させました。このモデルは2025年の国際数学オリンピック競技会で3日間で6問中4問を解決し、1問については部分的な解答も行い、その優れた性能を示しました。

Alexa+の大アップグレード！2026年からExpedia、Yelpなどの4つのプラットフォームと統合。AmazonがAI版スーパーエントリを構築する

アマゾンは2026年からAlexa+がAngiなどの家庭サービスと深く統合され、ユーザーはアプリを開かずに自然言語による会話でホテルの予約やヘアカットの予約などが可能になる。AIは「万能の中間者」として、複数の会話や動的なニーズの調整をサポートし、AI駆動型の消費者サービスプラットフォームへの転換を加速する。

アリババが大規模なAMD MI308AIチップの購入を計画していると報じられる

アリババはAI分野の需要を満たすため、数万個のAMD MI308 AIチップを購入予定。MI308は中国市場向けの規制適合チップで、米国の輸出許可を取得しており、NVIDIA H20と同様の適合製品。これはアリババのAI技術への重視を示すが、MI308はH20と比べてコストパフォーマンスと安全性に違いがある。....