重大発表！ChatGPTが大幅アップグレード、OpenAIがGPT-4o Miniを発表

AIbase基地

公開日AIニュース · 1 分で読めます · Jul 19, 2024

406

AIスタートアップ企業のOpenAIは木曜日、新しいAIモデル「GPT-4o mini」を発表しました。これは、同社の好評なチャットボットの利用拡大を目指す最新の取り組みです。

このミニAIモデルは、OpenAIが発表した最速かつ最も強力なモデルであるGPT-4oの派生版で、50種類の異なる言語の音声、ビデオ、テキストを処理する能力を備えています。

モデルの「o」は万能を意味し、OpenAIは今後、画像、ビデオ、オーディオを統合する予定です。GPT-4o Miniは現在、画像とテキストのみを処理しますが、OpenAIによると、最終的には音声、ビデオ、その他のコンテンツタイプにも対応する予定です。

現在、ユーザーはOpenAIのプログラミングツールキットでGPT-4o Miniを使用できます。さらに重要なのは、無料および有料のChatGPTクライアントのGPT-3.5 Turboに取って代わったことで、ChatGPTユーザーへの無料サービス提供を意味します。

OpenAIが公開したテストデータによると、GPT-4o miniの数学、コーディング、視覚などの推論能力は非常に優れており、現在最も強力なマルチモーダル小型モデルの1つです。

例えば、GPT-4o miniはMMLUで82.0％、数学とコーディングにおいてMGSMテストで87.0％、マルチモーダルMMMUで59.4％というスコアを達成し、Gemini FlashやAnthropicのClaude Haikuを上回っています。

開発者にとって、新しい大規模言語モデルのコストはGPT-3.5 Turboよりも約60％低く、GPT-4o miniの100万トークンの入力コストは15セントですが、GPT-3.5 Turboの100万トークンの入出力コストは60セントです。

OpenAIは、800億ドルを超える価値を持つ投資家の支援を受けて成長を続け、生成AI市場におけるリーダーシップの維持と収益化への道を模索しています。

昨年、OpenAIの最高執行責任者であるBrad Lightcap氏は次のように述べています。「世界はマルチモーダルです。私たち人間がどのように世界を処理し、世界と相互作用するかを考えると、私たちは物を見て、聞いて、話します—世界はテキストだけではありません。そのため、テキストとコードを単一のモダリティにすること、これらのモデルがどれほど強力で、何が可能なのかを単一のインターフェースで持つことは、常に不完全なもののように感じられました。」

OpenAIは木曜日、ChatGPTの無料ユーザー、ChatGPT PlusおよびTeamサブスクリプションユーザー向けにGPT-4o miniを発表し、ChatGPT Enterpriseユーザー向けには来週利用可能になる予定です。

要点：
🤖 OpenAIが「GPT-4o mini」モデルを発表し、ChatGPTをアップグレード
🌐 GPT-4o miniはGPT-4oモデルの派生版で、多言語の音声、ビデオ、テキスト処理能力を持つ
💰 OpenAIはAI市場におけるリーダーシップの維持と収益化モデルの探求に尽力

AI音楽生成モデルMusiConGen：Transformerを用いた音楽生成、リズムとコードの精密制御

MusiConGenモデルは、事前学習済みのMusicGen-melodyフレームワークを微調整したもので、様々なスタイルの音楽片段の生成に使用されます。研究チームは、コードとリズムの制御パラメータを設定することで、生成された音楽サンプルを提示しており、リラックスしたブルース、スムーズなアシッドジャズ、クラシックロック、ハイエナジーファンク、ヘヴィメタルの5つの異なるスタイルを含んでいます。

マスクのxAI、来月Grok 2発表、Grok 3は12月発表予定

イーロン・マスクは、xAIが来月、GPT-4と同等の性能を持つAIモデルGrok 2を発表し、12月にはさらに強力なGrok 3を発表する予定であると発表しました。Grok 3はメンフィスデータセンターで15,000個以上のGPUを用いた大規模なトレーニングが行われています。一部のテスラビデオデータはまだモデルのトレーニングに利用されていませんが、ChatGPTとの比較ではGrokはまだいくつかの点で劣っていることが示されています。Xの買収という文脈においては、キャッチアップには時間が必要です。

小紅書、世界初の「AIコンビニ」を開設 AI関連の優れた投稿に3万～50万PVの支援

小紅書は先日、「科技薯」アカウントを立ち上げ、世界初のAIコンビニ創業プロジェクトを開始しました。全網の優れたクリエイターやテクノロジー企業と協力し、AIの最先端技術、有益な情報、感情的な体験などを提供するコンテンツを配信します。このコンビニでは、@趙純想氏などのクリエイティブなAI製品、例えば食事補助、AI式ラーメンレシピ、AIによる頸椎病治療、林亦LYi氏の家伝のAI治療、AIによる母親の未完成の仕事の完了支援などが販売されています。「科技薯」はまた、イベントを開催し、#AIコンビニを使用してAI関連の投稿を作成した投稿者に3万〜50万PVの支援を提供します。

AI界に衝撃！Llama 3.1リーク：4050億パラメーターのオープンソース巨獣襲来！

最近、4050億パラメーターを持つオープンソースの大規模言語モデルLlama 3.1がRedditでリークされ、大きな注目を集めています。現在、GPT-4に最も近いオープンソース製品と見なされており、一部の性能ではGPT-4を上回るとさえ言われています。Meta（旧Facebook）によってリリースされたこのモデルは、ベースモデルと70Bバージョンのベンチマーク結果を含んでおり、複数の性能テストでGPT-4を上回っています。Llama 3.1は、多言語サポート能力と広範なトレーニングデータセット（15Tトークン以上）を備えています。