アリババクラウド魔搭、階躍星辰の最新オープンソースの2つのマルチモーダルモデルを初公開

AIbase基地
この記事はAIbaseデイリーからのものです
【AIデイリー】へようこそ!ここは、毎日人工知能の世界を探求するためのガイドです。毎日、開発者に焦点を当て、技術トレンドを洞察し、革新的なAI製品アプリケーションを理解するのに役立つ、AI分野のホットなコンテンツをお届けします。
【AIデイリー】へようこそ!ここは、毎日人工知能の世界を探求するためのガイドです。毎日、開発者に焦点を当て、技術トレンドを洞察し、革新的なAI製品アプリケーションを理解するのに役立つ、AI分野のホットなコンテンツをお届けします。
【AIデイリーニュース】へようこそ!ここでは、人工知能の世界を探求するための毎日のガイドとして、AI分野のホットなトピックを毎日お届けします。開発者に焦点を当て、技術トレンドの洞察と革新的なAI製品アプリケーションの理解を支援します。最新のAI製品はこちらでご確認ください:https://top.aibase.com/1、OpenAIが2つのマルチモーダル推論モデルo4-miniとフルスペック版o3を発表OpenAIは技術ライブストリームで、最新のマルチモーダルモデルであるo4-miniとフルスペック版o3を発表しました。
人工知能分野に大きなブレイクスルーが訪れました。AIbaseはソーシャルメディアから、バイトダンスが最近、新しいマルチモーダル生成モデルであるLiquidのオープンソース化を発表したことを知りました。このモデルは、革新的な統一エンコーディング方式と単一の大規模言語モデル(LLM)アーキテクチャにより、ビジョン理解と生成タスクのシームレスな統合を実現しています。この発表は、バイトダンスのマルチモーダルAIにおける技術的な野心を示すだけでなく、世界中の開発者にとって強力なオープンソースツールを提供します。以下は、AIbaseによるLiquidモデルの詳細な分析であり、その技術革新とコアについて探ります。
人工知能分野において、アリババは再び大きなニュースをもたらしました。先日、アリババは最新のマルチモーダルモデルであるQwen2.5-VL-32B-Instructをオープンソース化しました。この新しいモデルはQwen2.5シリーズの一つであり、他のバージョンには3B、7B、72Bなどがあります。32Bバージョンは、性能を維持しながら、より手軽なローカル実行環境に重点を置いています。Qwen2.5-VL-32Bは強化学習によって最適化されており、複数の面で優れた性能を発揮します。まず、その回答はより人間に沿ったものとなっています。
【AI日報】へようこそ!ここでは、人工知能の世界を探求するための毎日のガイドとして、AI分野のホットなトピックを毎日お届けし、開発者に焦点を当て、技術トレンドを理解し、革新的なAI製品のアプリケーションを学ぶお手伝いをします。最新のAI製品の詳細はこちら:https://top.aibase.com/1、アリババがAIフラッグシップアプリケーション「新しい夸克」を「AIスーパーボックス」に全面アップグレードアリババは3月13日、新しくアップグレードされたAIフラッグシップアプリケーション「新しい夸克」を発表しました。2025年までに、智譜…
先日、魔楽コミュニティ(Modelers)で、階躍星辰が開発したオープンソースのマルチモーダル大規模モデルであるStep-VideoとStep-Audioが正式に公開されました。これらのモデルは、それぞれ動画生成と音声対話に使用され、開発者と企業ユーザーにより強力なAIツールを提供することを目指しています。Step-Videoモデルの正式名称はStep-Video-T2Vで、300億パラメーターという世界最大のオープンソース動画生成モデルです。このモデルは、20秒の動画を直接生成できます。
本日、階躍星辰と吉利汽車集団は、階躍Stepシリーズのマルチモーダル大規模モデル2つ——Step-Video-T2V動画生成モデルとStep-Audio音声モデル——を共同でオープンソース化すると発表しました。その中で、階躍Step-Video-T2V動画生成モデルは、パラメータ数と性能において世界をリードするレベルにあります。このモデルは300億個のパラメータを持ち、204フレーム、540Pの高解像度動画を直接生成でき、生成されたコンテンツの情報密度が高く、一貫性が高いことを保証します。評価結果によると、