アリババクラウド魔搭、階躍星辰の最新オープンソースの2つのマルチモーダルモデルを初公開

AIbase基地
この記事はAIbaseデイリーからのものです
【AIデイリー】へようこそ!ここは、毎日人工知能の世界を探求するためのガイドです。毎日、開発者に焦点を当て、技術トレンドを洞察し、革新的なAI製品アプリケーションを理解するのに役立つ、AI分野のホットなコンテンツをお届けします。
【AIデイリー】へようこそ!ここは、毎日人工知能の世界を探求するためのガイドです。毎日、開発者に焦点を当て、技術トレンドを洞察し、革新的なAI製品アプリケーションを理解するのに役立つ、AI分野のホットなコンテンツをお届けします。
人工知能分野において、アリババは再び大きなニュースをもたらしました。先日、アリババは最新のマルチモーダルモデルであるQwen2.5-VL-32B-Instructをオープンソース化しました。この新しいモデルはQwen2.5シリーズの一つであり、他のバージョンには3B、7B、72Bなどがあります。32Bバージョンは、性能を維持しながら、より手軽なローカル実行環境に重点を置いています。Qwen2.5-VL-32Bは強化学習によって最適化されており、複数の面で優れた性能を発揮します。まず、その回答はより人間に沿ったものとなっています。
【AI日報】へようこそ!ここでは、人工知能の世界を探求するための毎日のガイドとして、AI分野のホットなトピックを毎日お届けし、開発者に焦点を当て、技術トレンドを理解し、革新的なAI製品のアプリケーションを学ぶお手伝いをします。最新のAI製品の詳細はこちら:https://top.aibase.com/1、アリババがAIフラッグシップアプリケーション「新しい夸克」を「AIスーパーボックス」に全面アップグレードアリババは3月13日、新しくアップグレードされたAIフラッグシップアプリケーション「新しい夸克」を発表しました。2025年までに、智譜…
先日、魔楽コミュニティ(Modelers)で、階躍星辰が開発したオープンソースのマルチモーダル大規模モデルであるStep-VideoとStep-Audioが正式に公開されました。これらのモデルは、それぞれ動画生成と音声対話に使用され、開発者と企業ユーザーにより強力なAIツールを提供することを目指しています。Step-Videoモデルの正式名称はStep-Video-T2Vで、300億パラメーターという世界最大のオープンソース動画生成モデルです。このモデルは、20秒の動画を直接生成できます。
本日、階躍星辰と吉利汽車集団は、階躍Stepシリーズのマルチモーダル大規模モデル2つ——Step-Video-T2V動画生成モデルとStep-Audio音声モデル——を共同でオープンソース化すると発表しました。その中で、階躍Step-Video-T2V動画生成モデルは、パラメータ数と性能において世界をリードするレベルにあります。このモデルは300億個のパラメータを持ち、204フレーム、540Pの高解像度動画を直接生成でき、生成されたコンテンツの情報密度が高く、一貫性が高いことを保証します。評価結果によると、
先日、マイクロソフトリサーチはワシントン大学、スタンフォード大学、南カリフォルニア大学、カリフォルニア大学デービス校、カリフォルニア大学サンフランシスコ校の研究者らと共同で、LLaVA-Radを発表しました。これは、臨床放射線医学レポート作成の効率向上を目指した、新しい小型マルチモーダルモデル(SMM)です。このモデルの発表は、医学画像処理技術の大きな進歩を示すだけでなく、放射線医学の臨床応用にも新たな可能性をもたらします。バイオメディカル分野では、大規模基礎モデルに基づいた研究が進展しています。
近年、人工知能技術は目覚ましい進歩を遂げていますが、計算効率と多機能性の両立という課題が残っています。GPT-4などの多くの高度なマルチモーダルモデルは、通常、膨大な計算資源を必要とするため、ハイエンドサーバーでの利用に限られており、スマートフォンやタブレットなどのエッジデバイスでの有効活用が困難でした。さらに、動画分析や音声テキスト変換などのリアルタイム処理には依然として技術的な障壁があり、リソースの限られたハードウェア環境下でシームレスな動作を実現するための、効率的で柔軟なAIモデルの必要性を浮き彫りにしています。
【AI日報】へようこそ!AIの世界を探求するあなたのための毎日ガイドです。毎日、AI分野のホットな話題をお届けし、開発者に焦点を当て、技術トレンドの把握、革新的なAI製品の応用を支援します。最新のAI製品はこちらをご覧ください:https://top.aibase.com/1、昆侖万維天工大模型4.0o1版と4o版が正式上线2025年1月6日、昆侖万維集団は最新の「天工大模型4.0」o1版と4o版を発表し、人間…
【AIデイリーニュース】へようこそ!ここでは、毎日AIの世界を探求するためのガイドとして、AI分野のホットなトピックを毎日お届けします。開発者に焦点を当て、技術トレンドの理解と革新的なAI製品の応用を支援します。最新のAI製品はこちらをご覧ください:https://top.aibase.com/1、OpenAIがSoraを正式リリース。ChatGPT Proユーザーは最長20秒の動画を無制限に生成可能に