アリババクラウド魔搭、階躍星辰の最新オープンソースの2つのマルチモーダルモデルを初公開

AIbase基地

公開日AIニュース · 1 分で読めます · Feb 21, 2025

178

世界の開発者の視線が再び中国に注がれています！注目を集めるグローバル・デベロッパー・カンファレンス（GDC）において、アリババクラウド魔搭コミュニティは、階躍星辰の最新オープンソースの2つのマルチモーダルモデルを初公開すると発表しました。これには、世界最大規模のパラメータを持つオープンソースのビデオ生成モデルStep-Video-T2Vと、業界初の製品レベルのオープンソース音声対話モデルStep-Audioが含まれます。このニュースは瞬く間に世界のAIオープンソースコミュニティを席巻し、中国の人工知能分野における強力なイノベーション能力を改めて示しました。中国最大のAI...

阿里云魔搭 Step-Video-T2V Step-Audio マルチモーダルモデル

この記事はAIbaseデイリーからのものです

【AIデイリー】へようこそ！ここは、毎日人工知能の世界を探求するためのガイドです。毎日、開発者に焦点を当て、技術トレンドを洞察し、革新的なAI製品アプリケーションを理解するのに役立つ、AI分野のホットなコンテンツをお届けします。

—— AIbase デイリーグループによって作成

バイトダンス、超長ビデオ理解と編集の新潮流をリードするマルチモーダルモデル「Vidi」を発表

Apr 23, 2025

AIデイリーニュース：バイトダンスがDoubao 1.5深度思考モデルを発表；微信初のAIアシスタント「元宝」が登場；OpenAIがo4-miniとフルスペック版o3を発表

【AIデイリーニュース】へようこそ！ここでは、人工知能の世界を探求するための毎日のガイドとして、AI分野のホットなトピックを毎日お届けします。開発者に焦点を当て、技術トレンドの洞察と革新的なAI製品アプリケーションの理解を支援します。最新のAI製品はこちらでご確認ください:https://top.aibase.com/1、OpenAIが2つのマルチモーダル推論モデルo4-miniとフルスペック版o3を発表OpenAIは技術ライブストリームで、最新のマルチモーダルモデルであるo4-miniとフルスペック版o3を発表しました。

Apr 17, 2025

330

バイトダンス、Liquidマルチモーダルモデルをオープンソース化　ビジョンと言語の統一生成に革命

人工知能分野に大きなブレイクスルーが訪れました。AIbaseはソーシャルメディアから、バイトダンスが最近、新しいマルチモーダル生成モデルであるLiquidのオープンソース化を発表したことを知りました。このモデルは、革新的な統一エンコーディング方式と単一の大規模言語モデル（LLM）アーキテクチャにより、ビジョン理解と生成タスクのシームレスな統合を実現しています。この発表は、バイトダンスのマルチモーダルAIにおける技術的な野心を示すだけでなく、世界中の開発者にとって強力なオープンソースツールを提供します。以下は、AIbaseによるLiquidモデルの詳細な分析であり、その技術革新とコアについて探ります。

Apr 16, 2025

Google AI Studioの大幅アップデート：最新のGemini-2.0-flash-live-001が正式リリース

Apr 10, 2025

160

アリババ、新たなマルチモーダルモデルQwen2.5-VL-32Bを発表：視覚言語と数学的推論を両立

人工知能分野において、アリババは再び大きなニュースをもたらしました。先日、アリババは最新のマルチモーダルモデルであるQwen2.5-VL-32B-Instructをオープンソース化しました。この新しいモデルはQwen2.5シリーズの一つであり、他のバージョンには3B、7B、72Bなどがあります。32Bバージョンは、性能を維持しながら、より手軽なローカル実行環境に重点を置いています。Qwen2.5-VL-32Bは強化学習によって最適化されており、複数の面で優れた性能を発揮します。まず、その回答はより人間に沿ったものとなっています。

Mar 25, 2025

180

AI日報：衝撃！アリババの新しい夸克がAIスーパーボックスにアップグレード；GoogleがマルチモーダルモデルGemma-3をオープンソース化；潞晨科技がビデオ大規模モデルOpen-Sora 2.0をオープンソース化

【AI日報】へようこそ！ここでは、人工知能の世界を探求するための毎日のガイドとして、AI分野のホットなトピックを毎日お届けし、開発者に焦点を当て、技術トレンドを理解し、革新的なAI製品のアプリケーションを学ぶお手伝いをします。最新のAI製品の詳細はこちら：https://top.aibase.com/1、アリババがAIフラッグシップアプリケーション「新しい夸克」を「AIスーパーボックス」に全面アップグレードアリババは3月13日、新しくアップグレードされたAIフラッグシップアプリケーション「新しい夸克」を発表しました。2025年までに、智譜…

Mar 13, 2025

100

アリババ通義チームがR1-Omniをオープンソース化：マルチモーダルモデルによる音声ビデオ情報の可視化を実現

Mar 12, 2025

120

ファーウェイ昇騰と階躍星辰、オープンソースのマルチモーダルモデルを発表 AI新分野に進出

先日、魔楽コミュニティ（Modelers）で、階躍星辰が開発したオープンソースのマルチモーダル大規模モデルであるStep-VideoとStep-Audioが正式に公開されました。これらのモデルは、それぞれ動画生成と音声対話に使用され、開発者と企業ユーザーにより強力なAIツールを提供することを目指しています。Step-Videoモデルの正式名称はStep-Video-T2Vで、300億パラメーターという世界最大のオープンソース動画生成モデルです。このモデルは、20秒の動画を直接生成できます。

Mar 10, 2025

華中科技大学とバイトダンスがLiquidを発表：マルチモーダルモデルの生成と理解を再定義

Mar 4, 2025

最高効果！階躍星辰オープンソースStep-Video-T2V動画生成モデル

本日、階躍星辰と吉利汽車集団は、階躍Stepシリーズのマルチモーダル大規模モデル2つ——Step-Video-T2V動画生成モデルとStep-Audio音声モデル——を共同でオープンソース化すると発表しました。その中で、階躍Step-Video-T2V動画生成モデルは、パラメータ数と性能において世界をリードするレベルにあります。このモデルは300億個のパラメータを持ち、204フレーム、540Pの高解像度動画を直接生成でき、生成されたコンテンツの情報密度が高く、一貫性が高いことを保証します。評価結果によると、

Feb 18, 2025

3.6k

AIニュース

AIデイリー

AIタイムライン

Alハードウェアです

最新事例

画像コレクション

ビデオコレクション

オーディオコレクション

コンテンツコレクション

最新チュートリアル

AIプロダクトランキング

AIトラフィック成長ランキング

AIトラフィック減少ランキング

AI週間ランキング

アメリカ合衆国

中国

インド

ブラジル

画像生成

パーソナルアシスタント

キャラクター生成

ビデオ生成

AIプロジェクトランキング

AIプロジェクト成長ランキング

AI開発者ランキング

AI組織ランキング

Deepseek

TTS

LLM

ChatGPT

概要