Stability AIとArmが協力し、オフライン音声生成技術を発表

AIbase基地

公開日AIニュース · 1 分で読めます · Mar 4, 2025

Stability AIは、Stable Diffusionによるテキストから画像生成モデルで知られています。最近、同社は世界的な半導体大手Armと提携し、モバイルデバイスへの生成AIオーディオ機能の導入に取り組んでいます。この協力により、Stable Audio OpenモデルはArm CPU上で完全に動作し、ユーザーはインターネット接続なしで、デバイス上で迅速にサウンドエフェクト、オーディオサンプル、制作要素を生成できます。

Stability AIは、生成AIが企業やプロのクリエイターの間でますます広く利用されるようになっているため、当社のモデルとワークフローが様々なクリエイティブ分野で簡単に利用できることを確保することが非常に重要だと述べています。これは、創作効率の向上だけでなく、これらの技術を視覚メディア制作プロセスにシームレスに統合する上でも役立ちます。

増加する需要に対応するため、同社はエッジデバイスでのモデルの動作効率の向上を目指しています。モバイルデバイス向けにStable Audio Openモデルを最適化する過程で、初期テストではArm CPUデバイスでオーディオ生成に240秒かかりました。モデル蒸留とArmのソフトウェアスタック、特にXNNPackのKleidiAIにおけるint8行列乗算カーネルを活用することで、11秒のオーディオクリップ生成時間を8秒に短縮し、30倍の高速化を実現しました。

なお、この機能を利用するには、対応するモバイルデバイスが必要です。現在、ほとんどのスマートフォンがArmアーキテクチャのCPUを搭載しているため、この技術は幅広いユーザーにとって利用しやすくなっています。今後、Stability AIは、画像、ビデオ、3D分野のすべてのモデルをエッジデバイスにもたらす計画であり、モバイルデバイスでの視覚メディア制作方法を根本的に変革することを目指しています。

要点:
🌟 Stability AIとArmの協力により、モバイルデバイスでオフラインでオーディオを生成できる技術が登場しました。
⚡ モデル蒸留とソフトウェア最適化により、オーディオ生成時間は240秒から8秒に短縮され、効率は30倍向上しました。
📱 この技術は、Arm CPUを搭載したほとんどのスマートフォンで使用でき、将来的にはより多くのメディア制作分野に拡大される予定です。

Stable Diffusion Stable Audio Open Arm CPU 生成系人工知能

この記事はAIbaseデイリーからのものです

【AIデイリー】へようこそ！ここは、毎日人工知能の世界を探求するためのガイドです。毎日、開発者に焦点を当て、技術トレンドを洞察し、革新的なAI製品アプリケーションを理解するのに役立つ、AI分野のホットなコンテンツをお届けします。

—— AIbase デイリーグループによって作成

AI日報：バイツがSeed Prover1.5をリリース；MiniMax M2.1をオープンソース化；通義が音声対話大規模モデルFun-Audio-Chat-8Bをオープンソース化

【AI日報】へようこそ！ここは毎日AIの世界を探索するためのガイドです。毎日、AI分野の注目ニュースをお届けし、開発者に焦点を当てて技術トレンドや革新的なAI製品の応用を理解するお手伝いをします。新鮮なAI製品については以下をクリックしてください：https://app.aibase.com/zh1、ビットテクノロジーがSeedProver1.5をリリース：形式的数学推論の新たな進展。ビットテクノロジーのSeedチームが開発したSeedProver1.5は、形式的数学推論を推進しています。

Dec 24, 2025

マッキンゼーの重要なレポート：90％の企業がAIを使用しているが、実際にお金を稼いでいるのは6％のみ

生成AI普及から3年、市場の熱狂と企業利益に乖離。マッキンゼー調査では、88%の企業がAIを常用するも、大半は表層的な活用に留まり、約3分の2が本格導入せず、収益化に課題。....

Dec 24, 2025

アリババ・ローンズがオープンソースで大規模な爆弾を投下！感情を読み取れる音声AIが登場。GPT-4oも戦慄するか？

阿里巴巴がオープンソースの音声大規模モデル「Fun-Audio-Chat-8B」を公開。超低遅延と自然な対話を特徴とし、GPT-4o Audioなどのクローズドモデルに匹敵する性能を持つ。リアルタイム理解と感情認識能力を備え、真のAI音声パートナーを目指す。....

Dec 24, 2025

GoogleとOpenAIの画像生成ツールが悪用される　ワンクリックで女性の不快なディープフェイク写真を生成可能

最近、Google GeminiやOpenAIのChatGPTなどの生成AIツールが悪意のある方法で利用されていることが明らかにされた。ユーザーは特定のヒントワードを使ってセキュリティチェックを回避し、通常の写真にある女性を露出したディープフェイク画像に変更していた。関連するチュートリアルはRedditなどのプラットフォームで広まり、AIのセキュリティの境界に対する懸念を引き起こした。

Dec 24, 2025

上海市に新規9製品の登録済み生成型AIサービスが追加

上海市ネットワーク情報弁公室は生成型AIの創新と規範を推進し、関連する管理規定に基づき、順序立ててサービス登録を行っています。APIなどの方法で登録済みモデルを呼び出し、世論の属性や社会的動員能力を持つサービスを提供する場合も、関係部門は登録を行います。現在、上海市には新たに9つの登録済みの生成型AIサービスが追加されています。

Dec 24, 2025

MiniMaxと華中科技大学がVTP技術をオープンソース化！視覚トークン化の最適化によりDiTの生成性能が65.8％向上

MiniMaxと華中科技大学がVTP技術を共同でオープンソース化し、視覚トークン化の最適化により画像生成性能が65.8％向上しました。メインモデル構造を変更することなく、業界が大規模モデルに依存する伝統的なアプローチを突破しました。

Dec 24, 2025

Seedance 1.5 proが火山方舟で正式リリース　AI動画生成技術の革新

豆包の動画生成モデルであるSeedance1.5Proが火山方舟で正式リリースされ、AI動画クリエイションの効率と品質が向上しました。このモデルは音声と映像を同期して出力でき、多言語や多人称の会話の字幕にも対応しており、突出した映画級の物語の展開が可能です。企業ユーザーは火山方舟を通じてAPIサービスを取得できますし、個人ユーザーも利用可能です。

Dec 24, 2025

アリババ・スターフィッシュ大モデルが初めて国家セキュリティ標準認証を取得、AIセキュリティが新たな段階に進む！

科大讯飛のスパーク大規模モデルプラットフォームが国家セキュリティ基準の試験検証を通過し、初の『人工知能セキュリティ国家基準適合性自己評価証明書』を取得。認証は中国初の生成AI専門セキュリティ技術基準GB/T45654-2025に基づき、訓練データセキュリティなどを含む。....

Dec 24, 2025

上海に追加された12種類の登録済み生成型AIサービス

上海市ネットセキュリティ弁公室は、追加された12種類の生成型AIサービスの登録を発表しました。全市の登録総数はすでに一定の規模に達しており、AIのイノベーションと規範的な発展を促進し、上海がAIのハイポジションとなることを支援するためです。

Dec 23, 2025

生数科技と清华大学が共同で TurboDiffusion を発表、動画生成を高速化するフレームワーク

生数科技と清華大学TSAIL実験室が共同でオープンソースのTurboDiffusion動画生成高速化フレームワークを開発し、最大200倍の推論高速化を実現しました。生成品質にほとんど影響を与えないことで、動画生成の重要なブロックとなる課題を突破しました。

Dec 23, 2025

AIニュース

AIニュース日報

AIツールを探す

AI製品ランキング

AIプロダクト登録

AIツールディレクトリ

AIモデルファインダー

LLMランキング

LLMプロバイダー

LLM比較選定

LLMコスト計算機

LLMアリーナ

MCPサーバー

MCPクライアント

MCPケースチュートリアル

MCPランキング

MCPサービス提出

MCP実験場

MCPインスペクター

AIブランドモニタリング

GEOランキング照会ツール

GEO順位最適化サービス

AIモデル互換性チェッカー

モデル展開サーバー構成計算機

Stability AIとArmが協力し、オフライン音声生成技術を発表

AIbase基地

この記事はAIbaseデイリーからのものです

関連AIニュースの推奨

AI日報：バイツがSeed Prover1.5をリリース；MiniMax M2.1をオープンソース化；通義が音声対話大規模モデルFun-Audio-Chat-8Bをオープンソース化

マッキンゼーの重要なレポート：90％の企業がAIを使用しているが、実際にお金を稼いでいるのは6％のみ

アリババ・ローンズがオープンソースで大規模な爆弾を投下！感情を読み取れる音声AIが登場。GPT-4oも戦慄するか？

GoogleとOpenAIの画像生成ツールが悪用される ワンクリックで女性の不快なディープフェイク写真を生成可能

上海市に新規9製品の登録済み生成型AIサービスが追加

MiniMaxと華中科技大学がVTP技術をオープンソース化！視覚トークン化の最適化によりDiTの生成性能が65.8％向上

Seedance 1.5 proが火山方舟で正式リリース AI動画生成技術の革新

アリババ・スターフィッシュ大モデルが初めて国家セキュリティ標準認証を取得、AIセキュリティが新たな段階に進む！

上海に追加された12種類の登録済み生成型AIサービス

生数科技と清华大学が共同で TurboDiffusion を発表、動画生成を高速化するフレームワーク

関連AIニュースの推奨

AI日報：バイツがSeed Prover1.5をリリース；MiniMax M2.1をオープンソース化；通義が音声対話大規模モデルFun-Audio-Chat-8Bをオープンソース化

マッキンゼーの重要なレポート：90％の企業がAIを使用しているが、実際にお金を稼いでいるのは6％のみ

アリババ・ローンズがオープンソースで大規模な爆弾を投下！感情を読み取れる音声AIが登場。GPT-4oも戦慄するか？

GoogleとOpenAIの画像生成ツールが悪用される ワンクリックで女性の不快なディープフェイク写真を生成可能

上海市に新規9製品の登録済み生成型AIサービスが追加

MiniMaxと華中科技大学がVTP技術をオープンソース化！視覚トークン化の最適化によりDiTの生成性能が65.8％向上

Seedance 1.5 proが火山方舟で正式リリース AI動画生成技術の革新

アリババ・スターフィッシュ大モデルが初めて国家セキュリティ標準認証を取得、AIセキュリティが新たな段階に進む！

上海に追加された12種類の登録済み生成型AIサービス

生数科技と清华大学が共同で TurboDiffusion を発表、動画生成を高速化するフレームワーク

GoogleとOpenAIの画像生成ツールが悪用される　ワンクリックで女性の不快なディープフェイク写真を生成可能

Seedance 1.5 proが火山方舟で正式リリース　AI動画生成技術の革新

GoogleとOpenAIの画像生成ツールが悪用される　ワンクリックで女性の不快なディープフェイク写真を生成可能

Seedance 1.5 proが火山方舟で正式リリース　AI動画生成技術の革新