Cartesia、音声変換の新モデルを発表：話者のニュアンスを保持

AIbase基地

公開日AIニュース · 1 分で読めます · Oct 31, 2024

233

AI企業Cartesiaは最近、「Voice Changer」という音声変換モデルをリリースしました。従来の音声変換とは異なり、このモデルは入力された音声を目標の音声に変換するだけでなく、元の音声のイントネーションやアクセントなどの表現特徴を維持することができます。

Cartesia公式によると、この機能はplay.cartesia.aiで試用できます。現在、同社は関連するAPIドキュメントを公開しており、開発者はdocs.cartesia.aiで詳細を確認できます。

記者は、音声の特徴を維持するこのような変換技術は市場ではあまり一般的ではないことに気づきました。既存のツールのほとんどは、音声を変換する際に話者の声の調子を失ってしまうため、変換後の音声が機械的に聞こえてしまう傾向があります。

Cartesiaは、自社のブログでこの技術の具体的な実装方法について詳しく説明しています。しかし、無断で他人の声を模倣するなど、この技術が引き起こす可能性のある倫理的な問題については、同社はまだ回答していません。

人工知能 VoiceChanger 音声変換モデル Cartesia

この記事はAIbaseデイリーからのものです

【AIデイリー】へようこそ！ここは、毎日人工知能の世界を探求するためのガイドです。毎日、開発者に焦点を当て、技術トレンドを洞察し、革新的なAI製品アプリケーションを理解するのに役立つ、AI分野のホットなコンテンツをお届けします。

—— AIbase デイリーグループによって作成

アマゾンSageMakerにMistralAIのVoxtralモデルがデプロイされました

MistralAIはVoxtralシリーズモデルを発表しました。このシリーズはテキストと音声処理機能を統合しています。このシリーズにはVoxtral-Mini-3B-2507およびVoxtral-Small-24B-2507の2種類があります。前者は3億パラメータのモデルで、高速な音声変換および基本的なマルチモーダル理解に適しています。後者は240億パラメータを持ち、複雑な音声テキストの知能および多言語処理をサポートし、エンタープライズレベルのアプリケーションに適しています。この2つのモデルはともに30〜40分間の音声コンテキスト処理をサポートしています。

Dec 23, 2025

Quest Mobile、AIアプリの週間アクティブユーザーランキングを発表：バイタ系が3つ、アントグループが2つランクイン

Quest Mobileの報告によると、2025年後半のAIアプリエコシステムにおいて、ドウバオ、DeepSeek、ヤオビン、アントアフーが週間アクティブユーザー上位4位にランクインし、アリババ・千問は第5位、アントリングウェイは上位10位に入った。トップ10リストでは汎用AIが6枠を占め、特化型AIが4枠を占め、汎用と専門的なシナリオが両方で進展している構図となっている。

Dec 23, 2025

Perplexityが2025年のレビュー用ツールをリリース。ユーザーが簡単に個人の年間活動をまとめられる

PerplexityとOpenAIがそれぞれ2025年の振り返り機能を提供。Perplexityは簡素な要約、OpenAIは個別化された年次レビューを実現。....

Dec 23, 2025

ビットテックが230億ドルを投じてAIインフラに進出する予定であると сообщ

バイトダンスは2026年までに約1600億元をAIインフラ建設に投入し、うち約850億元は先進AIプロセッサの調達に充て、米国テック大手との差を縮める計画。....

Dec 23, 2025

評価額が66億ドルに急騰: AIプログラミングの黒馬Lovable、Bラウンド資金調達を完了。GoogleとNVIDIAが共同で参画

スウェーデンのAIスタートアップ企業Lovableは3.3億ドルのBラウンド資金調達を完了し、評価額は66億ドルに達しました。これは7月と比べて3倍以上も増加しています。今回の資金調達はCapitalGとMenlo Venturesが主導し、NVIDIA、Salesforce Venturesおよびドイツテレコムが追従しました。同社の核心技術はテキストプロンプト生成AIです。

Dec 23, 2025

タイムリミットに迫るソフトバンク、225億ドルの資金を急ぐ OpenAI

ソフトバンクはオープンエイの約束を果たすために、225億ドルの資金を緊急に集めている。これはアームの株式関連ローンを動員する可能性がある。オープンエイの主要な支援者であるソフトバンクは、「5000億ドルの宇宙网」データセンター計画に参加している。

Dec 23, 2025

ユニボット子会社のユーチーがボルケーノエンジンと提携、ドウバオ大モデルが身体を持つ知能の新市場を支援

優奇と火山引擎が提携し、ロボット本体とクラウドAI技術を統合。大規模モデルの産業物流分野への応用を加速。多モーダル大規模モデル、VLAモデル、世界モデル、豆包エコシステムを中心に技術の大規模導入を推進。....

Dec 23, 2025

国家知識産権局が18項目の人工知能＋シナリオを導入

中国国家知識財産局が初の18件の「AI+知的財産」公共サービス応用シナリオを発表。12省をカバーし、知的財産サービスの知能化転換が実質的に始動。各地で特色ある実践が展開され、北京は海外権利保護と未来産業革新に、上海は大規模モデルを基盤とした特許動態分析を推進。....

Dec 23, 2025

米国戦争省がxAIと提携：Grokモデルが軍事級AIプラットフォームGenAI.milに導入

米国防総省がマスク氏のxAIと提携し、Grok AIを軍用プラットフォームGenAI.milに統合。300万人の軍人・文官の事務効率化と戦闘能力向上を支援。....

Dec 23, 2025

アルファベットが47.5億ドルを投じてIntersectを買収、AI演算力のグリーンエネルギーエンジンを強化

AlphabetはAI電力需要に対応するため、クリーンエネルギー開発会社Intersectを47.5億ドルで買収。AI競争における安定エネルギー供給の重要性を示す。....

Dec 23, 2025

AIニュース

AIニュース日報

AIツールを探す

AI製品ランキング

AIプロダクト登録

AIツールディレクトリ

AIモデルファインダー

LLMランキング

LLMプロバイダー

LLM比較選定

LLMコスト計算機

LLMアリーナ

MCPサーバー

MCPクライアント

MCPケースチュートリアル

MCPランキング

MCPサービス提出

MCP実験場

MCPインスペクター

AIブランドモニタリング

GEOランキング照会ツール

GEO順位最適化サービス

AIモデル互換性チェッカー

モデル展開サーバー構成計算機

Cartesia、音声変換の新モデルを発表：話者のニュアンスを保持

AIbase基地

この記事はAIbaseデイリーからのものです

関連AIニュースの推奨

​アマゾンSageMakerにMistralAIのVoxtralモデルがデプロイされました

Quest Mobile、AIアプリの週間アクティブユーザーランキングを発表：バイタ系が3つ、アントグループが2つランクイン

Perplexityが2025年のレビュー用ツールをリリース。ユーザーが簡単に個人の年間活動をまとめられる

ビットテックが230億ドルを投じてAIインフラに進出する予定であると сообщ

評価額が66億ドルに急騰: AIプログラミングの黒馬Lovable、Bラウンド資金調達を完了。GoogleとNVIDIAが共同で参画

タイムリミットに迫る ソフトバンク、225億ドルの資金を急ぐ OpenAI

ユニボット子会社のユーチーがボルケーノエンジンと提携、ドウバオ大モデルが身体を持つ知能の新市場を支援

国家知識産権局が18項目の人工知能＋シナリオを導入

米国戦争省がxAIと提携：Grokモデルが軍事級AIプラットフォームGenAI.milに導入

アルファベットが47.5億ドルを投じてIntersectを買収、AI演算力のグリーンエネルギーエンジンを強化

関連AIニュースの推奨

​アマゾンSageMakerにMistralAIのVoxtralモデルがデプロイされました

Quest Mobile、AIアプリの週間アクティブユーザーランキングを発表：バイタ系が3つ、アントグループが2つランクイン

Perplexityが2025年のレビュー用ツールをリリース。ユーザーが簡単に個人の年間活動をまとめられる

ビットテックが230億ドルを投じてAIインフラに進出する予定であると сообщ

評価額が66億ドルに急騰: AIプログラミングの黒馬Lovable、Bラウンド資金調達を完了。GoogleとNVIDIAが共同で参画

タイムリミットに迫る ソフトバンク、225億ドルの資金を急ぐ OpenAI

ユニボット子会社のユーチーがボルケーノエンジンと提携、ドウバオ大モデルが身体を持つ知能の新市場を支援

国家知識産権局が18項目の人工知能＋シナリオを導入

米国戦争省がxAIと提携：Grokモデルが軍事級AIプラットフォームGenAI.milに導入

アルファベットが47.5億ドルを投じてIntersectを買収、AI演算力のグリーンエネルギーエンジンを強化

アマゾンSageMakerにMistralAIのVoxtralモデルがデプロイされました

タイムリミットに迫るソフトバンク、225億ドルの資金を急ぐ OpenAI

アマゾンSageMakerにMistralAIのVoxtralモデルがデプロイされました

タイムリミットに迫るソフトバンク、225億ドルの資金を急ぐ OpenAI