AI企業Cartesiaは最近、「Voice Changer」という音声変換モデルをリリースしました。従来の音声変換とは異なり、このモデルは入力された音声を目標の音声に変換するだけでなく、元の音声のイントネーションやアクセントなどの表現特徴を維持することができます。
Cartesia公式によると、この機能はplay.cartesia.aiで試用できます。現在、同社は関連するAPIドキュメントを公開しており、開発者はdocs.cartesia.aiで詳細を確認できます。
記者は、音声の特徴を維持するこのような変換技術は市場ではあまり一般的ではないことに気づきました。既存のツールのほとんどは、音声を変換する際に話者の声の調子を失ってしまうため、変換後の音声が機械的に聞こえてしまう傾向があります。
Cartesiaは、自社のブログでこの技術の具体的な実装方法について詳しく説明しています。しかし、無断で他人の声を模倣するなど、この技術が引き起こす可能性のある倫理的な問題については、同社はまだ回答していません。