本日開催された2024火山引擎AIイノベーション巡回展において、バイトダンス社は動画生成モデルに加え、Doubao・音楽モデルとDoubao・同時通訳モデルを発表し、Doubao汎用モデルPro、テキストから画像生成モデル、音声合成モデルなど、専門分野のモデルの大幅なアップグレードを発表しました。

微信截图_20240924154634.png

Doubao・音楽モデルの発表は、火山引擎が音楽創作分野における深い展開を示すものです。このモデルは強力なアルゴリズムによって支えられ、高品質な音楽創作の自由を実現しています。歌詞生成においては、簡単な単語を入力するだけで、感情表現が正確で、奥深い意境を持つ歌詞を迅速に生成できます。メロディー創作においては、Doubao・音楽モデルは10種類以上の異なる音楽スタイルと感情表現オプションを提供し、クリエイターの多様なニーズに応えます。

同時に、Doubaoの強力な音声合成技術を活用することで、歌声はリアルで、まるで本物のように、ユーザーに没入感のある聴覚体験を提供します。さらに、このモデルは音楽創作のハードルを下げ、画像から作曲、インスピレーションから作曲、歌詞から作曲など、多様な創作方法をサポートし、より多くの人が音楽創作に簡単に参加できるようにします。

微信截图_20240924153132.png

一方、Doubao・同時通訳モデルの発表は、言語間のコミュニケーションに革命的な変化をもたらします。このモデルはリアルタイム翻訳の超低遅延を実現し、ユーザーは話している間にも翻訳結果を見ることができ、コミュニケーション効率を大幅に向上させます。翻訳品質においては、Doubao・同時通訳モデルは、スムーズで自然で、正確性の高いパフォーマンスで、オフィス、法律、教育など多くの場面において、人間の同時通訳レベルに匹敵、あるいはそれを上回る結果を示しています。特に注目すべきは、このモデルが音色クローン機能をサポートしており、言語を跨いでも同じ音色の翻訳を実現し、より生き生きとしたリアルな音声表現力でコミュニケーションの壁を取り払い、言語間の交流をよりスムーズにします。

体験アドレス:https://www.volcengine.com/product/doubao