在今日的2024火山引擎 AI 创新巡展上,除了视频生成模型,字节跳动还发布了豆包·音乐模型和豆包·同声传译模型,并宣布对豆包通用模型pro、文生图模型、语音合成模型等垂类模型进行了大幅升级。

微信截图_20240924154634.png

豆包·音乐模型的推出,标志着火山引擎在音乐创作领域的深度布局。该模型通过强大的算法支持,实现了高品质的音乐创作自由。歌词生成方面,仅需简单几个字的输入,即可快速生成情感表达精准、意境深远的歌词内容。旋律创作上,豆包·音乐模型提供了超过10种不同的音乐风格和情绪表达选项,满足了创作者多样化的需求。

同时,借助豆包强大的语音合成技术,演唱效果逼真,几可乱真,为用户带来沉浸式的听觉享受。此外,该模型还降低了音乐创作的门槛,支持图片成曲、灵感成曲、写词成曲等多种创作方式,让更多人能够轻松参与到音乐创作中来。

微信截图_20240924153132.png

另一方面,豆包·同声传译模型的发布,则为跨语言沟通带来了革命性的变化。该模型实现了实时翻译的超低延时,用户在说话的同时即可看到翻译结果,极大地提升了沟通效率。翻译质量方面,豆包·同声传译模型以流畅自然、准确率高的表现,在办公、法律、教育等多个场景中接近甚至超越了人类同传水平。尤为值得一提的是,该模型还支持音色克隆功能,能够实现跨语言同音色翻译,以更加生动、逼真的声音表现力打破沟通壁垒,让跨语言交流变得更加顺畅无阻。

体验地址:https://www.volcengine.com/product/doubao