人工智能语音公司ElevenLabs再次引发关注,该公司刚刚完成了一轮高达2.5亿美元的C轮融资,估值在30亿至33亿美元之间。本次融资由ICONIQ Growth领投,显示出市场对AI语音技术的强烈信心。仅在一年之前,ElevenLabs刚刚完成了一笔8000万美元的B轮融资,当时的估值仅为现在的三分之一,可见该公司发展之迅猛。
人工智能语音公司ElevenLabs再次引发关注,该公司刚刚完成了一轮高达2.5亿美元的C轮融资,估值在30亿至33亿美元之间。本次融资由ICONIQ Growth领投,显示出市场对AI语音技术的强烈信心。仅在一年之前,ElevenLabs刚刚完成了一笔8000万美元的B轮融资,当时的估值仅为现在的三分之一,可见该公司发展之迅猛。
继2024年底海螺AI海外版上线AI语音克隆功能后,日前Hailuo AI又上线了新语音模型T2A-01-HD。T2A-01-HD新语音模型同样支持语音克隆,能生成情感丰富的语音。根据官方介绍,T2A-01-HD在原来的音频模型基础上,增强的音频质量,具有卓越的克隆精度不过T2A-01-HD目前尚未未开源,用户可以在网页上限时免费使用。进入Hailuo AI 音频页面后,可以看到右上角可以选择模型。想要体验新模型,只要选择“T2A-01-HD”即可使用。AIbase在体验之后,T2A-01-HD生成的音频质量会比原来的版本的确更高更清晰。感兴趣
在人工智能行业日益蓬勃发展的背景下,AI 语音技术公司思必驰于近日宣布成功完成了5亿元的融资。此次融资的参与方包括多家知名产业基金、国资平台及私募基金,这标志着思必驰在资本市场获得了更强大的支持。公司创立于2007年,作为中国较早专注于 AI 领域的企业之一,思必驰起初以 AI 语音技术为核心,如今已拓展到软硬一体化解决方案及 AI 硬件产品。未来,思必驰将持续加大对垂域大模型(DFM-2)与全链路对话技术的投入,目标是在汽车、物联网(IoT)、会议办公及金融等行业场景
ElevenLabs 于近日正式推出其最新的人声合成模型 Flash,声称这是迄今为止最快的文本转语音(TTS)解决方案,生成语音的延迟仅为75毫秒(加上应用和网络延迟)。Flash 特别适合低延迟的对话式语音助手,用户可以在 ElevenLabs 的对话 AI 平台上立即体验这一新功能。Flash 模型分为两个版本,其中 Flash v2仅支持英语,而 Flash v2.5则支持32种语言。使用这两种模型时,用户每生成两个字符将消耗1个积分点。尽管 Flash 模型在音质和情感深度上稍逊于 Turbo 模型,但其低延迟性能使其在盲测中超越了其他
最近,中文 AI 语音克隆技术迎来了一个突破性进展。海螺 AI 海外版推出的音频克隆模块,只需10到60秒的音频样本,便能完美复刻用户的声音。海螺 AI 海外版的音频克隆效果让许多用户感到惊喜,因为以往在中文语音克隆领域,虽然有不少产品,但效果往往不如人意。海螺 AI 的音频克隆功能非常简单易用,支持用户可以创建多个声音模型,用户只要进入“voice”模块,选择创建声音,并上传10秒至60秒长度的音频素材,就能对声音进行克隆。另外,系统支持12种语言,包括中文、粤语、英语