今日,科大讯飞正式发布了其最新研发的星火同传语音大模型,标志着国内首个具备端到端语音同传能力的大模型正式面世。这一创新技术相较于讯飞此前的翻译技术,实现了全场景翻译效果的显著提升,并大幅缩短了端到端的响应时间。

星火同传语音大模型的发布,为用户带来了更加流畅、精准的同传体验。在讯飞演示中,搭载了星火同传语音大模型的讯飞翻译机在英译中语音同传方面几乎实现了无延迟,非常适合出国旅游、国际展会等场景使用。这一优化不仅显著提升了翻译字幕的呈现速度,还保证了中英互译的准确性。

微信截图_20250115110120.png

据了解,星火同传语音大模型支持译文长度反向调控,语音到文本的端到端翻译过程中,能够流式地进行意群切分、语境理解和信息重组。同时,流式语音合成技术还能够支持意群韵律衔接和自适应语速调节,进一步提升了翻译的自然度和流畅度。

在国际交流场景中,无论是日常对话、商务交流还是行业翻译等高难度同传翻译需求,星火同传语音大模型都展现出了卓越的性能。其内容完整度、信息准确度以及语言质量均处于行业领先水平,并超越了谷歌Gemini2.0和OpenAI GPT-4o等同传技术。最快可实现5秒以内的同传时延,达到了人类专家译员的水平。

科大讯飞的星火同传语音大模型的发布,不仅代表了国内AI翻译技术的重大突破,也预示着未来国际交流将更加便捷和高效。