今日,科大讯飞宣布,2024科大讯飞全球1024开发者节将于10月24日开幕。在本届大会上,科大讯飞将宣布其讯飞星火大模型在数学、代码和长文本处理能力上实现显著提升,同时在中英文综合能力上继续保持领先。同时,科大讯飞将首次公开展示多模态视觉交互技术以及超拟人虚拟人交互能力,这些创新技术旨在打造更加智能化和人性化的人机交互体验,推动万物智联的进程。在行业应用方面,科大讯飞对教育、医疗、科研、司法、政务等行业的大模型进行了升级,并推出了更多满足行业需
Soul App在AI+社交领域取得重大突破,通过升级其自研端到端全双工语音通话大模型,实现了与虚拟人之间自然流畅的语音通话体验,几乎达到了与真人对话的逼真度。该模型具有超低交互延迟、快速自动打断、超真实声音表达和情绪感知理解能力,使得用户在使用时几乎无法区分对话对象是真人还是AI。这一创新不仅显著提升了用户在Soul上的社交体验,还展示了Soul在AI技术应用上的实力。自2020年起,Soul就致力于AIGC技术研发,通过集成多种AI能力,如语音生成、识别和对话模型,以及音乐生成模型,为用户提供丰富多样的交互体验,包括情感陪伴、实时语音互动等。未来,Soul计划进一步发展多模态端到端大模型能力,以提供更加沉浸和有趣的AI互动体验。
Butterflies AI发布“克隆”功能,用户只需上传一张自拍照,AI就能生成一个拥有独特背景故事和个性的数字化分身。此功能旨在让用户以有趣方式探索不同生活可能性,生成的AI角色可以模拟用户在特定情境中的经历,如旅行等。创始人Vu Tran,前Snap工程师,希望通过提供更有趣的AI产品,而非仅限于聊天机器人。应用已成功融资480万美元,支持iOS和Android用户免费下载使用。
字节跳动与上海科技大学的研究团队开发了一项名为“HeadGAP”的创新技术,仅通过三张不同视角的照片,即可快速生成高仿真、可动画化的3D虚拟人头部形象,并实现面部表情同步。研究过程中,团队首先从大型多视角动态数据集中提取3D头部先验信息,用于个性化定制生成目标人物的虚拟头像。采用基于高斯点云的自解码网络和部分动态建模,结合反演和微调策略,高效实现高质量、多视角一致性头像的个性化制作。该成果在虚拟社交、游戏开发等领域有广泛应用前景,实验显示生成的3D头像在渲染质量和动画效果上表现出色。