zh
红薯智语
每月不到10元,就可以无限制地访问最好的AIbase。立即成为会员
首页
AI资讯
AI日报
变现指南
AI教程
AI工具导航
AI产品库
zh
红薯智语
搜索全球AI产品动态
搜索全球AI信息,发现AI新机遇
新闻资讯
产品应用
变现案例
AI教程
类型 :
新闻资讯
产品应用
变现案例
AI教程
2024-08-09 09:37:51
.
AIbase
.
10.9k
字节、上海交大联合推全新语音模型LSLM 可边听边说
上海交通大学与字节跳动合作开发的LSLM全双工语言模型,颠覆了传统AI助手交互模式,实现边说边听的实时交互。LSLM核心优势在于其同时处理语音输入与生成输出的能力,显著提升对话自然流畅性。通过结合流式自监督学习与基于token的解码器,该模型支持实时语音交互,甚至在嘈杂环境中表现优异。LSLM的中期融合策略在语音生成与实时交互间取得最佳平衡,展现强大噪声抵抗与指令敏感性。此技术突破不仅大幅提升了用户体验,还具有广泛的应用前景,预示着人机交互新时代的来临,AI助手将与人类对话更加自然、流畅,技术与人性的融合达到新高度。
2024-08-07 10:53:37
.
AIbase
.
10.9k
上海交大博士发现大bug!AI画家竟然画不出茶杯中的冰可乐!
AI画家在生成特定场景如“茶杯中的冰可乐”时遇到困难,揭示了文本图像不对齐问题。上海交通大学博士赵峻图及其团队发现,即使是最先进的AI模型也难以准确理解并实现文本描述的复杂概念,如透明玻璃杯与传统茶杯的差异。为解决这一问题,他们提出了Mixture of Concept Experts(MoCE)方法,利用大语言模型帮助AI理解隐藏概念,从而更精确地控制文本与图像之间的对齐。MoCE通过分阶段提供概念信息,显著提高了AI生成图像的准确性,减少了复杂概念对生成效果的影响,甚至在某些情况下超越了依赖大量数据标注的模型。研究还揭示了现有评价指标的局限性,强调了改进AI理解和再现人类创造力的必要性。未来工作将探索更复杂的不对齐场景,开发更高效的搜索算法,并持续优化数据集,以推动AI图像生成技术的发展。
2023-12-15 09:19:49
.
AIbase
.
4.2k
上海交通大学与百度发布白玉兰科学大模型 2.0 版
["上海交通大学携手百度共同发布白玉兰科学大模型 2.0 版。","该版本包括 “法律开源” 和 “化学合成 2.0”。","白玉兰科学大模型 — 法律开源在法律综合评估测试中超越其他开源中文通用大模型。","该合作推动了 AI for Science 领域的发展。","双方在 AI for Science 领域合作取得新进展,树立了合作典范。"]