大模型公司正在加大对“长文本”处理能力的研发,但真正的挑战在于如何克服Transformer结构的限制。这一趋势将为金融、司法、科研等领域带来更深层次的应用。
大模型公司关注“长文本”:上下文长度的真正挑战在Transformer结构
光锥智能
30
© 版权所有 AIbase基地 2024, 点击查看来源出处 - https://www.aibase.com/zh/news/2042
大模型公司正在加大对“长文本”处理能力的研发,但真正的挑战在于如何克服Transformer结构的限制。这一趋势将为金融、司法、科研等领域带来更深层次的应用。
在2024年12月19日的发布会上,智源研究院与腾讯宣布推出LongBench v2,这是一个专为评估大语言模型(LLMs)在真实世界长文本多任务中的深度理解与推理能力而设计的基准测试。该平台旨在推动长文本模型在理解和推理方面的进步,回应了当前长文本大语言模型在应用中的挑战。
阿里云百炼平台近日宣布上线了Qwen2.5-Turbo百万长文本模型,Qwen2.5-Turbo模型由通义千问团队开发,支持处理高达100万tokens的超长上下文,相当于100万个英文单词或150万个汉字。
根据天眼查App显示的信息,近日,智谱AI关联公司北京智谱华章科技有限公司发生了工商变更,新增了北京市人工智能产业投资基金(有限合伙)、深圳市招商数科创新私募股权投资基金合伙企业(有限合伙)、湖北长江中信科移动通信技术产业投资基金合伙企业(有限合伙)等作为股东,注册资本也有所增加,从约2791万人民币增至约3107万人民币。据悉,北京智谱华章科技有限公司成立于2019年6月,法定代表人为刘德兵,其经营范围包括人工智能基础软件开发、人工智能应用软件开发、软件开发
近日,AI助手心流正式发布2.0版本,新增的「首页精选内容」和「发现」版块为用户提供了更加智能化、个性化的高质量内容服务。这些功能的推出彰显了人工智能平台在生活与工作中的实用价值,尤其是在解决用户困惑与需求方面的强大能力。随着大模型技术的不断成熟,心流通过AI原生内容(AINative)为用户提供了更加丰富多样的图文和问答形式的信息。新版本的「首页精选内容」涵盖了效率工具、饮食休闲、旅游兴趣、运动保健及家居健康等多个领域,旨在通过智能推荐算法,使得用