AI巨头Yann LeCun在参议院为开源大模型Llama辩护,强调开源的重要性,将人工智能视为基础设施,并支持合作制定标准和治理模式。开源模型有助于民主化访问最先进的技术,减少社会差距。合作制定人工智能标准和治理模式是迫切需要的。Yann LeCun支持相关立法,愿意与公司内相关人员合作
AI巨头Yann LeCun在参议院为开源大模型Llama辩护,强调开源的重要性,将人工智能视为基础设施,并支持合作制定标准和治理模式。开源模型有助于民主化访问最先进的技术,减少社会差距。合作制定人工智能标准和治理模式是迫切需要的。Yann LeCun支持相关立法,愿意与公司内相关人员合作
Meta 公司于近日宣布成立一个新的商业 AI 部门,由技术资深人士 Clara Shih 担任负责人。这个新部门旨在将 Meta 的人工智能技术推广到各类企业,帮助它们提升运营效率和业务能力。Meta 已经通过其社交平台与企业建立了广泛的联系,每月有2亿家企业通过 Facebook、Instagram 和 WhatsApp 进行业务沟通。Meta 的开放源码 Llama 语言模型已经获得超过6亿次下载,而其 Meta AI 助手每月活跃用户超过5亿。此次成立的商业 AI 部门是 Meta 首次大规模地将其 AI 技术和专业知识转向专门的商业服务领域。虽然 Meta
最近,AI 大型语言模型(LLM)在各种任务中表现出色,写诗、写代码、聊天都不在话下,简直是无所不能!但是,你敢相信吗?这些“天才”AI 居然是“数学菜鸟”!它们在处理简单的算术题时经常翻车,让人大跌眼镜。一项最新的研究揭开了 LLM 算术推理能力背后的“奇葩”秘诀:它们既不依赖强大的算法,也不完全依靠记忆,而是采用了一种被称为“启发式大杂烩”的策略! 这就好比一个学生,没有认真学习数学公式和定理,而是靠着一些“小聪明”和“经验法则”来蒙答案。研究人员以算
近日,北京大学等科研团队宣布发布了一款名为 LLaVA-o1的多模态开源模型,据称这是首个能够进行自发、系统推理的视觉语言模型,堪比 GPT-o1。该模型在六个具有挑战性的多模态基准测试中表现优异,其11B 参数的版本超越了其他竞争者,如 Gemini-1.5-pro、GPT-4o-mini 和 Llama-3.2-90B-Vision-Instruct。LLaVA-o1基于 Llama-3.2-Vision 模型,采用了 “慢思考” 推理机制,能够自主进行更加复杂的推理过程,超越了传统的思维链提示方法。在多模态推理基准测试中,LLaVA-o1的表现超出了其基础模型8.9%。该模型的
昆仑万维科技股份有限公司宣布,其最新研发的天工大模型4.0O1版(英文名:Skywork O1)将于2024年11月27日启动邀请测试。天工大模型4.0O1版是国内首款具有中文逻辑推理能力的o1模型,它不仅在模型输出上内生了思考、计划、反思等能力,而且在标准评测集上,其推理能力相较于基座模型有了大幅上升,实现了模型推理能力的本质提升。