最近,Meta 公司在人工智能训练方面的做法受到广泛关注。根据一项诉讼,这家公司被指控在未获得授权的情况下,下载了大量盗版电子书和文章,用于训练其人工智能模型。此次事件的核心是几封泄露的电子邮件,这些邮件为 Meta 的行为提供了进一步的证据。邮件中显示,Meta 承认下载了一个名为 LibGen 的争议性大型数据集,该数据集中包含了数千万本盗版书籍。根据原告提交的法庭文件,Meta 通过名为 Annas Archive 的网站,从多个影子图书馆下载了至少81.7TB 的数据,其中包括来自 Z-Library
Meta 最近宣布与联合国教科文组织(UNESCO)合作推出一项新的语言技术伙伴计划,旨在收集多种语言的语音录音和文字记录,以推动未来开放可用的人工智能(AI)发展。这项计划特别关注那些在数字环境中被忽视的少数民族语言。根据 Meta 的介绍,该计划希望吸引合作伙伴,提供超过10小时的语音录音及其转录内容、丰富的书面文本,以及翻译句子的集合。Meta 希望通过与合作伙伴的共同努力,将这些语言整合到其 AI 语音识别和翻译模型中,最终形成的成果将以开源形式发布。图源备注:图
市场调研机构 Omdia 发布了一份报告,指出中国生成式人工智能(GenAI)软件市场正迎来快速增长。报告显示,预计到2024年,中国的 GenAI 软件收入将达到18亿美元,约合131亿元人民币。这一市场仍处于起步阶段,但未来五年的发展潜力巨大,市场规模将增长5.5倍,预计到2029年,市场规模将增长至98亿美元,约714亿元人民币。Omdia 的报告强调,生成式 AI 技术的应用场景正在不断扩大,未来将涵盖更多行业和领域。该收入数据不包括其他关键技术,例如 AI 训练和推理芯片、服务器、数据中心建
近日,亚马逊首席执行官安迪・贾西在与分析师的电话会议中谈到了人工智能(AI)技术的发展及其成本问题。他表示,随着新技术的不断涌现,特别是 DeepSeek 等模型的推出,人工智能推理的成本将会显著下降。这一变化将使得更多企业能够轻松将 AI 应用于其业务中,尤其是在推理和生成式 AI 的领域。图源备注:图片由AI生成,图片授权服务商Midjourney贾西提到,最近有关 DeepSeek 的消息吸引了很多关注,他认为这一技术突破将会加速人工智能的整体需求增长。这与其他科技行业高管的看法