预计到 2031 年,合成数据生成市场规模将达到 35 亿美元

近日,LinkedIn 因涉嫌将付费用户的私密 InMail 消息提供给第三方进行人工智能(AI)模型训练而被起诉。这起诉讼由阿莱桑德罗・德拉・托雷(Alessandro De La Torre)在加利福尼亚联邦法院提起,声称 LinkedIn 在去年宣布的政策变更中,实际上将用户的私信数据用于 AI 训练。这项政策变更允许 LinkedIn 使用会员的帖子和个人数据,以此来训练其 AI 模型,并将数据提供给第三方。值得注意的是,LinkedIn 在这些政策中明确指出,居住在加拿大、欧盟、欧洲经济区、英国、瑞士、香港或中国大陆的用户
近日,OpenAI 与纽约时报之间的版权侵权诉讼在美国联邦法院开庭。此案引发广泛关注,因为它不仅涉及两大知名机构,还可能对整个数字媒体生态系统产生深远影响。法庭上,OpenAI 及其主要投资者微软提出了驳回诉讼的动议,而纽约时报及其他原告则指控 OpenAI 和微软在未获得许可的情况下使用其内容来训练大型语言模型(LLM),并利用这些模型来与原告竞争,影响其网站流量和收入。纽约时报的律师在法庭上指出,OpenAI 在训练其模型时,可能直接复制了多篇新闻报道,有时甚至在回答
近日,随着 Meta 公司在一场关于版权的集体诉讼中披露的文件浮出水面,该公司利用一个名为 Library Genesis(LibGen)的盗版电子书图书馆来训练其最新的 AI 聊天机器人 Llama3的消息引发了广泛关注。这些文件显示,Meta 的工程师曾讨论过利用 LibGen 这一 “影子图书馆” 的潜在风险,尤其是在版权和数据拥有权问题日益突出的背景下。尽管存在潜在的负面影响和舆论风险,Meta 的首席执行官马克・扎克伯格依然批准了这一决定。图源备注:图片由AI生成,图片授权服务商Midjourney在法庭的要求下
在最近的一次直播对话中,特斯拉和 SpaceX 首席执行官埃隆・马斯克表示,现实世界中可用于训练人工智能模型的数据已经几乎耗尽。与他进行对话的是 Stagwell 董事会主席马克・佩恩。马斯克提到,“我们现在基本上已经消耗掉了所有人类知识的积累…… 用于人工智能训练的数据。这个现象基本上是去年发生的。”马斯克的这一观点与前 OpenAI 首席科学家伊利亚・苏茨克弗在去年12月的 NeurIPS 会议上提出的 “数据峰值” 理论相似。苏茨克弗表示,AI 行业正面临数据短缺的挑战,未来缺乏足