预计到 2031 年，合成数据生成市场规模将达到 35 亿美元

站长之家

发布于AI新闻资讯 · 1 分钟阅读 · 2023年8月14号 16:24

根据报道，全球合成数据生成市场预计在 2031 年将达到 35 亿美元的市值，市场增长受到数字化转型和人工智能等先进技术的推动。合成数据生成技术可以满足数据隐私和安全的需求，并提供一种可扩展的方法来生成各种数据集，以增强人工智能模型的泛化能力。预计亚太地区将在市场增长方面表现最好。该报道强调了合成数据生成在敏感数据行业中的重要性，以及在真实数据收集受限的情况下进行测试和创新的优势。

LinkedIn 被指控泄露用户私信用于 AI 训练，法律纠纷持续发酵

近日，LinkedIn 因涉嫌将付费用户的私密 InMail 消息提供给第三方进行人工智能（AI）模型训练而被起诉。这起诉讼由阿莱桑德罗・德拉・托雷（Alessandro De La Torre）在加利福尼亚联邦法院提起，声称 LinkedIn 在去年宣布的政策变更中，实际上将用户的私信数据用于 AI 训练。这项政策变更允许 LinkedIn 使用会员的帖子和个人数据，以此来训练其 AI 模型，并将数据提供给第三方。值得注意的是，LinkedIn 在这些政策中明确指出，居住在加拿大、欧盟、欧洲经济区、英国、瑞士、香港或中国大陆的用户

AI 训练成 “剽窃”？OpenAI 与纽约时报版权之争开庭

近日，OpenAI 与纽约时报之间的版权侵权诉讼在美国联邦法院开庭。此案引发广泛关注，因为它不仅涉及两大知名机构，还可能对整个数字媒体生态系统产生深远影响。法庭上，OpenAI 及其主要投资者微软提出了驳回诉讼的动议，而纽约时报及其他原告则指控 OpenAI 和微软在未获得许可的情况下使用其内容来训练大型语言模型（LLM），并利用这些模型来与原告竞争，影响其网站流量和收入。纽约时报的律师在法庭上指出，OpenAI 在训练其模型时，可能直接复制了多篇新闻报道，有时甚至在回答

扎克伯格知晓 Meta 使用盗版图书馆数据训练 AI

近日，随着 Meta 公司在一场关于版权的集体诉讼中披露的文件浮出水面，该公司利用一个名为 Library Genesis（LibGen）的盗版电子书图书馆来训练其最新的 AI 聊天机器人 Llama3的消息引发了广泛关注。这些文件显示，Meta 的工程师曾讨论过利用 LibGen 这一 “影子图书馆” 的潜在风险，尤其是在版权和数据拥有权问题日益突出的背景下。尽管存在潜在的负面影响和舆论风险，Meta 的首席执行官马克・扎克伯格依然批准了这一决定。图源备注：图片由AI生成，图片授权服务商Midjourney在法庭的要求下

马斯克警告：现实可用于训练 AI 的数据几乎耗尽

在最近的一次直播对话中，特斯拉和 SpaceX 首席执行官埃隆・马斯克表示，现实世界中可用于训练人工智能模型的数据已经几乎耗尽。与他进行对话的是 Stagwell 董事会主席马克・佩恩。马斯克提到，“我们现在基本上已经消耗掉了所有人类知识的积累…… 用于人工智能训练的数据。这个现象基本上是去年发生的。”马斯克的这一观点与前 OpenAI 首席科学家伊利亚・苏茨克弗在去年12月的 NeurIPS 会议上提出的 “数据峰值” 理论相似。苏茨克弗表示，AI 行业正面临数据短缺的挑战，未来缺乏足

AI新闻资讯

预计到 2031 年，合成数据生成市场规模将达到 35 亿美元

站长之家

相关AI新闻推荐

​LinkedIn 被指控泄露用户私信用于 AI 训练，法律纠纷持续发酵

AI 训练成 “剽窃”？OpenAI 与纽约时报版权之争开庭

扎克伯格知晓 Meta 使用盗版图书馆数据训练 AI

​马斯克警告：现实可用于训练 AI 的数据几乎耗尽

LinkedIn 被指控泄露用户私信用于 AI 训练，法律纠纷持续发酵

马斯克警告：现实可用于训练 AI 的数据几乎耗尽