近年来,Reddit,不仅以丰富的用户社区著称,现在还开始通过一种新的方式来盈利 —— 数据许可。

该平台拥有超过100,000个活跃的社区或 subreddit,每天有超过7600万用户,生成了大量数据。这些数据富含实时讨论、意见和交互,已成为开发 AI 和机器学习模型的公司的金矿。

随着 AI 技术的快速发展,Reddit 的用户生成数据成为了 AI 公司训练模型的重要资源。该平台利用其丰富的讨论内容,展开与包括谷歌在内的大型科技公司的数据许可交易,为自身开辟了新的收入来源。

在2023年,Reddit 正式推出了数据许可计划。根据美国证券交易委员会 (SEC) 最近的一份文件,Reddit 预计仅在2024年就将从这些数据许可协议中产生6640万美元的收入。在未来三年内,Reddit 预计将从 AI 数据许可中获得2.03亿美元的收入,这标志着该公司的新收入来源非常重要。

reddit,官方logo截图

Reddit 数据的战略价值

Reddit 数据的价值在于它的广度和深度。与其他专注于个人网络的社交平台不同,Reddit 的内容是围绕主题组织的,这使得它对于希望训练特定主题模型的 AI 公司特别有价值。

从 r/AskEngineers 等 subreddit 中关于利基技术主题的讨论到 r/AskReddit 中的文化辩论,该平台提供了大量数据,可用于在自然语言处理、情感分析等方面训练 AI 模型。

此外,Reddit 的数据不断更新,提供对新兴趋势和行为的实时洞察。数据的这种动态性质对于行为分析和算法交易等应用程序特别有吸引力,在这些应用程序中,了解公众情绪的最新变化可能至关重要。

业绩表现

Reddit 转向数据许可的努力已经取得了成效。作为一家上市公司,Reddit 报告称,在第一季度,收入增长了54%,达到2.81亿美元,超出了市场预期。虽然在线广告仍然是 Reddit 最大的收入来源,占2.531亿美元,但数据许可业务实现了惊人的691% 增长,为公司贡献了2810万美元的收入。

数据许可收入的快速增长清楚地表明了市场对用于 AI 训练的高质量数据源的需求。随着越来越多的公司进入人工智能领域,对 Reddit 数据的需求可能会增加,从而为该平台提供稳定且不断增长的收入来源。

然而,数据许可的业务扩展也引发了法律和道德上的争议。一些公司在没有许可的情况下,已经利用 Reddit 的数据构建大型语言模型,这引发了关于数据使用是否符合版权法 “合理使用” 的讨论。Reddit 表示,将积极维护自身的权益,以防止未经授权的数据抓取。

尽管面临挑战,Reddit 在这条数据许可的新道路上行进得风生水起。然而,随着 AI 工具的崛起,Reddit 也意识到自己可能会与这些工具竞争,用户可能会转向 AI 模型获取信息。这种情况下,Reddit 需要继续创新,提升用户体验,确保自己在这个快速变化的市场中保持竞争力。

划重点:

📊 Reddit 通过数据许可与大型科技公司合作,预计2024年可获得6640万美元的收入。  

🚀 数据许可业务增长迅猛,第一季度收入增长了691%。  

⚖️ 数据使用引发法律争议,Reddit 承诺将积极维护自身权益。