Meta 首席执行官马克・扎克伯格在近期的法律诉讼中,借助 YouTube 与盗版内容的斗争来为公司在 AI 训练中使用版权数据的做法辩护。此案名为 “Kadrey 诉 Meta”,是美国法庭中众多针对 AI 公司的版权诉讼之一,原告包括知名作家莎拉・西尔弗曼和塔 - 纳希西・科茨。根据最近公布的扎克伯格证词摘录,他指出,尽管 YouTube 上可能会存在一部分盗版内容,但 YouTube 仍在努力将这些内容删除。“大多数在 YouTube 上的内容应该都是合法的,他们有相关许可。” 扎克伯格表示。这番言论暗示着他对
在推动人工智能(AI)领域透明度的进程中,计算机与通信行业协会(CCIA)于布鲁塞尔和华盛顿共同宣布推出一项开创性的新举措,即全球行业透明度报告模板。这一模板旨在提升公众对通用人工智能(GPAI)模型训练数据的信任与理解。此次发布的 “AI 模型训练数据透明度模板” 要求企业披露用于训练特定 GPAI 模型的数据类型,例如播客、书籍等,同时还需明确数据的主要来源,如开放存取档案、大型公共数据集或公共网站的爬取数据。此外,企业还需详细解释这些数据是如何被筛选和应用于
近日,一则来自彭博社的爆料引发了内容创作者们的热烈讨论,OpenAI 和谷歌等科技巨头正在高价收购 UP 主们未发布的视频内容,以供 AI 模型进行训练。此举不仅让 UP 主们看到了新商机,还让 “废旧” 视频焕发出新的价值。根据报道,这些公司正在寻求购买那些 “从未公开” 的视频,尤其是用于 YouTube、Instagram 和 TikTok 等平台的未发布视频。每分钟的报价在1到2美元之间,若视频质量更高,如4K 分辨率或无人机拍摄素材,价格则可能更高。整体来看,这样的交易不仅能让 UP 主们从未发布
训练大型AI模型(如Transformer和语言模型)已成为AI领域不可或缺的关键环节,但也面临着高昂的计算成本、内存消耗和能源需求。例如,OpenAI的GPT-3拥有1750亿个参数,需要数周的GPU训练。这种巨大的资源需求限制了这项技术在大规模计算资源充足的组织中的应用,同时也加剧了人们对能源效率和环境影响的担忧。解决这些挑战对于确保AI发展的更广泛可及性和可持续性至关重要。传统训练方法效率低下,亟需创新解决方案大型模型训练效率低下的主要原因在于其对稠密矩阵的依赖,这需要