zh
红薯智语
每月不到10元,就可以无限制地访问最好的AIbase。立即成为会员
首页
AI资讯
AI日报
变现指南
AI教程
AI工具导航
AI产品库
zh
红薯智语
搜索全球AI产品动态
搜索全球AI信息,发现AI新机遇
新闻资讯
产品应用
变现案例
AI教程
类型 :
新闻资讯
产品应用
变现案例
AI教程
2024-09-02 17:09:10
.
AIbase
.
11.5k
LAION 发布全新 AI 数据集 Re-LAION-5B,彻底清除儿童性虐待内容链接
LAION发布Re-LAION-5B,全球首个全面清除CSAM链接的AI训练数据集,旨在解决儿童性虐待材料(CSAM)问题。该数据集在LAION-5B基础上进行了重大改进,主要分为Re-LAION-5B Research和Research-Safe两个版本,共移除2236个CSAM链接,其中1008个来自儿童保护组织名单。数据集包含55亿对文本和图像,旨在帮助清理现有数据集,移除所有匹配的CSAM内容。LAION希望通过此举为网页规模数据集的安全标准设定新基准,解决AI训练数据集中CSAM问题的严重性,尤其是AI生成CSAM内容的增长对真实案件调查和社交媒体平台报告数量的影响。
2024-08-31 10:41:54
.
AIbase
.
11.4k
用于训练 Stable Diffusion 的数据集背后的组织声称已经删除了 CSAM
德国研究机构LAION创建并发布了新数据集Re-LAION-5B,声称已清除疑似儿童性虐待材料(CSAM)链接。该数据集是旧数据集LAION-5B的修复版,采纳了互联网观察基金会、人权观察、加拿大儿童保护中心和斯坦福互联网观察站的建议。Re-LAION-5B分为两个版本:Research和Research-Safe,后者额外删除了NSFW内容。数据集旨在支持Stable Diffusion等生成式AI模型的训练,且不包含图像,仅提供图像链接和替代文本的索引。Re-LAION-5B的发布前,斯坦福互联网观察站发现LAION-5B包含非法图片链接,且数据集中可能存在不当内容。LAION已暂时下线原数据集,并承诺删除已知违规链接。新数据集包含约55亿个文本图像对,根据Apache2.0许可发布。LAION强调数据集用于研究而非商业目的,并鼓励使用元数据清理现有副本。