zh
AI产品榜
每月不到10元,就可以无限制地访问最好的AIbase。立即成为会员
首页
AI资讯
AI日报
变现指南
AI教程
AI工具导航
AI产品库
zh
AI产品榜
搜索全球AI产品动态
搜索全球AI信息,发现AI新机遇
新闻资讯
产品应用
变现案例
AI教程
类型 :
新闻资讯
产品应用
变现案例
AI教程
2024-08-13 15:08:09
.
AIbase
.
11.0k
AI数据危机!MIT研究显示网页数据公开共享正迅速减少!
人工智能领域面临的数据获取难题日益凸显,研究指出,曾经易得的网页数据现在变得难以访问,影响了AI训练和学术研究。MIT等机构的研究发现,多个开源数据集的爬取网站因收紧许可协议,限制了数据获取,不仅对商业AI模型训练构成挑战,也对学术和非营利研究造成阻碍。通过使用机器人排除协议和网站服务条款作为研究方法,研究团队预测未来网站对数据的限制将持续增加。数据获取的困难可能对模型对齐、数据收集实践以及版权产生影响。研究呼吁需要更灵活的协议来适应网站所有者的意愿,并支持AI开发人员使用开放网络数据进行训练。作者希望未来的法律能对此提供支持。
2024-06-19 14:23:57
.
AIbase
.
9.7k
Nvidia发布开源数据集和70亿参数模型:HelpSteer2和Llama3-70B-SteerLM-RM
Nvidia 最近宣布推出两项突破性的人工智能技术:HelpSteer2和 Llama3-70B-SteerLM-RM。这些创新承诺在各种应用中显著增强 AI 系统的能力,从自动驾驶到自然语言处理。
2023-12-27 10:28:28
.
AIbase
.
4.5k
上海 AI 实验室发布 “浦医 2.0”OpenMEDLab2.0
["上海 AI 实验室与上海交通大学医学院附属瑞金医院等发布了医疗多模态基础模型群 “浦医 2.0”","浦医 2.0 新增多领域模型,语言参数增量,涵盖医学图像、医学文本、生物信息等多个数据模态","新增开源数据集包括医学图像分割数据集 SA-Med2D-20M 和病理数据集 SNOW","浦医 2.0 加入评测模块,提供医疗模型能力参考","实现医疗大模型群的一站式开源,为 AI 在医疗领域的应用提供支持"]
2023-08-24 10:46:12
.
AIbase
.
772
AI2 发布大语言模型开源数据集 Dolma 包含 3 万亿个 token
["AI2 最近发布了一个名为 Dolma 的开源数据集,包含了 3 万亿个 token。","Dolma 的数据将为 AI2 正在开发中的开放语言模型 OLMo 提供基础,计划于 2024 年初发布。","Dolma 的数据集来自网络内容、学术出版物、代码和书籍等广泛来源,是目前公开可用的同类数据集中最大的一个。"]