最近,SnorkelAI 在其 AI 数据开发平台 Snorkel Flow 上推出了一系列新功能,旨在帮助企业加速 AI 和机器学习模型的专门化。这些新功能能够显著减少在预测和生成 AI 开发生命周期中数据准备的时间、成本和复杂性。

大脑 大模型  AI

图源备注:图片由AI生成,图片授权服务商Midjourney

在当今企业中,拥有 “AI-ready data”(适合 AI 的数据)是至关重要的。根据 Gartner 的说法,AI-ready data 不仅仅是指你的数据需要代表特定的用例,还必须涵盖每种模式、错误、异常和意外情况,以便有效训练或运行 AI 模型。而且,数据的准备并不是一蹴而就的,而是需要持续进行的。

Snorkel Flow 的新版本为企业提供了一个强大的平台,以实施和扩展 AI 数据开发实践,从而加快高精度、专门化 AI 模型的生产交付。

具体来说,新功能包括 LLM 评估工具,让用户可以针对特定行业用例进行定制评估,从而深入了解模型错误类型并能快速介入数据开发进行修复。此外,还有 RAG 调优工作流,通过先进的文档块处理、嵌入模型的微调和文档元数据提取来提升检索准确性。这些功能能够显著缩短改进 AI 助手响应质量所需的开发时间。

而针对 PDF 文件的新命名实体识别(NER)功能,用户只需点击文字、绘制边界框、指定模式并提示基础模型,就能更轻松、更快速地提取信息。这种灵活性使得信息捕捉更加简便,从而提升了 NER 模型的准确性。

另外,Snorkel Flow 还简化了注释和反馈流程,使得专家能以更加高效的方式进行数据标注。此外,新增加的序列标记分析工具能够帮助用户更直观地发现模型预测中的错误,同时提供更细致的性能分析。

在用户体验方面,Snorkel Flow 进行了一系列优化,使得数据科学家和专家之间的协作更加流畅。它支持与主要的 AI 开发平台无缝集成,包括 Databricks 和 Amazon SageMaker,以便更快速地微调和部署专门化模型。

Snorkel AI 的首席执行官 Alex Ratner 表示:“AI 已经成为每位企业领导的优先事项,但持续且一致的 AI 开发工作仍然非常繁琐、成本高昂且需要大量人工。因此,这些平台的更新对于帮助企业加速和优化 AI 解决方案的交付至关重要。”

划重点:  

🌟 新功能:Snorkel Flow 推出 LLM 评估工具和 RAG 调优工作流,提升数据准备效率。  

📄 便捷提取:新命名实体识别功能使得从 PDF 中提取信息更简单快速。  

🤝 优化体验:用户体验提升,促进数据科学家与专家之间的高效协作。