Nomic AI发布首个开源长文本嵌入模型,超越OpenAI Ada-002

站长之家
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
["Nomic AI发布 Nomic Embed,首个完全开源的、可复现和可审核的嵌入模型。","在短上下文和长上下文基准测试中,Nomic Embed 超越了 OpenAI 的 text-embeding-3-small 和 text-embedding-ada-002。","该模型参数量仅有137M,5天即可训练完成,非常适合部署。","通过调整 BERT,研究团队实现了适应8192序列长度的嵌入模型。","在多个基准测试中,Nomic Embed 在性能上超越了 text-embedding-ada-002 和 jina-embeddings-v2-base-en。"]
["NomicAI最新发布的开源嵌入模型NomicEmbed正式亮相,以卓越的性能超越了OpenAI的Ada-002和text-embedding-3-small模型。","Nomic Embed在短文和长文任务中胜过OpenAI的Ada-002和text-embedding-3-small模型。","8192的上下文长度,通过Massive Text Embedding Benchmark (MTEB)和LoCo Benchmark表现优异。","Nomic Embed提供完整的可复制、可审计的模型,可通过Nomic Atlas Embedding API免费使用,也适用于企业级应用。"]