A Nomic AI lançou o primeiro modelo de embedding de texto longo totalmente de código aberto, o nomicembed-text-v1, que superou o OpenAI Ada-002 em vários benchmarks. O modelo possui um comprimento de sequência de 8192, demonstrando uma excelente capacidade de lidar com uma ampla gama de textos, e enfatiza a auditabilidade e a reprodutibilidade, estabelecendo um novo padrão de transparência e abertura para a comunidade de IA.