Mientras la fiebre de la IA de agentes continúa creciendo, la Recuperación Aumentada por Búsqueda (RAG) sigue desempeñando un papel crucial. Recientemente, aprovechando el creciente interés del mercado en los agentes, Cohere, centrada en aplicaciones de IA empresarial, lanzó su último modelo de incrustación, Embed 4. Este modelo ha mejorado significativamente las capacidades multimodales de Embed 3, destacando especialmente en el procesamiento de datos no estructurados, y cuenta con una ventana de contexto ultralarga de hasta 128.000 tokens, teóricamente capaz de generar incrustaciones para aproximadamente 200 páginas de documentos.

QQ20250416-091037.png

Un salto en el rendimiento: Contexto más largo y mejora multi-modal

Cohere señala en su blog oficial que los modelos de incrustación existentes presentan deficiencias inherentes en la comprensión de datos empresariales complejos y multimodales, lo que obliga a las empresas a realizar un preprocesamiento de datos engorroso para obtener una mejora limitada en la precisión. Embed 4 pretende solucionar este problema, ayudando a las empresas y a sus empleados a extraer de forma eficiente las ideas clave ocultas en la gran cantidad de información difícil de buscar.

Aplicaciones empresariales: Seguras, eficientes y versátiles

Según la información proporcionada, las empresas pueden implementar Embed 4 en una nube privada virtual o en su infraestructura tecnológica interna para mejorar la seguridad de los datos. Mediante la generación de incrustaciones, las empresas pueden convertir diversos documentos u otros datos en una representación numérica necesaria para los casos de uso de RAG, para que los agentes de IA los consulten al responder a las indicaciones del usuario, mejorando así la precisión de las respuestas y evitando las "alucinaciones".

Embed 4 afirma destacar en sectores altamente regulados como las finanzas, la sanidad y la manufactura. Cohere destaca que el modelo considera plenamente las necesidades de seguridad de estos sectores y que posee una profunda comprensión de las aplicaciones empresariales. Además, Embed 4 se ha entrenado con "datos del mundo real ruidosos", por lo que mantiene una alta precisión incluso ante errores ortográficos y problemas de formato comunes en los datos empresariales. Cabe destacar su excelente rendimiento en la búsqueda de documentos escaneados y manuscritos, sin necesidad de complejos procesos de preprocesamiento, lo que ahorra a las empresas tiempo y costes operativos. Las aplicaciones de Embed 4 son amplias, incluyendo presentaciones para inversores, documentos de due diligence, informes de ensayos clínicos, manuales de mantenimiento y documentación de productos. Al igual que las versiones anteriores, este modelo admite más de 100 idiomas.

Agora, cliente de Cohere, ya ha implementado Embed 4 en su motor de búsqueda de IA y ha descubierto que el modelo muestra eficazmente los productos relevantes. Param Jaggi, fundador de Agora, afirma que los datos de comercio electrónico son complejos, incluyendo imágenes y descripciones de texto multifacéticas, y que Embed 4 puede presentar los productos en forma de incrustaciones unificadas, lo que acelera la velocidad de búsqueda y aumenta la eficiencia de las herramientas internas.

Potenciar a los agentes: Mayor precisión y eficiencia

Cohere considera que modelos como Embed 4 mejorarán enormemente los casos de uso de los agentes y podrían convertirse en el "mejor motor de búsqueda" para los agentes empresariales y los asistentes de IA. La empresa destaca que Embed 4 no solo ofrece una gran precisión en diferentes tipos de datos, sino que también posee una eficiencia empresarial, pudiendo escalarse para satisfacer las necesidades de las grandes organizaciones y crear incrustaciones de datos comprimidos para reducir los costes de almacenamiento.

Cabe destacar que Qodo-Embed-1-1.5B de Qodo y el modelo de Voyage AI, recientemente adquirido por MongoDB, también son competidores de Embed 4.