Cohere ha lanzado Embed3, su modelo de búsqueda de IA multimodal de última generación. Ahora admite la búsqueda multimodal, lo que significa que los usuarios pueden realizar búsquedas empresariales no solo con texto, sino también con imágenes.
Desde su lanzamiento el año pasado, Embed3 ha experimentado continuas mejoras, ayudando a las empresas a convertir documentos en representaciones digitales. Esta actualización mejorará aún más su rendimiento en la búsqueda de imágenes.
Aidan Gonzales, cofundador y CEO de Cohere, compartió en las redes sociales un gráfico que muestra la mejora del rendimiento de Embed3 en la búsqueda de imágenes.
En una entrada de blog, Cohere afirma que esta nueva función ayudará a las empresas a aprovechar al máximo la gran cantidad de datos almacenados en imágenes, mejorando así la eficiencia del trabajo. Las empresas podrán buscar de forma más rápida y precisa activos multimodales como informes complejos, catálogos de productos y archivos de diseño.
Con el desarrollo continuo de la búsqueda multimodal, Embed3 de Cohere puede generar incrustaciones de texto e imágenes simultáneamente. Este nuevo método de incrustación permite a los usuarios gestionar imágenes y texto en un único espacio latente, en lugar de almacenarlos por separado. Esta mejora aumentará significativamente la calidad de los resultados de búsqueda, evitando sesgos hacia los datos de texto y permitiendo una mejor comprensión del significado subyacente de los datos.
A continuación, se presentan ejemplos de uso práctico de Embed3:
Gráficos y tablas: La representación visual es clave para comprender datos complejos. Los usuarios ahora pueden encontrar fácilmente los gráficos adecuados para informar sus decisiones comerciales. Simplemente describiendo una idea específica, Embed3 recuperará los gráficos y tablas relevantes, permitiendo a los empleados de diferentes equipos tomar decisiones basadas en datos de forma más eficiente.
Catálogos de productos de comercio electrónico: Los métodos de búsqueda tradicionales suelen limitar a los clientes a encontrar productos a través de descripciones de productos basadas en texto. Embed3 cambia esta experiencia de búsqueda. Los minoristas pueden crear aplicaciones que permitan buscar imágenes de productos además de las descripciones de texto, creando así una experiencia diferenciada para los compradores y aumentando las tasas de conversión.
Archivos y plantillas de diseño: Los diseñadores suelen utilizar una gran cantidad de bibliotecas de activos, dependiendo de la memoria o de reglas de nomenclatura estrictas para organizar los elementos visuales. Embed3 facilita la búsqueda de modelos de interfaz de usuario específicos, plantillas visuales y diapositivas de presentación según la descripción de texto. Esto simplifica el proceso creativo.
Embed3 admite más de 100 idiomas, lo que significa que puede servir a una audiencia más amplia. Actualmente, este Embed3 multimodal está disponible en la plataforma de Cohere y en Amazon SageMaker.
A medida que más usuarios se acostumbran a la búsqueda de imágenes, las empresas también están siguiendo esta tendencia. La actualización de Cohere les brinda la oportunidad de disfrutar de una experiencia de búsqueda más flexible. En septiembre, Cohere actualizó su API para que los clientes puedan cambiar fácilmente de modelos de la competencia a los modelos de Cohere.
Blog oficial: https://cohere.com/blog/multimodal-embed-3
Puntos clave:
🌟 Embed3 admite la búsqueda multimodal, permitiendo a los usuarios realizar búsquedas con imágenes y texto.
📈 El modelo actualizado mejora significativamente el rendimiento de la búsqueda de imágenes, ayudando a las empresas a aprovechar el valor de los datos.
🔄 Cohere actualizó su API en septiembre, simplificando el proceso de cambio para los clientes que utilizan otros modelos.