Cohere a récemment réalisé une percée majeure dans son modèle de recherche Embed3, intégrant pour la première fois de manière transparente la recherche d'images et la recherche textuelle. Cette innovation permet aux entreprises de rechercher des images et du texte dans une seule et même base de données, révolutionnant ainsi la gestion d'un grand nombre d'images de produits, de fichiers de conception et de rapports.

Sur le plan technique, le nouveau système utilise une architecture de stockage unifiée, résolvant ainsi le problème des entreprises qui doivent gérer plusieurs bases de données indépendantes. Le système prend en charge les principaux formats d'image tels que PNG, JPEG, WebP et GIF, avec une taille de fichier maximale de 5 Mo. Actuellement, le système ne prend en charge que les requêtes d'images uniques, la fonctionnalité de traitement par lots étant encore en cours de développement.

image.png

Grâce à sa technologie de pointe, le système convertit les données commerciales en représentations vectorielles, améliorant considérablement l'efficacité de la recherche de données commerciales complexes. Les développeurs peuvent accéder à la nouvelle fonctionnalité via l'API Embed existante ; les images doivent être soumises sous forme d'URL de données codées en Base64.

Il est à noter que le modèle mis à jour prend en charge plus de 100 langues et offre une compatibilité multiplateforme robuste. En plus de fonctionner sur la plateforme Cohere, il peut être déployé sur Microsoft Azure et Amazon SageMaker. Fondée par l'équipe de développement de l'architecture Transformer, cette société a reçu un financement de 500 millions de dollars en juillet dernier.

Dans un contexte où la recherche de contenu multimodale prend de plus en plus d'importance, des géants de la technologie comme Google et OpenAI ont également lancé des produits similaires. L'accent de la concurrence se porte désormais sur la vitesse de traitement, la précision et la sécurité nécessaires aux applications d'entreprise.