Cohere hat kürzlich einen bedeutenden Durchbruch bei seinem Embed3-Suchmodell erzielt und erstmals die Bildsuche nahtlos mit der Textsuche integriert. Diese Innovation ermöglicht es Unternehmen, Bilder und Texte in derselben Datenbank zu suchen und revolutioniert so die Verwaltung großer Mengen an Produktbildern, Design-Dateien und Berichten.

Technisch gesehen verwendet das neue System eine einheitliche Speicherarchitektur, die das Problem der Wartung mehrerer separater Datenbanken für Unternehmen vollständig löst. Das System unterstützt gängige Bildformate wie PNG, JPEG, WebP und GIF, wobei die maximale Dateigröße 5 MB beträgt. Derzeit unterstützt das System nur die Suche nach einzelnen Bildern; die Funktion für die Batch-Verarbeitung befindet sich noch in der Entwicklung.

image.png

Durch die zugrunde liegende Kerntechnologie werden Geschäftsdaten in Vektorform umgewandelt, was die Sucheffizienz bei komplexen Geschäftsdaten erheblich verbessert. Entwickler können die neue Funktion über die bestehende Embed-API aufrufen; Bilder müssen als Base64-codierte Daten-URLs übermittelt werden.

Erwähnenswert ist, dass das aktualisierte Modell über 100 Sprachen unterstützt und eine hohe plattformübergreifende Kompatibilität aufweist. Neben dem Betrieb auf der Cohere-eigenen Plattform kann es auch auf Microsoft Azure und Amazon SageMaker eingesetzt werden. Das Unternehmen, das vom Entwicklerteam der Transformer-Architektur gegründet wurde, erhielt im Juli letzten Jahres eine Finanzierung in Höhe von 500 Millionen US-Dollar.

Vor dem Hintergrund der zunehmenden Bedeutung der Suche nach multimodalen Inhalten haben auch Technologiekonzerne wie Google und OpenAI ähnliche Produkte auf den Markt gebracht. Der aktuelle Fokus des Wettbewerbs liegt auf der für Unternehmenslösungen erforderlichen Verarbeitungsgeschwindigkeit, Genauigkeit und Sicherheit.