Cohere社は最近、Embed3検索モデルにおいて大きな進歩を遂げ、画像検索機能とテキスト検索機能をシームレスに統合することに初めて成功しました。この革新により、企業は同一データベース内で画像とテキストを統一的に検索できるようになり、膨大な製品画像、設計ファイル、レポート管理に革命的な変化をもたらします。

技術面では、新しいシステムは統一されたストレージアーキテクチャを採用しており、企業が複数の独立したデータベースを維持する必要性を完全に解消しました。システムはPNG、JPEG、WebP、GIFなどの主要な画像フォーマットをサポートし、単一ファイルの容量上限は5MBです。現在、システムは単一の画像検索のみをサポートしており、バッチ処理機能は開発中です。

image.png

中核技術を支えとして、システムはビジネスデータをベクトル表現に変換することで、複雑なビジネスデータの検索効率を大幅に向上させました。開発者は既存のEmbed APIを使用して新機能にアクセスでき、画像はBase64エンコードされたデータURL形式で送信する必要があります。

特筆すべきは、更新されたモデルが100以上の言語をサポートし、強力なクロスプラットフォーム互換性を備えていることです。Cohere独自のプラットフォームでの実行に加えて、Microsoft AzureやAmazon SageMakerにも展開できます。Transformerアーキテクチャの開発チームによって設立された同社は、昨年7月に5億ドルの資金調達を行いました。

マルチモーダルコンテンツ検索の重要性が高まる中、GoogleやOpenAIなどのテクノロジー大手も同様の製品を相次いで発表しています。現在の競争の焦点は、企業向けアプリケーションに必要な処理速度、正確性、セキュリティに移っています。