Cohereは、最先端のマルチモーダルAI検索モデルEmbed3を発表しました。— 今ではマルチモーダル検索に対応しており、ユーザーはテキストだけでなく、画像を使用して企業レベルの検索を行うことができます。

Embed3は昨年発売されて以来、継続的に最適化され、企業がドキュメントをデジタル表現に変換するのを支援してきましたが、今回のアップグレードにより、画像検索におけるパフォーマンスがさらに向上します。

Cohereの共同創設者兼CEOであるAidan Gonzales氏は、ソーシャルメディアでEmbed3の画像検索におけるパフォーマンス向上を示すグラフを共有しました。

image.png

Cohereはブログ記事で、この新機能により、企業は画像に保存されている膨大なデータの活用を最大限に促進し、作業効率を向上させることができると述べています。企業は、複雑なレポート、製品カタログ、設計ファイルなどのマルチモーダル資産をより迅速かつ正確に検索できます。

image.png

マルチモーダル検索の進化に伴い、CohereのEmbed3はテキストと画像の埋め込みを同時に生成できます。この新しい埋め込み方法は、画像とテキストを別々に保存するのではなく、統一された潜在空間で管理することを可能にします。この方法の改善により、検索結果の質が大幅に向上し、テキストデータへの偏りを回避することで、データの背後にある意味をより適切に理解できます。

image.png

以下はEmbed3の実際の使用例です。

image.png

  • グラフとチャート:視覚的な表現は、複雑なデータを理解する上で重要です。ユーザーは、ビジネス上の意思決定に役立つ適切なチャートを簡単に探し出すことができます。特定の洞察を記述するだけで、Embed3は関連するグラフとチャートを検索し、チームを跨いでのデータに基づいた意思決定をより効率的に行うことができます。

  • eコマース製品カタログ:従来の検索方法は、通常、顧客がテキストベースの製品説明を通じて製品を探すことに制限されていました。Embed3はこの検索体験を変革します。小売業者は、テキストの説明に加えて製品画像を検索できるアプリケーションを構築することで、買い物客に差別化された体験を提供し、コンバージョン率を向上させることができます。

  • 設計ファイルとテンプレート:デザイナーは多くのアセットライブラリを使用しており、メモリや厳格な命名規則に依存して視覚効果を整理しています。Embed3を使用すると、テキストの説明に基づいて特定のUIモデル、視覚化テンプレート、プレゼンテーションスライドを簡単に検索できます。これにより、制作プロセスが簡素化されます。

Embed3は100以上の言語に対応しており、より幅広いユーザー層に対応できます。現在、このマルチモーダルEmbed3はCohereのプラットフォームとAmazon SageMakerで提供されています。

画像検索に慣れているユーザーが増えるにつれて、企業もこのトレンドに追いつこうとしており、Cohereのアップデートにより、より柔軟な検索体験を得る機会が提供されます。Cohereは9月にAPIを更新し、顧客が競合他社のモデルからCohereのモデルに簡単に切り替えることができるようにしました。

公式ブログ:https://cohere.com/blog/multimodal-embed-3

重要なポイント:

🌟 Embed3はマルチモーダル検索に対応しており、ユーザーは画像とテキストを使用して検索できます。

📈 更新されたモデルは画像検索のパフォーマンスを大幅に向上させ、企業によるデータ価値の活用を促進します。

🔄 Cohereは9月にAPIを更新し、顧客が他のモデルからの切り替えを簡素化しました。