12月30日、アリペイは新世代AIビジュアル検索製品「探一下」をリリースしました。これは独自開発のマルチモーダル大規模モデル技術に基づき、「AIの目で万物を探求」することを可能にし、より迅速で、有用で、面白い生成型検索サービスを提供します。
ユーザーは興味のあるものに出会うと、AIがカメラを通して花やペット、コレクタブルアイテムを識別したり、旅行中の随時解説をしたり、商品や医薬品の詳細情報を検索したりすることができます。さらに、ペットの写真や赤ちゃんの写真を面白く解釈したり、写真にキャプションを付ける手間を省いたりすることもできます。現在、この製品はアリペイで利用可能で、ホームページの「スキャン」をクリックした後、左にスワイプすると見つけることができます。支小宝アプリからも簡単にアクセスできます。
2024年以降、アリペイは「支小宝」などのAI独立アプリケーションやインテリジェントエージェント開発プラットフォームを相次いでリリースしており、今回AIビジュアルマルチモーダル分野に焦点を当て「探一下」をリリースしたことは、アリペイを中心としたアリババのAI戦略が継続的に加速していることを示しています。
AIに目を与え、周りの世界を探求する
近年、生成型人工知能は急速に発展しており、マルチモーダル技術により、視覚がデジタルサービスの新たな入り口となっています。アリペイが「探一下」をリリースしたのは、AIを一般の人々の「好奇心の目」にし、周囲の万物を探求し、AIによる画像認識で検索、創作、インタラクションを実現することを目指しているためです。
従来のAIビジュアル検索製品とは異なり、「探一下」はAIによる画像認識により、より迅速に有用な情報を提供し、ユーザーの興味や状況を深く理解した上で、より面白い視覚的な解釈や多様なインテリジェントサービスを提供します。
体験を通して、「探一下」は現在、探求・インスピレーション・テキストの3つの主要なサービスを提供していることが分かりました。
言葉で説明できないものに出会った場合、「探求」機能を使用してAIによる随時画像認識を行い、いつでも新しい知識を得ることができます。
例えば、アウトドアや旅行好きな人は、知らない花や昆虫、食べ物、建物、展示品などに出会った場合、関連情報を簡単に取得でき、「スマートガイド」を簡単に手に入れることができます。
若い人が好きなフィギュアやコレクタブルアイテムに出会った場合、これを使っておすすめ情報を調べることができます。また、お父さんお母さんもこれを使って68種類のウルトラマンを識別でき、子供に困らされる心配はもうありません。
ユーザーが「探一下」でウルトラマンを識別
読めない外国語の商品に出会った場合、「探一下」で詳細情報を取得でき、オンラインで同じ商品をより簡単に購入できます。説明書をなくした薬の箱の場合、詳細な説明を確認できるだけでなく、アリペイ傘下の「AIヘルスケアマネージャー」を呼び出して、より多くの服薬に関する情報を問い合わせることができます。
生成型AIの特徴に基づき、「インスピレーション」機能は、状況に応じてスマートなビジュアルフィルターをトリガーし、AIによる面白い解釈を実現し、写真にキャプションを付ける手間を省きます。
例えば、ペットを飼っている「ペットオーナー」は、ペットの写真を撮って「心の声」をカスタマイズし、ペットが話すようにすることで、より温かい気持ちになります。また、朋友圈で子供の写真をアップロードするのが好きなお父さんお母さんも、AIに自分の子供への愛情を解釈してもらうことができます。
さらに、海外旅行中や外国語学習中に、読めない外国語のメニューや看板などに出会った場合、「テキスト」機能を使用して原文を簡単に認識し、翻訳することができます。
AIビジュアル検索の刷新、アリペイAIの継続的な加速
従来、検索は主にキーワードのマッチングによって関連する結果を返すものでした。新世代の生成型AIビジュアル検索製品である「探一下」は、単なる検索リンクを提供するのではなく、マルチモーダル大規模モデルによる視覚的な理解と創作能力に基づいて、よりインテリジェントで、豊かで、インタラクティブなサービス体験を提供します。
関連データによると、人間が取得する情報の80%以上は視覚から得られており、視覚を中心とした人工知能製品は、人とAIのインタラクションの障壁を大幅に下げ、より多くのAIアプリケーションシナリオを開放し、「見えるものが検索対象となり、見えるものがサービスとなる」を実現します。海外では、GoogleがリリースしたGoogle Lensは、毎月200億回以上のビジュアル検索呼び出し数を記録しています。Appleも今年、「ビジュアルインテリジェンス」という新機能をリリースし、携帯電話のカメラを使用してユーザーが「見えるものを即座に理解」することを支援しています。
数億人のユーザーを抱えるデジタルライフのオープンなプラットフォームとして、アリペイがAIビジュアル検索製品「探一下」をリリースし、「スキャン」の中核機能に組み込んだのは、製品を継続的に刷新することで、AIをQRコード決済と同じくらい便利なものにすることを目指しているためです。つまり、会話できる頭脳、仕事ができる手足だけでなく、周りの世界を探求できる目も持たせるということです。
アリペイのAI製品が密集してリリースされている背景には、アリババグループのAIファースト戦略の全面的な加速があります。2023年11月、アリババは独自開発の百霊大規模モデルを発表し、今年9月以降、「支小宝」、「螞小財」、「AIヘルスケアマネージャー」の3つのAIアプリケーションとインテリジェントエージェント開発プラットフォーム「百宝箱」を相次いでリリースし、オープンなAIサービスエコシステムの構築を加速しています。