Am 30. Dezember hat Alipay „Tan Yixia“ (探一下), ein KI-basiertes visuelles Suchprodukt der neuen Generation, vorgestellt. Basierend auf einer selbst entwickelten multimodalen Großmodelltechnologie ermöglicht es die „Erforschung aller Dinge mit KI-Augen“ und bietet schnellere, nützlichere und unterhaltsamere generative Suchdienste.
Benutzer können mit der KI über die Kamera interessante Dinge wie Blumen, Pflanzen, Haustiere, Sammlerstücke, Reiseführer, Produkt- und Medikamentendetails identifizieren. Es kann auch niedliche Haustier- und Babyfotos witzig interpretieren und hilft bei der Gestaltung von Bildunterschriften. Das Produkt ist bereits auf Alipay verfügbar und kann über „Scannen“ auf der Startseite (links wischen) oder über die App „Zhi Xiaobao“ (支小宝) schnell aufgerufen werden.
Seit 2024 hat Alipay nacheinander unabhängige KI-Anwendungen wie „Zhi Xiaobao“ und eine Plattform für die Entwicklung intelligenter Agenten veröffentlicht. Die Einführung von „Tan Yixia“ im Bereich der multimodalen KI-Vision unterstreicht die anhaltende Beschleunigung der Alipay-zentrierten Ant-KI-Strategie.
KI mit Augen: Die Welt um uns herum erkunden
In den letzten Jahren hat sich die generative KI rasant entwickelt, und die multimodale Technologie macht das Sehen zu einem neuen Einstiegspunkt für digitale Dienste. Alipay hat „Tan Yixia“ entwickelt, um KI zu den „Augen der Neugier“ für jedermann zu machen, um die Welt um uns herum zu erkunden und KI-basierte Bilderkennung zum Suchen, Erstellen und Interagieren zu ermöglichen.
Im Gegensatz zu herkömmlichen KI-basierten visuellen Suchprodukten liefert „Tan Yixia“ schnellere nützliche Informationen und bietet aufgrund des tiefen Verständnisses der Benutzerinteressen und -szenarien unterhaltsamere visuelle Interpretationen und vielfältigere intelligente Dienste.
Die Erfahrung zeigt, dass „Tan Yixia“ derzeit drei Kernfunktionen bietet: Wissen erkunden, Inspiration finden und Texte erkunden.
Wenn man etwas sieht, das man nicht beschreiben kann, kann man mit „Wissen erkunden“ die KI verwenden, um Bilder zu erkennen und jederzeit neues Wissen zu erhalten.
Für Outdoor- und Reisebegeisterte ist es beispielsweise hilfreich, Informationen über unbekannte Pflanzen, Insekten, Speisen, Gebäude, Ausstellungsstücke usw. zu erhalten und so einen „intelligenten Reiseführer“ zu haben.
Junge Leute können mit „Tan Yixia“ Handbücher und Sammlerstücke recherchieren, und Eltern können 68 verschiedene Ultraman-Figuren identifizieren, ohne von ihren Kindern überrascht zu werden.
Ein Nutzer identifiziert Ultraman mit „Tan Yixia“
Bei unverständlichen ausländischen Produkten liefert „Tan Yixia“ Details und erleichtert den Online-Kauf ähnlicher Produkte. Bei verlorenen Gebrauchsanweisungen von Medikamenten kann man nicht nur detaillierte Informationen erhalten, sondern auch den „KI-Gesundheitsmanager“ von Alipay kontaktieren, um weitere Informationen zur Einnahme zu erhalten.
Basierend auf den Eigenschaften der generativen KI kann „Inspiration finden“ szenenbasierte intelligente visuelle Filter aktivieren, um lustige KI-Interpretationen zu ermöglichen und die Gestaltung von Bildunterschriften zu erleichtern.
Haustierbesitzer können beispielsweise Fotos ihrer Haustiere machen und personalisierte „Gedankensprüche“ erstellen, um ihre Haustiere zum Sprechen zu bringen. Eltern, die gerne Fotos ihrer Kinder in sozialen Medien teilen, können die KI nutzen, um ihre Liebe zu ihren Kindern auszudrücken.
Im Ausland oder beim Sprachenlernen kann man mit „Texte erkunden“ unverständliche Menüs oder Schilder einfach erkennen und übersetzen lassen.
Modernisierte KI-Bildsuche: Alipay und die anhaltende Beschleunigung der KI
In der Vergangenheit basierte die Suche hauptsächlich auf der Übereinstimmung von Schlüsselwörtern. Als neue Generation von generativen KI-Bildsuchprodukten bietet „Tan Yixia“ nicht nur einfache Suchlinks, sondern auch intelligente, reichhaltigere und interaktive Dienste basierend auf der visuellen Verständnis- und Kreativität von multimodalen Großmodellen.
Daten zeigen, dass Menschen über 80 % ihrer Informationen visuell erhalten. KI-Produkte, die auf dem Sehen basieren, können die Interaktion zwischen Mensch und KI erheblich vereinfachen, neue KI-Anwendungsfälle erschließen und „sehen ist suchen, sehen ist Service“ ermöglichen. Im Ausland verzeichnet Google Lens monatlich über 20 Milliarden visuelle Suchanfragen. Apple hat in diesem Jahr auch eine neue Funktion namens „Visuelle Intelligenz“ eingeführt, die Benutzern hilft, „alles, was sie sehen, sofort zu verstehen“.
Als offene Plattform für das digitale Leben mit Hunderten von Millionen Nutzern möchte Alipay mit dem KI-Bildsuchprodukt „Tan Yixia“, das in die Kernfunktion „Scannen“ integriert ist, durch kontinuierliche Produktinnovation KI so einfach wie das Scannen von Zahlungen gestalten – mit einem Gehirn zum Sprechen, Händen und Füßen zum Handeln und Augen zur Erkundung der Welt.
Die intensive Einführung von Alipay-KI-Produkten spiegelt die umfassende Beschleunigung der KI-First-Strategie der Ant Group wider. Im November 2023 stellte Ant das selbst entwickelte Bailing-Großmodell vor. Seit September dieses Jahres wurden nacheinander die drei KI-Anwendungen Zhi Xiaobao, Ma Xiaocai und der KI-Gesundheitsmanager sowie die Plattform für die Entwicklung intelligenter Agenten „Toolbox“ vorgestellt, um ein offenes KI-Service-Ökosystem aufzubauen.