30 दिसंबर को, अलीबाबा ने नई पीढ़ी के AI दृश्य खोज उत्पाद "टैंग यिक्सिया" को लॉन्च किया, जो स्व-निर्मित बहु-मोडल बड़े मॉडल प्रौद्योगिकी पर आधारित है, जो "AI की आँखों से सभी चीजों का अन्वेषण" करने में सक्षम है, और तेजी से, उपयोगी और मजेदार जनरेटिव खोज सेवाएं प्रदान करता है।

जब उपयोगकर्ताओं को किसी चीज़ में रुचि होती है, तो वे AI को कैमरे के माध्यम से पहचानने के लिए कह सकते हैं, जैसे फूल, पौधे, पालतू जानवर और ट्रेंडिंग वस्तुएं, यात्रा के दौरान व्यक्तिगत व्याख्या प्रदान करना, उत्पादों और दवाओं की जानकारी की जांच करना, आदि। इसके अलावा, यह मजेदार तरीके से पालतू जानवरों और बच्चों की तस्वीरों का व्याख्या कर सकता है, जिससे तस्वीरें साझा करने में कैप्शन की चिंता नहीं रहती। वर्तमान में, यह उत्पाद अलीबाबा पर लाइव है, और होमपेज पर "स्कैन करें" पर क्लिक करके बाएं स्वाइप करके इसे पाया जा सकता है, और ज़ी शियाओ बाओ ऐप में भी जल्दी पहुंचा जा सकता है।

2024 के बाद से, अलीबाबा ने लगातार "ज़ी शियाओ बाओ" जैसे AI स्वतंत्र एप्लिकेशन और स्मार्ट एजेंट विकास प्लेटफार्मों को लॉन्च किया है, और इस बार AI दृश्य बहु-मोडल क्षेत्र पर ध्यान केंद्रित करते हुए "टैंग यिक्सिया" पेश किया है, जो अलीबाबा के केंद्र में एंट ग्रुप की AI रणनीति के तेजी से विकास को दर्शाता है।

11.png

AI को आँखें दें, अपने आस-पास की दुनिया का अन्वेषण करें

हाल के वर्षों में, जनरेटिव आर्टिफिशियल इंटेलिजेंस तेजी से विकसित हुआ है, और बहु-मोडल तकनीक दृश्य को डिजिटल सेवाओं का नया प्रवेश बिंदु बना रही है। बताया गया है कि अलीबाबा "टैंग यिक्सिया" लॉन्च कर रहा है, जो चाहता है कि AI सामान्य लोगों की "जिज्ञासा की आँख" बने, जो उन्हें अपने आस-पास की सभी चीजों का अन्वेषण करने में मदद करे, और AI द्वारा चित्र पहचानने के साथ-साथ खोजने, सृजन करने और इंटरैक्ट करने की अनुमति देता है।

पारंपरिक AI दृश्य खोज उत्पादों से अलग, "टैंग यिक्सिया" AI चित्र पहचान के माध्यम से तेजी से उपयोगी जानकारी प्रदान कर सकता है, और उपयोगकर्ता की रुचियों और परिस्थितियों की गहरी समझ के आधार पर, अधिक मजेदार दृश्य व्याख्या और विविध स्मार्ट सेवाएं प्रदान कर सकता है।

अनुभव के बाद, "टैंग यिक्सिया" वर्तमान में तीन प्रमुख सेवाएं प्रदान करता है: ज्ञान की खोज, प्रेरणा की खोज, और पाठ की खोज।

जब उपयोगकर्ता किसी चीज़ का वर्णन करने के लिए शब्दों का उपयोग नहीं कर पाते, तो "ज्ञान की खोज" के माध्यम से AI चित्र पहचानने में सक्षम होता है, और नए ज्ञान को तुरंत प्राप्त कर सकता है।

उदाहरण के लिए, जो लोग बाहरी गतिविधियों और यात्रा को पसंद करते हैं, वे अनजान फूलों, कीड़ों, खाद्य पदार्थों, इमारतों, प्रदर्शनी वस्तुओं आदि को देखकर संबंधित जानकारी आसानी से प्राप्त कर सकते हैं, और एक "स्मार्ट गाइड" का आनंद ले सकते हैं।

युवा लोग यदि उन्हें पसंदीदा फिगर या ट्रेंडिंग खिलौने मिलते हैं, तो वे इसके माध्यम से जानकारी प्राप्त कर सकते हैं; माता-पिता भी इसका उपयोग करके 68 प्रकार के ऑल्टमैन को पहचान सकते हैं, जिससे उन्हें बच्चों के सवालों से परेशान नहीं होना पड़ेगा।

22.png

नेटिज़न्स ने "टैंग यिक्सिया" का उपयोग करके ऑल्टमैन की पहचान की

जब विदेशी उत्पादों के बारे में जानकारी नहीं समझ में आती, तो "टैंग यिक्सिया" से विवरण प्राप्त किया जा सकता है, जिससे ऑनलाइन समान खरीदने में आसानी होती है; घर में यदि दवा के पैकेट का मैनुअल खो गया हो, तो न केवल विस्तृत जानकारी प्राप्त की जा सकती है, बल्कि अलीबाबा के "AI स्वास्थ्य प्रबंधक" से भी अधिक दवा संबंधी जानकारी पूछी जा सकती है।

33.png

जनरेटिव AI की विशेषताओं के आधार पर, "प्रेरणा की खोज" दृश्य फ़िल्टर को सक्रिय कर सकती है, जिससे AI मजेदार व्याख्या प्रदान कर सकता है, और तस्वीरें साझा करने में कैप्शन की चिंता नहीं रहती।

उदाहरण के लिए, जो लोग घर में पालतू जानवर रखते हैं, वे अपने प्यारे पालतू जानवरों की तस्वीरें ले सकते हैं और "दिल की कहानी" तैयार कर सकते हैं, जिससे उनके प्यारे जानवरों को और भी भावुकता से बोलने का मौका मिलता है; जो माता-पिता अपने बच्चों की तस्वीरें साझा करने के शौकीन हैं, वे AI से अपने बच्चों के प्रति अपनी छोटी सी प्रेम भरी भावनाओं की व्याख्या करने में मदद ले सकते हैं।

44.png

इसके अलावा, जब विदेश यात्रा या विदेशी भाषा सीखते समय, यदि समझ में न आने वाले विदेशी मेनू, साइनबोर्ड आदि मिलते हैं, तो "पाठ की खोज" के माध्यम से मूल पाठ को पहचानना और अनुवाद करना आसान हो सकता है।

AI दृश्य खोज को नया रूप दें, अलीबाबा AI की गति को तेज करें

अतीत में, खोज मुख्य रूप से कीवर्ड मिलान के माध्यम से संबंधित परिणामों को लौटाने पर निर्भर थी। नई पीढ़ी के जनरेटिव AI दृश्य खोज उत्पाद "टैंग यिक्सिया" द्वारा प्रदान की जाने वाली सेवा केवल सरल खोज लिंक नहीं है, बल्कि बहु-मोडल बड़े मॉडल की दृश्य समझ और सृजनात्मकता के आधार पर अधिक स्मार्ट, समृद्ध और इंटरैक्टिव सेवा अनुभव प्रदान करती है।

संबंधित आंकड़ों के अनुसार, मानवता द्वारा प्राप्त जानकारी का 80% से अधिक दृश्य से आता है, और दृश्य पर केंद्रित आर्टिफिशियल इंटेलिजेंस उत्पादों से मानव और AI के बीच इंटरैक्शन की बाधाएं काफी कम हो जाती हैं, और AI के अधिक अनुप्रयोग परिदृश्यों को अनलॉक किया जा सकता है, जिससे "जो देखा गया है वही खोजा गया है, जो देखा गया है वही सेवा है" को साकार किया जा सके। विदेशों में, गूगल द्वारा लॉन्च किए गए Google Lens का हर महीने 20 अरब से अधिक दृश्य खोज कॉल का उपयोग होता है; एप्पल ने भी इस साल "विज़ुअल इंटेलिजेंस" नामक एक नई सुविधा पेश की है, जो उपयोगकर्ताओं को अपने मोबाइल कैमरे के माध्यम से "जो देखा गया है उसे तुरंत समझने" में मदद करती है।

दुनिया के करोड़ों उपयोगकर्ताओं के डिजिटल जीवन के ओपन प्लेटफॉर्म के रूप में, अलीबाबा द्वारा "टैंग यिक्सिया" AI दृश्य खोज उत्पाद का लॉन्च और इसे "स्कैन करें" के मुख्य प्रवेश बिंदु में शामिल करना, वास्तव में उत्पादों को निरंतर नवीनीकरण के माध्यम से, AI को हर किसी के जीवन को उतना ही सुविधाजनक बनाने की उम्मीद है जितना कि स्कैन और भुगतान करना—सिर्फ एक बुद्धिमान संवाद करने वाला दिमाग, कार्य करने वाले हाथ-पैर नहीं, बल्कि अपने आस-पास की दुनिया का अन्वेषण करने वाली आँखें भी।

अलीबाबा AI उत्पादों की तेजी से पेशकश के पीछे, एंट ग्रुप की AI फर्स्ट रणनीति की तेजी से प्रगति है। नवंबर 2023 में, एंट ने अपने स्व-निर्मित बाईलिंग बड़े मॉडल को लॉन्च किया, और सितंबर से, इसने लगातार ज़ी शियाओ बाओ, मा शियाओ काई, AI स्वास्थ्य प्रबंधक तीन प्रमुख AI एप्लिकेशन और स्मार्ट एजेंट विकास प्लेटफॉर्म "बाईबाओक्स" को पेश किया है, जो एक ओपन AI सेवा पारिस्थितिकी तंत्र का निर्माण करने की गति को तेज कर रहा है।