आपका स्वागत है 【AI दैनिक】 कॉलम में! यहां आपकी रोज़ाना आर्टिफिशियल इंटेलिजेंस की दुनिया की खोज करने के लिए मार्गदर्शिका है, हर दिन हम आपको AI क्षेत्र की गर्म सामग्री प्रस्तुत करते हैं, डेवलपर्स पर ध्यान केंद्रित करते हैं, तकनीकी रुझानों को समझने में आपकी मदद करते हैं और नवीन AI उत्पादों के अनुप्रयोगों के बारे में जानकारी देते हैं।

नए AI उत्पादों के बारे में जानने के लिए क्लिक करें: https://top.aibase.com/

1. फ़्लक्स 1.1Pro से आगे की छवि क्षमताएँ! रहस्यमय AI मॉडल रेड पांडा का उदय

red_panda नामक एक रहस्यमय AI इमेज जनरेशन मॉडल ने आर्टिफिशियल एनालिसिस के बेंचमार्क परीक्षण में आश्चर्यजनक प्रदर्शन किया, उद्योग के अग्रणी उत्पादों को पीछे छोड़ दिया। यह टेक्स्ट-टू-इमेज परीक्षण में 1244 अंकों के साथ पहले स्थान पर है, जो तकनीकी लाभ और उच्च दक्षता को दर्शाता है। रेड पांडा की वास्तविकता की छवियाँ पारंपरिक AI कार्यों से परे हैं, उत्कृष्ट टेक्स्ट प्रॉम्प्ट की समझ और निष्पादन क्षमता को प्रदर्शित करती हैं। रेड पांडा का उदय उद्योग मानकों को बढ़ाने में सहायक बना है, जो ध्यान आकर्षित कर रहा है।

1.png

【AiBase सारांश:】

🚀 रेड पांडा AI मॉडल बेंचमार्क परीक्षण में 1244 अंकों के साथ पहले स्थान पर, उद्योग के अग्रणी उत्पादों को पीछे छोड़ दिया।

💡 रेड पांडा द्वारा उत्पन्न छवियाँ अत्यधिक वास्तविकता की हैं, पारंपरिक AI कार्यों को पीछे छोड़ दिया।

🔗 रेड पांडा का उदय उद्योग मानकों को बढ़ाने में सहायक बना है, जो ध्यान आकर्षित कर रहा है।

विवरण लिंक: https://artificialanalysis.ai/text-to-image/arena

2. xAI ने Grok में छवि समझने की क्षमता जोड़ी, मेमेस की हास्य समझ भी कर सकता है

एलन मस्क की xAI कंपनी ने हाल ही में अपने AI मॉडल Grok में छवि समझने की क्षमता जोड़ी है, जिससे उपयोगकर्ता चित्र अपलोड करके AI सहायक से प्रश्न पूछ सकते हैं। मस्क ने Grok की नई क्षमताएँ प्रदर्शित कीं, जिसमें चित्र की सामग्री और हास्य तत्वों को समझना शामिल है। यह सुविधा अभी भी प्रारंभिक चरण में है, और टीम निरंतर सुधार कर रही है। xAI ने ब्लैक फॉरेस्ट लैब्स के साथ सहयोग करके मल्टीमॉडल समझने की क्षमता जोड़ी है, जिससे उपयोगकर्ता अनुभव और डेवलपर API को बढ़ावा मिलता है।

QQ20241029-104045.png

【AiBase सारांश:】

✨ छवि समझने की क्षमता: Grok अब चित्र की सामग्री और हास्य तत्वों को समझ सकता है।

🚀 फ़ीचर विस्तार: Grok-2 मॉडल लॉन्च होने के बाद, xAI ने निरंतर फ़ीचर विस्तार किया है, FLUX.1 मॉडल के साथ मिलकर छवि उत्पादन किया है।

🔥 उपयोगकर्ता अनुभव में सुधार: मल्टीमॉडल समझने की क्षमता जोड़ी गई है, मस्क ने जल्दी ही दस्तावेज़ प्रसंस्करण की आवश्यकताओं को पूरा करने का वादा किया है।

3. फिर से खेला जाएगा! PixVerse V3 अपग्रेड: न केवल AI चुटकी ले सकता है, बल्कि कपों को पैर भी दे सकता है

PixVerse V3 संस्करण ने सभी दिशाओं में कार्यात्मकता का उन्नयन लाया है, जिससे रचनाकारों को अधिक पेशेवर और मजेदार अनुभव मिलता है। वीडियो विशेष प्रभावों से लेकर शैली कार्यों तक और वीडियो विस्तार तक, सभी में महत्वपूर्ण सुधार किया गया है, जो सामग्री निर्माताओं को अधिक व्यापक और पेशेवर वीडियो निर्माण मंच प्रदान करता है।

【AiBase सारांश:】

✨ वीडियो विशेष प्रभावों का उन्नयन: नए हैलोवीन थीम विशेष प्रभाव जोड़े गए हैं, संचालन सरल और स्पष्ट है, त्यौहार निर्माण सामग्री को समृद्ध करता है।

🎨 शैली कार्यों का उन्नयन: एनिमेशन, 3D एनिमेशन, मिट्टी और यथार्थवाद चार शैलियों का समर्थन करता है, जिन्हें विभिन्न परिदृश्यों में लागू किया जा सकता है।

🔥 वीडियो विस्तार की क्षमता: उपयोगकर्ता अतिरिक्त 5-8 सेकंड की सामग्री जोड़ सकते हैं, नए खंड की सामग्री दिशा को सटीक रूप से नियंत्रित कर सकते हैं, और लगातार क्रियाकलाप दृश्य उत्पन्न कर सकते हैं।

विवरण लिंक: https://app.pixverse.ai/home

4. गूगल जीमेल वेब संस्करण पर AI फ़ीचर लॉन्च “मुझे लिखने में मदद करें”, ईमेल लेखन को और आसान बनाता है

गूगल ने वेब संस्करण जीमेल पर “मुझे लिखने में मदद करें” फ़ीचर लॉन्च किया है, जो उपयोगकर्ताओं को Gemini AI का उपयोग करके ईमेल लिखने और संपादित करने में मदद करता है, जिससे ईमेल लेखन की सुविधा और दक्षता में वृद्धि होती है। यह फ़ीचर केवल Google One AI प्रीमियम की सदस्यता लेने वाले या Gemini Workspace प्लगइन वाले उपयोगकर्ताओं के लिए उपलब्ध है, जो उपयोगकर्ताओं को व्यक्तिगत ईमेल लेखन अनुभव प्रदान करता है। नया “सुधार” शॉर्टकट उपयोगकर्ताओं को ईमेल सामग्री को तेजी से अनुकूलित करने की अनुमति देता है, जिससे ईमेल की गुणवत्ता में और सुधार होता है।

image.png

【AiBase सारांश:】

🌟 “मुझे लिखने में मदद करें” फ़ीचर वेब संस्करण जीमेल पर लॉन्च किया गया, जो उपयोगकर्ताओं को ईमेल लिखने और संपादित करने में Gemini AI की मदद करता है।

🔑 यह केवल Google One AI प्रीमियम की सदस्यता लेने वाले या Gemini Workspace प्लगइन वाले उपयोगकर्ताओं के लिए उपलब्ध है।

⚡ नया “सुधार” शॉर्टकट उपयोगकर्ताओं को ईमेल सामग्री को तेजी से अनुकूलित करने की सुविधा देता है।

5. वीडियो समझने के क्षेत्र में नया चेहरा! Video-XL यह मॉडल एक घंटे तक के वीडियो को संभाल सकता है!

Video-XL एक सुपर लंबे दृश्य भाषा मॉडल है जिसे कुशलता से घंटों के वीडियो को समझने के लिए डिज़ाइन किया गया है, जो “दृश्य संदर्भ संभावित सारांश” तकनीक का उपयोग करके लंबे वीडियो की सामग्री को संक्षिप्त रूप में संकुचित करता है, दक्षता बढ़ाता है और महत्वपूर्ण जानकारी को बनाए रखता है। यह कई लंबे वीडियो समझ बेंचमार्क परीक्षणों में उत्कृष्ट प्रदर्शन करता है, दक्षता और प्रभावशीलता के बीच संतुलन बनाता है। इसके अनुप्रयोग की संभावनाएँ विशाल हैं, जैसे फिल्म सारांश, निगरानी में असामान्यताओं का पता लगाना और विज्ञापन इम्प्लांट पहचान।

【AiBase सारांश:】

🚀 Video-XL विशेष रूप से सुपर लंबे वीडियो को संभालने के लिए डिज़ाइन किया गया एक लंबा दृश्य भाषा मॉडल है, जो दृश्य संदर्भ संभावित सारांश तकनीक का उपयोग करके वीडियो सामग्री को संकुचित करता है।

💡 Video-XL कई लंबे वीडियो समझ बेंचमार्क परीक्षणों में अग्रणी प्रदर्शन करता है, विशेष रूप से VNBench परीक्षण में लगभग 10% अधिक सटीकता के साथ।

⚙️ Video-XL दक्षता और प्रभावशीलता के बीच संतुलन बनाता है, एकल 80GB GPU पर 2048 फ्रेम वीडियो को संभालता है, जबकि लगभग 95% सटीकता बनाए रखता है।

विवरण लिंक: https://github.com/VectorSpaceLab/Video-XL

6. एप्पल iOS18.2 की पुष्टि दिसंबर में होगी, Siri में ChatGPT का समावेश होगा

एप्पल ने घोषणा की है कि वह दिसंबर में iOS18.2, iPadOS18.2 और macOS Sequoia15.2 सिस्टम अपडेट लॉन्च करेगा, जिसमें क्रांतिकारी AI फ़ीचर उन्नयन शामिल हैं, जिसमें Siri पहली बार ChatGPT से जुड़ जाएगा, जो उपयोगकर्ताओं को अधिक बुद्धिमान और सुविधाजनक अनुभव प्रदान करेगा। सिस्टम उपयोगकर्ता गोपनीयता की सुरक्षा पर जोर देता है, शीर्ष AI तकनीकों और हार्डवेयर लाभों का एकीकरण करता है, जो एप्पल के AI क्षेत्र में महत्वाकांक्षा को प्रदर्शित करता है।

image.png

【AiBase सारांश:】

🔍 Siri पहली बार ChatGPT से जुड़ेगी, उपयोगकर्ताओं को अतिरिक्त खाता पंजीकरण की आवश्यकता नहीं होगी।

📝 ChatGPT को सिस्टम लेखन उपकरण में एकीकृत किया जाएगा, जो रचनात्मक क्षमताओं को बढ़ाता है।

🔒 एप्पल ने उपयोगकर्ता गोपनीयता की सुरक्षा के लिए कड़े सुरक्षा उपाय किए हैं, ChatGPT उपयोग रिकॉर्ड को नहीं रखता।

7. रिपोर्ट्स के अनुसार, मेटा अपने AI सर्च इंजन का विकास कर रहा है, गूगल पर निर्भरता कम करने के लिए

हाल ही में, रिपोर्टों के अनुसार, मेटा एक नए आर्टिफिशियल इंटेलिजेंस सर्च इंजन का विकास कर रहा है, जिसका उद्देश्य गूगल और माइक्रोसॉफ्ट पर निर्भरता को कम करना है। यह कदम मेटा के चैटबॉट को AI द्वारा उत्पन्न ताज़ा सारांश प्रदान करेगा, जो सूचना प्राप्त करने के क्षेत्र में और गहराई से प्रवेश करेगा। तकनीकी दिग्गजों के बीच प्रतिस्पर्धा बढ़ती जा रही है, मेटा, एप्पल, OpenAI जैसी कंपनियाँ उपयोगकर्ताओं की आवश्यकताओं को पूरा करने के लिए नवाचार उत्पाद लॉन्च कर रही हैं।

【AiBase सारांश:】

🌐 मेटा AI सर्च इंजन का विकास कर रहा है, गूगल पर निर्भरता कम करने के लिए।

🤖 नया सर्च इंजन मेटा के चैटबॉट को AI द्वारा उत्पन्न ताज़ा सारांश प्रदान करेगा।

📰 मेटा ने रॉयटर्स के साथ सहयोग किया है, जिससे चैटबॉट को उसके समाचार लेखों का उपयोग करके उत्तर देने की अनुमति मिलती है।

8. Zhiyuan ने OmniGen नामक सर्व-क्षमता दृश्य जनरेशन मॉडल लॉन्च किया, जो कई क्षमताओं को एकीकृत करता है

बीजिंग Zhiyuan आर्टिफिशियल इंटेलिजेंस अनुसंधान संस्थान (BAAI) ने OmniGen नामक नए सर्व-क्षमता दृश्य जनरेशन मॉडल को लॉन्च किया है, जो छवि जनरेशन क्षेत्र में एक महत्वपूर्ण प्रगति का प्रतीक है। OmniGen एकता, सरलता और क्रॉस-टास्क ज्ञान स्थानांतरण क्षमताओं के लिए जाना जाता है, जो कई छवि जनरेशन कार्यों को संभाल सकता है, जिसमें टेक्स्ट-टू-इमेज, छवि संपादन, थीम-चालित जनरेशन और दृश्य शर्त जनरेशन शामिल हैं। मॉडल की संरचना सरल है, उपयोगकर्ता के अनुकूल संचालन है, बिना प्लगइन या जटिल चरणों की आवश्यकता के, यह प्रभावी रूप से क्रॉस-टास्क ज्ञान स्थानांतरित करता है और नए कार्यों को प्रदर्शित करता है।

image.png

【AiBase सारांश:】

🌟 OmniGen मॉडल कई क्षमताओं को एकीकृत करता है, जो कई छवि जनरेशन कार्यों को संभालता है।

🔑 मॉडल की संरचना सरल है, उपयोगकर्ता के अनुकूल संचालन है, अतिरिक्त प्लगइन की आवश्यकता नहीं है, जटिल कार्यों को पूरा कर सकता है।

💡 OmniGen ओपन-सोर्स वेट्स और कोड प्रदान करता है, बड़े पैमाने पर एकीकृत छवि जनरेशन डेटासेट X2I का निर्माण करता है, जो सामान्य छवि जनरेशन क्षेत्र के विकास को बढ़ावा देता है।

विवरण लिंक: https://arxiv.org/pdf/2409.11340

9. एक क्रांतिकारी ओपन-सोर्स प्रोजेक्ट: मोबाइल पर भी चलने योग्य हल्का डिजिटल मानव आ गया है

हाल ही में, Ultralight-Digital-Human नामक एक ओपन-सोर्स प्रोजेक्ट ने डिजिटल मानव तकनीक के मोबाइल डिप्लॉयमेंट की समस्या को सफलतापूर्वक हल किया है, जिससे सामान्य स्मार्टफोन भी रीयल-टाइम में डिजिटल मानव अनुप्रयोग चला सकते हैं, संबंधित तकनीक के प्रसार के लिए नए संभावनाएं लाते हैं। यह प्रोजेक्ट नवीनतम गहरे शिक्षण तकनीकों का उपयोग करता है, एल्गोरिदम ऑप्टिमाइजेशन और मॉडल संकुचन के माध्यम से, सफलतापूर्वक विशाल डिजिटल मानव प्रणाली को इस स्तर तक पतला करता है कि यह मोबाइल उपकरणों पर सुचारू रूप से चल सके।

【AiBase सारांश:】

🔑 नवीनतम गहरे शिक्षण तकनीक से डिजिटल मानव को मोबाइल उपकरणों पर सुचारू रूप से चलाने में सक्षम बनाता है।

🔑 Wenet और Hubert ऑडियो विशेषताओं के निष्कर्षण योजना को एकीकृत करता है, डिजिटल मानव के होंठ सिंक्रनाइज़ेशन प्रभाव को बढ़ाता है।

🔑 डेवलपर्स को अपने डिजिटल मानव मॉडल को आसानी से प्रशिक्षित करने के लिए पूर्ण प्रशिक्षण प्रक्रिया दस्तावेज़ प्रदान करता है।

विवरण लिंक: https://github.com/anliyuan/Ultralight-Digital-Human

10. यूनिवर्सल म्यूजिक और AI कंपनी ने “नैतिक” AI संगीत जनरेशन मॉडल KLayMM विकसित करने के लिए सहयोग किया

यूनिवर्सल म्यूजिक ग्रुप ने Klay Vision के साथ मिलकर नैतिक संगीत जनरेशन मॉडल KLayMM विकसित किया है, जिसका उद्देश्य सतत AI संगीत निर्माण को बढ़ावा देना है। यह सहयोग संगीत उद्योग में AI तकनीक के महत्व को दर्शाता है, नए संगीत निर्माण की दिशा को प्रदर्शित करता है।

【AiBase सारांश:】

🎶 UMG और Klay Vision ने KLayMM लॉन्च किया, जो कॉपीराइट और कलाकारों के अधिकारों का सम्मान करता है।

🤝 मॉडल संगीत उद्योग के साथ सहयोग करेगा, यह सुनिश्चित करने के लिए कि AI सामग्री सही तरीके से मान्यता प्राप्त हो और सतत विकास हो।

🌍 Klay Vision वैश्विक पारिस्थितिकी तंत्र स्थापित करता है, AI संगीत निर्माण और कॉपीराइट मुद्रीकरण को बढ़ावा देता है।

11. एप्पल ने M4 के साथ नए iMac को पेश किया, Apple Intelligence से Mac की और संभावनाएँ अनलॉक की

एप्पल ने एक नया iMac लॉन्च किया है, जो शक्तिशाली M4 चिप और Apple Intelligence के साथ है, जो सुपर स्लिम डिज़ाइन को बनाए रखता है। नया iMac 8 नवंबर को आधिकारिक रूप से बिक्री के लिए उपलब्ध होगा, जिसकी शुरुआती कीमत 1299 डॉलर है। M4 चिप महत्वपूर्ण प्रदर्शन सुधार लाती है, दैनिक उत्पादकता में 1.7 गुना वृद्धि, फोटो संपादन और गेमिंग की गति में 2.1 गुना वृद्धि। Apple Intelligence नया अनुभव लाता है, जो जनरेटिव मॉडल और गोपनीयता सुरक्षा कार्यों को मिलाकर Mac के नए तरीकों को अनलॉक करता है।