【AI दैनिक समाचार】 खंड में आपका स्वागत है! यह आपका दैनिक मार्गदर्शक है जो आपको कृत्रिम बुद्धिमत्ता की दुनिया का पता लगाने में मदद करेगा। हम प्रतिदिन आपके लिए AI क्षेत्र की नवीनतम खबरें, डेवलपर्स पर फोकस, तकनीकी रुझानों की जानकारी और नवीन AI उत्पादों के अनुप्रयोगों के बारे में जानकारी लेकर आते हैं।

नए AI उत्पादों के बारे में जानने के लिए यहाँ क्लिक करें: https://top.aibase.com/

1. चीन की कंपनी ने चीनी अक्षरों को उत्पन्न करने वाला पहला ओपन-सोर्स टेक्स्ट-टू-इमेज मॉडल CogView4 जारी किया

4 मार्च, 2025 को, बीजिंग स्थित झिपु हुआझांग टेक्नोलॉजी कंपनी लिमिटेड ने CogView4 लॉन्च किया, जो चीनी अक्षरों को उत्पन्न करने वाला पहला ओपन-सोर्स टेक्स्ट-टू-इमेज मॉडल है। इसमें शक्तिशाली द्विभाषी इनपुट और छवि निर्माण क्षमता है। इस मॉडल ने DPG-Bench बेंचमार्क परीक्षण में पहला स्थान प्राप्त किया है, जो ओपन-सोर्स टेक्स्ट-टू-इमेज मॉडल में SOTA बन गया है। यह किसी भी रिज़ॉल्यूशन और जटिल सिमेंटिक संरेखण का समर्थन करता है, और विज्ञापन और लघु वीडियो जैसे क्षेत्रों की आवश्यकताओं को पूरा करता है।

image.png

【AiBase सारांश:】

🎨 CogView4 चीनी अक्षरों को उत्पन्न करने वाला पहला ओपन-सोर्स टेक्स्ट-टू-इमेज मॉडल है, जिसमें शक्तिशाली द्विभाषी इनपुट क्षमता है।

🚀 इस मॉडल ने DPG-Bench बेंचमार्क परीक्षण में पहला स्थान प्राप्त किया है, जो ओपन-सोर्स टेक्स्ट-टू-इमेज मॉडल में SOTA बन गया है।

🔧 CogView4 Apache2.0 लाइसेंस का समर्थन करता है, और आगे चलकर इसमें पारिस्थितिकी समर्थन और मॉडल फाइन-ट्यूनिंग टूलकिट जोड़े जाएंगे।

अधिक जानकारी:https://github.com/THUDM/CogView4

2. बड़ी खबर! MiniMax ने एक नया इमेज जेनरेशन मॉडल Image-01 लॉन्च किया, जिसकी लागत केवल 1/10 है

MiniMax ने हाल ही में अपना पहला टेक्स्ट-टू-इमेज जेनरेशन मॉडल Image-01 लॉन्च किया है, जो AI इमेज जेनरेशन तकनीक में एक नई उपलब्धि है। यह मॉडल अपनी उत्कृष्ट प्रॉम्प्ट नियंत्रण क्षमता और दृश्य रचना क्षमता के लिए जाना जाता है। उपयोगकर्ता तार्किक और कलात्मक छवियां बना सकते हैं। इसके अलावा, Image-01 के कुशल बैच प्रोसेसिंग फ़ंक्शन और प्रतिस्पर्धी मूल्य के कारण, पेशेवर स्तर के AI निर्माण को और अधिक सुलभ बनाया गया है। उपयोगकर्ता कम लागत पर फ़िल्मी गुणवत्ता वाली छवियों का अनुभव कर सकते हैं, जिससे उनकी रचनात्मकता का दायरा बढ़ता है।

image.png

【AiBase सारांश:】

🌟 Image-01 एक नया टेक्स्ट-टू-इमेज जेनरेशन मॉडल है, जिसका उद्देश्य उपयोगकर्ताओं की रचनात्मकता का दायरा बढ़ाना है।

🎨 इस मॉडल में सटीक प्रॉम्प्ट नियंत्रण और उत्कृष्ट दृश्य रचना क्षमता है, जो तार्किक और कलात्मक छवियां उत्पन्न कर सकता है।

💰 Image-01 की लागत समान उत्पादों की तुलना में दसवां हिस्सा है, जिससे पेशेवर स्तर के AI निर्माण को और अधिक सुलभ बनाया गया है।

अधिक जानकारी:https://www.minimax.io/platform/login

3. टेनसेंट युआनबाओ ने DeepSeek को पीछे छोड़कर Apple के फ्री ऐप डाउनलोड चार्ट में पहला स्थान हासिल किया

टेनसेंट युआनबाओ ने Apple चीन के ऐप स्टोर के फ्री ऐप डाउनलोड चार्ट में एक उल्लेखनीय उपलब्धि हासिल की है और DeepSeek को पीछे छोड़कर सबसे अधिक डाउनलोड किए जाने वाले ऐप बन गया है। टेनसेंट ने प्रचार और तकनीकी उन्नयन को बढ़ाकर युआनबाओ की दृश्यता और आकर्षण को बढ़ाया है, खासकर WeChat प्लेटफॉर्म पर एकीकरण के मामले में, जिससे उपयोगकर्ता अनुभव में काफी सुधार हुआ है।

image.png

【AiBase सारांश:】

📊 टेनसेंट युआनबाओ ने DeepSeek को पीछे छोड़कर Apple के फ्री ऐप डाउनलोड चार्ट में पहला स्थान हासिल किया है।

📱 टेनसेंट ने युआनबाओ के प्रचार को बढ़ाया है, खासकर WeChat प्लेटफॉर्म पर।

🚀 तकनीकी उन्नयन और फ़ंक्शन ऑप्टिमाइज़ेशन ने युआनबाओ के तेजी से विकास को सुनिश्चित किया है।

4. मिता AI सर्च ने "वीडियो" सर्च फ़ंक्शन लॉन्च किया

3 मार्च, 2025 को, शंघाई स्थित मिता नेटवर्क टेक्नोलॉजी कंपनी लिमिटेड ने एक नया AI सर्च फ़ंक्शन लॉन्च किया, जिसमें वीडियो सर्च मॉड्यूल जोड़ा गया है। यह फ़ंक्शन बड़ी मात्रा में वीडियो सामग्री का विश्लेषण करके उपयोगकर्ताओं को आवश्यक शिक्षण और मनोरंजन वीडियो को अधिक कुशलतापूर्वक खोजने में मदद करता है। उपयोगकर्ता रुचि के वीडियो को जल्दी से ढूंढ सकते हैं, जिससे सर्च अनुभव बेहतर होता है।

image.png

【AiBase सारांश:】

🎥 वीडियो सर्च मॉड्यूल जोड़ा गया है, जो मल्टी-मॉडल डेटा को कवर करता है और उपयोगकर्ता अनुभव को बेहतर बनाता है।

🔍 उपयोगकर्ता जल्दी से रुचि के वीडियो कंटेंट जैसे पाठ्यक्रम या विज्ञापन विश्लेषण को ढूंढ सकते हैं।

🚀 DeepSeek R1 इन्फ्रेंस मॉडल को जोड़ा गया है, जिससे सर्च की बुद्धिमत्ता और बढ़ी है।

5. शहर के मॉडलिंग में क्रांति! AI द्वारा जनरेट किया गया 3D शहर मॉडल GaussianCity, 60 गुना तेज गति से निर्माण!

नैनीयांग टेक्नोलॉजिकल यूनिवर्सिटी की शोध टीम द्वारा विकसित GaussianCity तकनीक ने 3D शहर मॉडल निर्माण के क्षेत्र में एक उल्लेखनीय सफलता हासिल की है। इस तकनीक ने निर्माण की गति को 60 गुना बढ़ा दिया है और सीमा रहित 3D शहर निर्माण का समर्थन करता है, जिसे CVPR2025 में स्वीकार किया गया है। GaussianCity ने एक नवीन BEV-Point प्रतिनिधित्व विधि और स्थानिक जागरूकता वाले गॉसियन एट्रिब्यूट डिकोडर का उपयोग किया है, जिससे गणना दक्षता और स्केलेबिलिटी में काफी सुधार हुआ है।

image.png

【AiBase सारांश:】

🚀 GaussianCity तकनीक ने निर्माण की गति को 60 गुना बढ़ा दिया है, पारंपरिक विधियों की सीमाओं को तोड़ दिया है।

🌆 BEV-Point प्रतिनिधित्व विधि का उपयोग करके, VRAM की आवश्यकता को कम किया गया है, जिससे सीमा रहित 3D शहर निर्माण संभव हुआ है।

📈 यह तकनीक ओपन-सोर्स है, जो वर्चुअल रियलिटी, स्व-चालित ड्राइविंग और शहर नियोजन जैसे क्षेत्रों में नई संभावनाएँ लाती है।

अधिक जानकारी:https://github.com/hzxie/GaussianCity

6. सुरक्षा खतरों से सावधान रहें! ओल्लामा बड़े मॉडल टूल में गंभीर सुरक्षा कमियाँ पाई गई हैं

राष्ट्रीय साइबर सुरक्षा सूचना केंद्र ने हाल ही में ओपन-सोर्स क्रॉस-प्लेटफ़ॉर्म बड़े मॉडल टूल ओल्लामा के लिए एक सुरक्षा चेतावनी जारी की है, जिसमें बताया गया है कि डिफ़ॉल्ट कॉन्फ़िगरेशन में गंभीर सुरक्षा कमियाँ हैं, जिससे अनधिकृत पहुँच और मॉडल चोरी जैसे जोखिम हो सकते हैं। विशेषज्ञों के विश्लेषण से पता चला है कि निजी तौर पर तैनात उपयोगकर्ताओं को अधिक जोखिम है, हमलावर इन कमियों का उपयोग डेटा लीक और सेवा व्यवधान जैसे हमलों के लिए कर सकते हैं।

image.png

【AiBase सारांश:】

🔍 ओल्लामा की सुरक्षा कमियाँ डिफ़ॉल्ट कॉन्फ़िगरेशन में गंभीर हैं, खासकर निजी तौर पर तैनात उपयोगकर्ताओं के लिए जोखिम अधिक है।

💻 हमलावर अनधिकृत पहुँच का उपयोग मॉडल जानकारी चुराने और सेवा व्यवधान के लिए कर सकते हैं, जिससे भारी नुकसान हो सकता है।

🛡️ उपयोगकर्ताओं को सुरक्षा जागरूकता बढ़ानी चाहिए, समय पर समस्याओं की जाँच करनी चाहिए और हमले के संकेत मिलने पर तुरंत संबंधित विभागों को सूचित करना चाहिए।

7. बेहद शक्तिशाली वीडियो जेनरेशन मॉडल Wan2.1 GP: कम क्षमता वाले GPU पर भी बड़ी फ़िल्में बनाएँ!

DeepBeepMeep टीम द्वारा विकसित Wan2.1GP कम क्षमता वाले GPU उपयोगकर्ताओं के लिए अनुकूलित एक वीडियो जेनरेशन मॉडल है, जो अलीबाबा के Wan2.1 पर आधारित है, जिसका उद्देश्य उच्च प्रदर्शन वाले GPU संसाधनों की कमी वाले उपयोगकर्ताओं को शक्तिशाली वीडियो जेनरेशन क्षमता प्रदान करना है। इस मॉडल ने कई बेंचमार्क परीक्षणों में उत्कृष्ट प्रदर्शन किया है, कई प्रकार के जेनरेशन कार्यों का समर्थन करता है और इसमें चीनी और अंग्रेजी पाठ जेनरेशन क्षमता है, जो वीडियो जेनरेशन तकनीक में एक महत्वपूर्ण प्रगति है।

image.png

【AiBase सारांश:】

👍 SOTA प्रदर्शन: Wan2.1GP ने कई बेंचमार्क परीक्षणों में उत्कृष्ट प्रदर्शन किया है, मौजूदा ओपन-सोर्स और वाणिज्यिक समाधानों को पार कर गया है।

🖥️ उच्च संगतता: केवल 8.19GB VRAM की आवश्यकता है, लगभग सभी उपभोक्ता-स्तरीय GPU का समर्थन करता है, कम क्षमता वाले उपयोगकर्ताओं के लिए उपयुक्त है।

📜 मल्टी-टास्क समर्थन: टेक्स्ट-टू-वीडियो, इमेज-टू-वीडियो जैसे कई प्रकार के जेनरेशन कार्यों का समर्थन करता है और इसमें चीनी और अंग्रेजी पाठ जेनरेशन क्षमता है।

अधिक जानकारी:https://github.com/deepbeepmeep/Wan2GP

8. हुआशान इंजन ने बड़े मॉडल अनुप्रयोगों को ओपन-सोर्स करने की घोषणा की: "बड़े मॉडल अनुप्रयोग प्रयोगशाला" लॉन्च की, AI नवाचार क्षमता को मुक्त किया

हुआशान इंजन ने X प्लेटफ़ॉर्म के माध्यम से बड़े मॉडल अनुप्रयोगों को आधिकारिक तौर पर ओपन-सोर्स करने और एक नया "बड़े मॉडल अनुप्रयोग प्रयोगशाला" प्लेटफ़ॉर्म लॉन्च करने की घोषणा की है। यह कदम AI तकनीकी पारिस्थितिकी तंत्र निर्माण में एक महत्वपूर्ण सफलता है, जिसका उद्देश्य डेवलपर समुदाय के नवाचार को तेज करना है। ओपन-सोर्स अनुप्रयोगों में मोबाइल असिस्टेंट, Deep Research जैसे अत्याधुनिक AI उपकरण शामिल हैं, जिन्हें उपयोगकर्ताओं द्वारा व्यापक रूप से चर्चा की जा रही है, जो हुआशान इंजन की तकनीकी अग्रणी स्थिति को दर्शाते हैं।

image.png

【AiBase सारांश:】

📱 ओपन-सोर्स अनुप्रयोगों में मोबाइल असिस्टेंट, Deep Research आदि शामिल हैं, जो कई प्रकार के AI उपकरण प्रदान करते हैं और डेवलपर्स के नवाचार को बढ़ावा देते हैं।