【AI दैनिक】 कॉलम में आपका स्वागत है! यह आपका दैनिक मार्गदर्शक है जो आपको कृत्रिम बुद्धिमत्ता की दुनिया का पता लगाने में मदद करता है। हम प्रतिदिन आपके लिए AI क्षेत्र की नवीनतम खबरें प्रस्तुत करते हैं, डेवलपर्स पर ध्यान केंद्रित करते हैं, और आपको तकनीकी रुझानों और नवीन AI उत्पाद अनुप्रयोगों को समझने में मदद करते हैं।
नए AI उत्पाद जानकारी के लिए क्लिक करें: https://top.aibase.com/
1. टोंगयी वान्शियांग ओपन सोर्स वीडियो जनरेशन मॉडल Wan2.1: 8.2G रैम से 480P वीडियो बनाएँ
टोंगयी वान्शियांग द्वारा हाल ही में जारी किया गया Wan2.1 मॉडल उच्च-गुणवत्ता वाले वीडियो निर्माण पर केंद्रित है। इसके उत्कृष्ट प्रदर्शन और नवीन तकनीक के साथ, यह रचनाकारों और व्यावसायिक उपयोगकर्ताओं के लिए पसंदीदा उपकरण बन गया है। इस मॉडल ने Vbench मूल्यांकन में 86.22% का उच्च स्कोर प्राप्त किया है, जो अन्य वीडियो जनरेशन मॉडल से आगे है, और इसका उल्लेखनीय प्रदर्शन प्रदर्शित करता है। Wan2.1 कुशल 3D कारण VAE मॉड्यूल और Diffusion Transformer आर्किटेक्चर के माध्यम से वीडियो जनरेशन और अनुमान दक्षता में सुधार करता है, उपयोगकर्ताओं को लचीला विकास और परिनियोजन विकल्प प्रदान करता है।
【AiBase सारांश:】
🚀 Wan2.1 मॉडल ने Vbench मूल्यांकन में 86.22% के स्कोर के साथ प्रथम स्थान प्राप्त किया, जो अन्य वीडियो जनरेशन मॉडल से आगे है।
💡 3D कारण VAE मॉड्यूल का उपयोग करके, 256 गुना हानिरहित वीडियो छिपी हुई जगह संपीड़न प्राप्त किया गया, जिससे वीडियो पुनर्निर्माण की गति में वृद्धि हुई।
🔧 कई मुख्यधारा के ढाँचों का समर्थन करता है, डेवलपर्स Gradio के माध्यम से जल्दी से अनुभव कर सकते हैं, और अनुमान और परिनियोजन प्रक्रिया को सरल बना सकते हैं।
विवरण लिंक:https://github.com/Wan-Video
2. 360 ब्रेन ने Tiny-R1-32B जारी किया: 5% पैरामीटर Deepseek-R1 के पूर्ण प्रदर्शन के करीब
360 ब्रेन टीम और बीजिंग विश्वविद्यालय द्वारा संयुक्त रूप से जारी किया गया Tiny-R1-32B-Preview मॉडल, केवल 5% पैरामीटर के साथ, Deepseek-R1 के प्रदर्शन के करीब पहुँच गया है, जो कुशल अनुमान में छोटे मॉडल की क्षमता को दर्शाता है। इस मॉडल ने गणित, प्रोग्रामिंग और विज्ञान क्षेत्रों में मूल्यांकन में उत्कृष्ट प्रदर्शन किया है, विशेष रूप से AIME2024 मूल्यांकन में 78.1 अंक प्राप्त किए हैं, जो कई कार्यों पर इसकी संतुलित अनुकूलन क्षमता को दर्शाता है। अनुसंधान दल ने पूरे मॉडल संसाधनों को खोलने का वादा किया है, जिससे तकनीकी विकास को बढ़ावा मिलेगा।
【AiBase सारांश:】
📊 Tiny-R1-32B-Preview मॉडल ने 5% पैरामीटर के साथ Deepseek-R1 के प्रदर्शन के करीब पहुँच गया, जो छोटे मॉडल की कुशल अनुमान क्षमता को दर्शाता है।
💻 गणित, प्रोग्रामिंग और विज्ञान क्षेत्रों में, इस मॉडल ने कई मूल्यांकनों में उत्कृष्ट प्रदर्शन किया है, वर्तमान में सर्वश्रेष्ठ ओपन सोर्स 70B मॉडल को पार कर गया है।
🔗 अनुसंधान दल ने पूरे मॉडल भंडार को सार्वजनिक करने का वादा किया है, तकनीकी विकास को बढ़ावा देने के लिए, और मॉडल को Hugging Face प्लेटफ़ॉर्म पर अपलोड कर दिया है।
विवरण लिंक:https://huggingface.co/qihoo360/TinyR1-32B-Preview
3. DeepSeek ओपन सोर्स वीक का तीसरा दिन: DeepGEMM जारी किया गया, FP8 GEMM लाइब्रेरी AI प्रशिक्षण और अनुमान में सहायता करती है
ओपन सोर्स वीक के तीसरे दिन, चीनी कृत्रिम बुद्धिमत्ता कंपनी DeepSeek ने DeepGEMM जारी किया, जो FP8 सामान्य मैट्रिक्स गुणन का समर्थन करने वाली एक ओपन सोर्स लाइब्रेरी है, जिसका उद्देश्य घने और मिश्रित विशेषज्ञ मॉडल के लिए समर्थन प्रदान करना है। इस लाइब्रेरी ने NVIDIA Hopper GPU पर 1350 TFLOPS से अधिक FP8 गणना प्रदर्शन प्राप्त किया है, और इसका मुख्य कोड केवल 300 पंक्तियों का है, जो इसकी उच्च दक्षता और सादगी को दर्शाता है। DeepGEMM के जारी होने से AI तकनीक के पारदर्शिता और सामुदायिक सहयोग को बढ़ावा देने में DeepSeek के प्रयासों में और वृद्धि हुई है, और भविष्य में AI प्रशिक्षण और अनुमान में उल्लेखनीय सुधार होने की उम्मीद है।
【AiBase सारांश:】
🚀 DeepGEMM एक ओपन सोर्स लाइब्रेरी है, जिसे घने और मिश्रित विशेषज्ञ मैट्रिक्स संचालन के लिए डिज़ाइन किया गया है, जो FP8 सामान्य मैट्रिक्स गुणन का समर्थन करता है।
💻 NVIDIA Hopper GPU पर, DeepGEMM 1350+ TFLOPS तक FP8 गणना प्रदर्शन प्राप्त कर सकता है, जो इसकी उत्कृष्ट दक्षता को दर्शाता है।
🌐 इस लाइब्रेरी के जारी होने से न केवल DeepSeek मॉडल का प्रदर्शन बेहतर हुआ है, बल्कि वैश्विक डेवलपर्स के लिए एक कुशल और उपयोग में आसान मैट्रिक्स संचालन उपकरण भी प्रदान किया गया है।
विवरण लिंक:https://github.com/deepseek-ai/DeepGEMM
4. Baidu का नो-कोड डेवलपमेंट टूल "मियाओ दा" उपयोगकर्ता आमंत्रण परीक्षण शुरू करता है
Baidu ने 25 फरवरी को आधिकारिक तौर पर घोषणा की कि इसका नो-कोड डेवलपमेंट टूल "मियाओ दा" उपयोगकर्ता आमंत्रण परीक्षण शुरू कर चुका है। उपयोगकर्ता प्राप्त आमंत्रण ईमेल के माध्यम से मियाओ दा के होमपेज तक पहुँच सकते हैं और H5 पेज डेवलपमेंट और वेबसाइट डेवलपमेंट जैसे कार्यों का अनुभव कर सकते हैं। यह टूल 12 नवंबर, 2024 को Baidu वर्ल्ड 2024 सम्मेलन में जारी किया गया था, जिसमें नो-कोड प्रोग्रामिंग, मल्टी-एजेंट सहयोग और मल्टी-टूल कॉलिंग जैसी विशेषताएँ हैं। परीक्षण के लिए आवेदन करने वाले उद्यम उपयोगकर्ताओं की संख्या 20,000 से अधिक हो गई है, और Baidu बाद में अधिक कार्य जारी करेगा। उपयोगकर्ता Baidu इंटेलिजेंट क्लाउड की आधिकारिक वेबसाइट पर परीक्षण कतार में शामिल होने के लिए आवेदन कर सकते हैं।
【AiBase सारांश:】
🚀 उपयोगकर्ता आमंत्रण ईमेल के माध्यम से मियाओ दा तक पहुँच सकते हैं और कई विकास कार्यों का अनुभव कर सकते हैं।
📈 परीक्षण के लिए आवेदन करने वाले उद्यम उपयोगकर्ताओं की संख्या 20,000 से अधिक हो गई है, जो बाजार की मजबूत मांग को दर्शाता है।
🔧 मियाओ दा में नो-कोड प्रोग्रामिंग और मल्टी-एजेंट सहयोग जैसी मुख्य विशेषताएँ हैं, जो विकास दक्षता में सुधार करती हैं।
विवरण लिंक:https://digital.cloud.baidu.com/mF/commonLandingPage/CTA/889605a4883041b98b16538350ea33f8?pushId=bBDCrkwdYZ6bP8TE44JbCM1
5. Google का अल्ट्रा-लो-प्राइस AI मॉडल Gemini 2.0 Flash-Lite आधिकारिक तौर पर लॉन्च किया गया
Google ने हाल ही में Gemini 2.0 Flash-Lite लॉन्च किया है, जो इसके AI मॉडल श्रृंखला में सबसे अधिक लागत प्रभावी विकल्प है, जिसका उद्देश्य सीमित बजट वाले डेवलपर्स को उच्च लागत-प्रभावशीलता वाला समाधान प्रदान करना है। यह मॉडल बड़े पैमाने पर टेक्स्ट आउटपुट कार्यों को संभालने में उत्कृष्ट प्रदर्शन करता है, इसकी मूल्य निर्धारण रणनीति अत्यधिक प्रतिस्पर्धी है, और इनपुट और आउटपुट टोकन की लागत बाजार में समान उत्पादों से बहुत कम है। हालाँकि यह उन्नत कार्यों का समर्थन नहीं करता है, लेकिन टेक्स्ट जनरेशन क्षेत्र में इसकी उच्च दक्षता और व्यावहारिकता इसे स्टार्टअप और छोटी टीमों के लिए एक आदर्श विकल्प बनाती है।
【AiBase सारांश:】
💰 Gemini 2.0 Flash-Lite का इनपुट टोकन मूल्य प्रति मिलियन 0.075 अमेरिकी डॉलर है, और आउटपुट टोकन प्रति मिलियन 0.30 अमेरिकी डॉलर है, जो अत्यधिक लागत प्रभावी है।
📈 यह मॉडल Gemini 1.5 Flash से बेहतर प्रदर्शन करता है, 1 मिलियन टोकन के संदर्भ विंडो को संभाल सकता है, और उच्च-आवृत्ति कार्यों के लिए उपयुक्त है।
📝 हालाँकि यह छवि या ऑडियो आउटपुट का समर्थन नहीं करता है, फिर भी Gemini 2.0 Flash-Lite टेक्स्ट जनरेशन पर केंद्रित है, लगभग 40,000 तस्वीरों के लिए एक-पंक्ति शीर्षक उत्पन्न कर सकता है, जिसकी लागत 1 अमेरिकी डॉलर से कम है।
6. फैंतासी मात्रा DeepSeek-R2 मॉडल के अग्रिम प्रकाशन पर प्रतिक्रिया देती है: आधिकारिक सूचना के अनुसार
हाल ही में, फैंतासी मात्रा ने DeepSeek की नई पीढ़ी के AI मॉडल R2 के अग्रिम प्रकाशन की अफवाहों पर प्रतिक्रिया दी है, इस बात पर जोर दिया है कि सब कुछ आधिकारिक सूचना के अनुसार होगा। फैंतासी मात्रा ने जुलाई 2023 में गहन खोज AI कंपनी की स्थापना की थी, और जनवरी में DeepSeek-R1 मॉडल जारी किया था। रॉयटर्स की रिपोर्ट के अनुसार, DeepSeek R2 मॉडल के प्रकाशन को तेज कर रहा है, जिसकी योजना मई में आगे बढ़ाने की है, और नए मॉडल में कोड जनरेशन और बहुभाषी अनुमान क्षमताओं में सुधार होने की उम्मीद है।
【AiBase सारांश:】
🔍 फैंतासी मात्रा का कहना है कि वह आधिकारिक सूचना के अनुसार DeepSeek-R2 मॉडल के अग्रिम प्रकाशन की अफवाहों पर प्रतिक्रिया देगी।
🚀 DeepSeek ने जुलाई 2023 में गहन खोज AI कंपनी की स्थापना की थी, और जनवरी में DeepSeek-R1 मॉडल सफलतापूर्वक जारी किया था।
🌐 नई पीढ़ी के DeepSeek-R2 मॉडल में कोड जनरेशन और बहुभाषी अनुमान क्षमताओं में सुधार होने की उम्मीद है।
7. Microsoft ने एक नया बहु-मोडल AI एजेंट "Magma" ओपन सोर्स किया: स्वचालित ऑर्डर प्लेसमेंट और व्यवहार भविष्यवाणी
Microsoft ने हाल ही में अपनी आधिकारिक वेबसाइट पर "Magma" नामक बहु-मोडल AI एजेंट बेस मॉडल को ओपन सोर्स किया है। Magma डिजिटल और भौतिक दुनिया को पार कर सकता है, छवियों, वीडियो और टेक्स्ट जैसे कई प्रकार के डेटा को संभाल सकता है, और इसमें मनोवैज्ञानिक भविष्यवाणी कार्य भी हैं, जो व्यक्तियों या वस्तुओं के इरादों को अधिक सटीक रूप से समझ सकता है। इस AI के अनुप्रयोग परिदृश्य बहुत व्यापक हैं, न केवल उपयोगकर्ताओं को स्वचालित ऑर्डर प्लेसमेंट और मौसम की जानकारी जैसे दैनिक संचालन में मदद मिल सकती है, बल्कि यह भौतिक रोबोट को भी नियंत्रित कर सकता है और वास्तविक समय में सहायता प्रदान कर सकता है। Magma के जारी होने से बुद्धिमान सहायकों और रोबोट तकनीक में एक महत्वपूर्ण प्रगति हुई है, जो विशेष रूप से AI-संचालित सहायकों या रोबोट के लिए उपयुक्त है, जिससे उनकी सीखने की क्षमता और व्यावहारिकता में वृद्धि होती है।
【AiBase सारांश:】