【AI दैनिक】 खंड में आपका स्वागत है! यह आपका दैनिक मार्गदर्शक है जो आपको कृत्रिम बुद्धिमत्ता की दुनिया का पता लगाने में मदद करेगा। हम प्रतिदिन आपके लिए AI क्षेत्र की नवीनतम खबरें लाते हैं, डेवलपर्स पर ध्यान केंद्रित करते हैं, और आपको तकनीकी रुझानों और नवीन AI उत्पाद अनुप्रयोगों को समझने में मदद करते हैं।

नए AI उत्पादों के बारे में जानने के लिए यहाँ क्लिक करें: https://top.aibase.com/

1. DeepSeek ने चौथे दिन ही ओपन-सोर्स समानांतर रणनीति अपग्रेड जारी किया: DualPipe और EPLB तकनीक बड़े मॉडल प्रशिक्षण क्रांति को बढ़ावा देती है

DeepSeek ने अपनी ओपन-सोर्स योजना के चौथे दिन समानांतर रणनीति में सुधार जारी किया, जिसमें मुख्य रूप से दो-तरफ़ा पाइपलाइन समानांतर एल्गोरिथम DualPipe और गतिशील लोड बैलेंसर EPLB शामिल हैं। ये तकनीकें बड़े पैमाने पर भाषा मॉडल प्रशिक्षण में मुख्य समस्याओं को हल करने के लिए डिज़ाइन की गई हैं, जिससे गणना दक्षता और संसाधन उपयोग में उल्लेखनीय वृद्धि होती है।

image.png

【AiBase सारांश:】

🔄 DualPipe एल्गोरिथम दो-तरफ़ा डेटा प्रवाह पाइपलाइन को लागू करता है, जिससे गणना थ्रूपुट में वृद्धि होती है, और यह अरबों से लेकर खरबों पैरामीटर वाले मॉडल प्रशिक्षण के लिए उपयुक्त है।

⚖️ EPLB गतिशील लोड बैलेंसर मिश्रित विशेषज्ञ मॉडल में हॉट स्पॉट विशेषज्ञ समस्या को हल करता है, जिससे समग्र उपयोग दर 92% से अधिक हो जाती है।

📊 गणना-संचार ओवरलैपिंग ऑप्टिमाइज़ेशन टूल ने एक समय-स्थान दक्षता मॉडल बनाया है, जिससे एंड-टू-एंड प्रशिक्षण समय में लगभग 15% की कमी आई है।

विवरण लिंक:https://github.com/deepseek-ai/DualPipe

2. अलीबाबा ने 2026 के वसंत भर्ती अभियान की शुरुआत की, 3000 से अधिक पदों पर AI से संबंधित पद लगभग 50% हैं

अलीबाबा ने आधिकारिक तौर पर 2026 के वसंत इंटर्नशिप भर्ती अभियान की शुरुआत की है, जिसमें 3000 से अधिक पद खोले गए हैं, जिनमें से लगभग 50% कृत्रिम बुद्धिमत्ता से संबंधित हैं। कुछ विभागों में AI पदों का अनुपात अधिक है, जैसे कि Gaode में 65% और Alibaba Cloud में 80% से अधिक। इस वसंत भर्ती अभियान में कई विभाग शामिल हैं, जो AI तकनीक के प्रति अलीबाबा के महत्व और तकनीकी पदों पर निरंतर ध्यान देने को दर्शाता है, खासकर AI क्षेत्र में।

image.png

【AiBase सारांश:】

🤖 अलीबाबा ने 2026 के वसंत इंटर्नशिप भर्ती अभियान की शुरुआत की है, जिसमें 3000 से अधिक पद खोले गए हैं, जिनमें से लगभग 50% AI से संबंधित हैं।

📈 Gaode और Alibaba Cloud जैसे विभागों में AI पदों का अनुपात उल्लेखनीय है, जो क्रमशः 65% और 80% तक पहुँच गया है।

💼 अलीबाबा का AI To C व्यवसाय बड़े पैमाने पर भर्ती शुरू कर चुका है, जिसमें 90% पद AI तकनीक और उत्पाद विकास में केंद्रित हैं।

3. ElevenLabs ने Scribe वॉयस-टू-टेक्स्ट मॉडल जारी किया, सटीकता में नया उच्च स्तर, अंग्रेजी में 96.7%

ElevenLabs ने हाल ही में अपना नवीनतम वॉयस-टू-टेक्स्ट मॉडल Scribe v1 जारी किया है, जिसमें कई भाषाओं में उच्चतम सटीकता का दावा किया गया है। यह मॉडल 99 भाषाओं का समर्थन करता है और जटिल ऑडियो वातावरण में 32 तक अलग-अलग वक्ताओं को सटीक रूप से अलग कर सकता है। Scribe की कीमत प्रति घंटे $0.40 है और अगले छह हफ़्तों के लिए 50% की छूट दी जा रही है। image.png

【AiBase सारांश:】

🌟 Scribe v1 ElevenLabs का नवीनतम वॉयस-टू-टेक्स्ट मॉडल है, जिसने कई भाषाओं में सटीकता के मामले में नया उच्च स्तर हासिल किया है।

🗣️ यह 99 भाषाओं का समर्थन करता है, 32 तक अलग-अलग वक्ताओं को अलग कर सकता है और जटिल ऑडियो वातावरण के अनुकूल है।

💰 वर्तमान में इसकी कीमत प्रति घंटे $0.40 है, अगले छह हफ़्तों के लिए 50% की छूट है, और कम विलंबता वाला संस्करण विकास में है।

विवरण लिंक:https://elevenlabs.io/blog/meet-scribe

4. Microsoft ने Phi-4 मल्टीमॉडल और मिनी मॉडल जारी किए, वॉयस, विज़न और टेक्स्ट प्रोसेसिंग में उन्नयन

Microsoft ने हाल ही में Phi-4 श्रृंखला के नए मॉडल जारी किए हैं, जिनमें Phi-4 मल्टीमॉडल और Phi-4 मिनी शामिल हैं, जिससे AI अनुप्रयोगों की प्रोसेसिंग क्षमता में उल्लेखनीय वृद्धि हुई है। Phi-4 मल्टीमॉडल मॉडल में वॉयस, विज़न और टेक्स्ट प्रोसेसिंग एकीकृत है, जिसमें 56 मिलियन पैरामीटर हैं, और यह कई बेंचमार्क परीक्षणों में उत्कृष्ट प्रदर्शन करता है, खासकर स्वचालित भाषण पहचान और अनुवाद कार्यों में। Phi-4 मिनी टेक्स्ट प्रोसेसिंग पर केंद्रित है, जिसमें 38 मिलियन पैरामीटर हैं, और यह भी उत्कृष्ट प्रदर्शन करता है।

image.png

【AiBase सारांश:】

🎤 Phi-4 मल्टीमॉडल मॉडल Microsoft का पहला एकीकृत आर्किटेक्चर मॉडल है जिसमें वॉयस, विज़न और टेक्स्ट प्रोसेसिंग एकीकृत है, जिसमें 56 मिलियन पैरामीटर हैं, और यह कई प्रतिस्पर्धियों को पीछे छोड़ देता है।

📊 विज़न प्रोसेसिंग और गणितीय तर्क के मामले में Phi-4 मल्टीमॉडल मॉडल उत्कृष्ट प्रदर्शन करता है, और यह दस्तावेज़ों और चार्ट को प्रभावी ढंग से समझ सकता है और ऑप्टिकल कैरेक्टर पहचान कर सकता है।

📝 Phi-4 मिनी मॉडल टेक्स्ट प्रोसेसिंग पर केंद्रित है, जिसमें 38 मिलियन पैरामीटर हैं, और यह टेक्स्ट तर्क और प्रोग्रामिंग जैसे कार्यों में उत्कृष्ट प्रदर्शन करता है, जो कई लोकप्रिय बड़े भाषा मॉडल को पीछे छोड़ देता है।

5. Hugging Face ने FastRTC जारी किया: रीयल-टाइम वॉयस और वीडियो ऐप डेवलपमेंट आसान हो गया

Hugging Face ने हाल ही में FastRTC जारी किया है, जो एक ओपन-सोर्स Python लाइब्रेरी है जिसका उद्देश्य रीयल-टाइम ऑडियो और वीडियो AI ऐप के विकास की प्रक्रिया को सरल बनाना है। यह लाइब्रेरी जटिल रीयल-टाइम संचार कार्यों को स्वचालित करके डेवलपर्स को कुछ ही लाइनों में बुनियादी रीयल-टाइम ऐप बनाने में सक्षम बनाती है, जिससे विकास का समय काफी कम हो जाता है।

image.png

【AiBase सारांश:】

🎉 Hugging Face ने FastRTC जारी किया है, जो एक ओपन-सोर्स Python लाइब्रेरी है जिसका उद्देश्य रीयल-टाइम ऑडियो और वीडियो AI ऐप के विकास की प्रक्रिया को सरल बनाना है।

⚡ FastRTC कुछ ही लाइनों में वह काम पूरा कर सकता है जिसके लिए पहले कई हफ़्ते लगते थे, जिससे मौजूदा Python डेवलपर्स भी आसानी से वॉयस और वीडियो फ़ंक्शन बना सकते हैं।

🌟 इस लाइब्रेरी के जारी होने से AI क्षेत्र में एक बड़ा अवसर आया है, जिससे अधिक प्राकृतिक मानव-कंप्यूटर इंटरैक्शन को बढ़ावा मिला है और कंपनियों को उपयोगकर्ता की ज़रूरतों को तेज़ी से पूरा करने में मदद मिली है।

विवरण लिंक:https://huggingface.co/fastrtc

6. FLORA नोडल AI कैनवास: कहानी विश्लेषण से लेकर विज़ुअल कंटेंट जेनरेशन तक के क्रिएटिव वर्कफ़्लो को सरल बनाता है

हाल ही में लॉन्च किया गया FLORA नोडल AI कैनवास क्रिएटिव पेशेवरों के लिए डिज़ाइन किया गया एक टूल है, जिसका उद्देश्य कई AI कार्यों को एकीकृत करके क्रिएटिव प्रक्रिया को सरल बनाना है। इसका मुख्य हिस्सा नोडल सिस्टम है, जिससे उपयोगकर्ता अलग-अलग कार्यों को संभालने के लिए स्वतंत्र नोड बना सकते हैं। FLORA के स्टोरी विश्लेषण और प्रॉम्प्ट जेनरेशन, कैरेक्टर डिज़ाइन टूल और टीम सहयोग सुविधाओं से क्रिएटिव काम अधिक कुशल और लचीला बन जाता है।

image.png

【AiBase सारांश:】

🖌️ नोडल सिस्टम उपयोगकर्ताओं को अलग-अलग क्रिएटिव कार्यों को स्वतंत्र रूप से संभालने की अनुमति देता है, जिससे कार्य कुशलता बढ़ती है।

📖 स्टोरी विश्लेषण और कैरेक्टर डिज़ाइन टूल विस्तृत प्रॉम्प्ट उत्पन्न कर सकते हैं, जिससे उन्नत AI इमेज जेनरेटर का उपयोग करना आसान हो जाता है।

🤝 यह रीयल-टाइम टीम सहयोग का समर्थन करता है, इसका इंटरफ़ेस उपयोगकर्ता के अनुकूल है और यह उन उपयोगकर्ताओं के लिए उपयुक्त है जिनका तकनीकी बैकग्राउंड कमज़ोर है।

7. जल्द ही लॉन्च होने वाला है? OpenAI GPT-4.5 Android ऐप के टेस्ट वर्ज़न में दिखाई दिया

OpenAI अपने अगले पीढ़ी के भाषा मॉडल GPT-4.5 के प्रीव्यू वर्ज़न की तैयारी कर रहा है, जिससे व्यापक ध्यान आकर्षित हुआ है। यह मॉडल ChatGPT के Android ऐप में एक प्रयोगात्मक विकल्प के रूप में लॉन्च किया जाएगा, और शुरू में यह केवल Pro सब्सक्राइबर के लिए उपलब्ध होगा। हालाँकि इसके विशिष्ट कार्य अभी स्पष्ट नहीं हैं, लेकिन GPT-4.5 ChatGPT के मुफ़्त वर्ज़न का उत्तराधिकारी बनने की उम्मीद है, और इसमें संभवतः अधिक कॉल सीमाएँ होंगी।

image.png

【AiBase सारांश:】

🚀 GPT-4.5 जल्द ही लॉन्च होने वाला है, और शुरू में यह Pro सब्सक्राइबर के लिए उपलब्ध होगा।

🔍 यह मॉडल ChatGPT के Android ऐप में एक प्रयोगात्मक विकल्प के रूप में दिखाई दिया है, और इसके विशिष्ट कार्य अभी स्पष्ट नहीं हैं।

💰 Pro सब्सक्रिप्शन की कीमत प्रति माह $200 है, जो अधिक कार्य और कम सीमाएँ प्रदान करता है।

8. बाइटडांस के AI इंटेलिजेंट असिस्टेंट डौबाओ ऐप ने "फोटो को गतिशील बनाएँ" फ़ंक्शन लॉन्च किया

बाइटडांस के डौबाओ ऐप ने "फोटो को गतिशील बनाएँ" फ़ंक्शन लॉन्च किया है, जिसका उद्देश्य स्थिर पुरानी तस्वीरों को गतिशील वीडियो में बदलना है। उपयोगकर्ताओं को केवल तस्वीर अपलोड करनी होगी और क्रिया का वर्णन करना होगा, और वे आसानी से इसे बदल सकते हैं। यह फ़ंक्शन न केवल उपयोगकर्ताओं की यादों में जीवंत रंग जोड़ता है, बल्कि कीमती पलों को नया जीवन भी देता है, जो तकनीक और भावनाओं के संयोजन को दर्शाता है।

image.png

【AiBase सारांश:】

📸 यह फ़ंक्शन उपयोगकर्ताओं को स्थिर पुरानी तस्वीरों को जीवंत गतिशील वीडियो में बदलने की अनुमति देता है, जिससे उपयोगकर्ताओं की पुरानी तस्वीरों को गतिशील बनाने की ज़रूरत पूरी होती है।

💡 यह संचालित करने में आसान है, उपयोगकर्ताओं को केवल तस्वीर अपलोड करनी होगी और उसमें क्रिया का वर्णन करना होगा, और वे गतिशील प्रभाव उत्पन्न कर सकते हैं।