आपका स्वागत है 【AI दैनिक】 कॉलम में! यहाँ आपके लिए हर दिन आर्टिफिशियल इंटेलिजेंस की दुनिया की खोज करने का मार्गदर्शक है, हम हर दिन आपको AI क्षेत्र की प्रमुख सामग्री प्रस्तुत करते हैं, डेवलपर्स पर ध्यान केंद्रित करते हैं, तकनीकी रुझानों को समझने और नवीन AI उत्पादों के अनुप्रयोगों को जानने में आपकी मदद करते हैं।

नए AI उत्पादों के लिए जानकारी के लिए क्लिक करें: https://top.aibase.com/

1. WeChat: AI तकनीक का उपयोग करके प्रसिद्ध व्यक्तियों की नकल करने वाले विपणन प्रचार के खिलाफ कार्रवाई करेगा

WeChat की कोरल सुरक्षा ने हाल ही में एक घोषणा की, जिसमें स्पष्ट रूप से कहा गया है कि यह AI तकनीक का उपयोग करके प्रसिद्ध व्यक्तियों की नकल कर अनुचित विपणन करने वाले कार्यों के खिलाफ सख्त कार्रवाई करेगा। प्लेटफॉर्म सुरक्षित और स्वस्थ नेटवर्क वातावरण बनाए रखने के लिए प्रतिबद्ध है, और 532 उल्लंघन सामग्री को संभाला है, साथ ही 209 संबंधित खातों को बंद किया है। भविष्य में, WeChat इस प्रकार के कार्यों के खिलाफ अपनी कार्रवाई को और बढ़ाएगा।

WeChat Screenshot_20241216081617.png

【AiBase सारांश:】

🛡️ WeChat ने AI तकनीक का उपयोग करके प्रसिद्ध व्यक्तियों की नकल करने वाले अनुचित विपणन के खिलाफ कार्रवाई करने पर जोर दिया, सुरक्षित नेटवर्क वातावरण बनाने के लिए प्रतिबद्ध है।

📊 वर्तमान में, WeChat ने 532 उल्लंघन सामग्री को संभाला है और 209 संबंधित खातों को बंद किया है, जो इसकी मजबूत प्रबंधन क्षमता को दर्शाता है।

🤝 WeChat उपयोगकर्ताओं से कानूनों का पालन करने और अनुचित गतिविधियों की रिपोर्ट करने की अपील करता है, ताकि नेटवर्क के स्वस्थ पारिस्थितिकी को बनाए रखा जा सके।

2. चंद्रमा की अंधेरी पक्ष की Kimi दृष्टि सोच संस्करण लॉन्च: k1 मॉडल पर आधारित, छवि सामग्री की पहचान कर सकता है

चंद्रमा की अंधेरी पक्ष के तहत AI सहायक Kimi ने हाल ही में दृष्टि सोच संस्करण कार्यक्षमता लॉन्च की है, जो उपयोगकर्ता द्वारा भेजी गई छवियों का गहन विश्लेषण और अवलोकन कर सकती है। यह कार्यक्षमता k1 दृष्टि सोच मॉडल पर आधारित है, जिससे Kimi छवि सामग्री को बुद्धिमानी से पहचानने और सटीक प्रतिक्रिया प्रदान करने में सक्षम है। उपयोगकर्ता सीधे Kimi से प्रश्न पूछ सकते हैं, जैसे कि फोटो खींचने का स्थान या छवि में प्रश्न का उत्तर मांगना।

WeChat Screenshot_20241216083354.png

【AiBase सारांश:】

🖥️ Kimi की नई दृष्टि सोच कार्यक्षमता उपयोगकर्ता द्वारा भेजी गई छवियों का विस्तृत अवलोकन और विश्लेषण कर सकती है।

📸 उपयोगकर्ता Kimi से फोटो खींचने के स्थान के बारे में पूछ सकते हैं, Kimi छवि सामग्री के आधार पर अनुमान लगाएगा।

💡 उपयोगकर्ता स्क्रीनशॉट भेजकर Kimi से छवि में प्रश्न का उत्तर मांग सकते हैं, जिससे सेवा अनुभव को और सुविधाजनक बनाया जा सके।

3. स्टेप-1o ऑडियो: एक ट्रिलियन पैरामीटर एंड-टू-एंड वॉयस मॉडल लॉन्च, युआनवेन ऐप से जुड़ेगा

स्टेप-1o वॉयस मॉडल, जो स्टेप-1o द्वारा लॉन्च किया गया है, देश का पहला ट्रिलियन पैरामीटर का एंड-टू-एंड वॉयस मॉडल है, जो वॉयस तकनीक में एक महत्वपूर्ण प्रगति को दर्शाता है। यह मॉडल न केवल वॉयस समझ और उत्पन्न करने के उच्च स्तर का एकीकरण कर सकता है, बल्कि इसमें भावनात्मक और बौद्धिक दोनों लाभ भी हैं, जो जटिल अर्थ और भावनात्मक जानकारी को समझ सकता है, और उच्च गुणवत्ता की पेशेवर सलाह प्रदान कर सकता है। स्टेप-1o का व्यापक अनुप्रयोग विभिन्न उद्योगों की वॉयस इंटरैक्शन तकनीक के लिए नई संभावनाएँ लाएगा।

WeChat Screenshot_20241216081425.png

【AiBase सारांश:】

🎤 स्टेप-1o देश का पहला ट्रिलियन पैरामीटर का एंड-टू-एंड वॉयस मॉडल है, जो शक्तिशाली वॉयस समझ और उत्पन्न करने की क्षमता रखता है।

🤖 यह मॉडल जटिल अर्थ और भावनात्मक जानकारी को समझ सकता है, पेशेवर सलाह प्रदान कर सकता है, और उच्च बौद्धिक और भावनात्मक गुण प्रदर्शित करता है।

📱 स्टेप-1o युआनवेन ऐप से जुड़ेगा, उपयोगकर्ता फोन के माध्यम से इसके साथ वास्तविक समय में वॉयस संवाद कर सकेंगे, अनुप्रयोग के परिदृश्यों का विस्तार कर सकेंगे।

4. Pika2.0 का लॉन्च: टेक्स्ट संरेखण कार्यक्षमता में सुधार, वीडियो सामग्री तत्वों को स्वतंत्र रूप से नियंत्रित कर सकता है

Pika ने हाल ही में अपने नवीनतम AI वीडियो निर्माण उपकरण Pika2.0 का लॉन्च किया है, जो रचनात्मक AI क्षेत्र में इस प्लेटफॉर्म की आगे की प्रगति को दर्शाता है। नया संस्करण अधिक नियंत्रण और अनुकूलन क्षमता प्रदान करता है, विशेष रूप से टेक्स्ट संरेखण और गति रेंडरिंग में महत्वपूर्ण सुधार के साथ, जिससे उपयोगकर्ता उच्च गुणवत्ता वाले वीडियो सामग्री को अधिक आसानी से बना सकें। Pika2.0 का डिज़ाइन व्यक्तिगत निर्माताओं और छोटे ब्रांडों की आवश्यकताओं को पूरा करने के लिए किया गया है, और इससे अधिक उपयोगकर्ताओं को आकर्षित करने की उम्मीद है।

image.png

【AiBase सारांश:】

✨ Pika2.0 ने टेक्स्ट संरेखण कार्यक्षमता में सुधार किया है, जिससे उपयोगकर्ताओं के लिए वीडियो बनाने की प्रक्रिया को सरल बनाया गया है।

🚀 नई गति रेंडरिंग तकनीक अधिक प्राकृतिक गति प्रदर्शन प्रदान करती है, वीडियो की गुणवत्ता में सुधार करती है।

🎨 प्लेटफॉर्म की नई "दृश्य तत्व" कार्यक्षमता उपयोगकर्ताओं को पात्रों और पृष्ठभूमियों को अनुकूलित करने की अनुमति देती है, जिससे रचनात्मकता की लचीलापन बढ़ता है।

5. अलीबाबा टोंग यि प्रयोगशाला वॉयस जनरेशन बड़े मॉडल CosyVoice का 2.0 संस्करण अपग्रेड

अलीबाबा टोंग यि प्रयोगशाला का CosyVoice वॉयस जनरेशन बड़ा मॉडल अब 2.0 संस्करण में अपग्रेड हो गया है, जिससे वॉयस जनरेशन की सटीकता, स्थिरता और प्राकृतिक अनुभव में उल्लेखनीय वृद्धि हुई है। नया संस्करण द्विदिश प्रवाह वॉयस संश्लेषण तकनीक के माध्यम से संश्लेषण विलंबता को कम करता है, और उच्चारण की सटीकता में महत्वपूर्ण प्रगति करता है। CosyVoice2.0 ने ध्वनि गुणवत्ता और भावनात्मक मेल को भी बढ़ाया है, और यह कई बोलियों और भूमिका निभाने की कार्यक्षमता का समर्थन करता है।

image.png

【AiBase सारांश:】

🚀 CosyVoice2.0 द्विदिश प्रवाह वॉयस संश्लेषण को सक्षम बनाता है, संश्लेषण विलंबता 150 मिलीसेकंड तक कम करता है, और प्रतिक्रिया गति में सुधार करता है।

📉 उच्चारण की सटीकता में उल्लेखनीय सुधार हुआ है, और त्रुटि दर 30%-50% तक कम हो गई है, और कठिन परीक्षण सेट पर न्यूनतम शब्द त्रुटि दर प्राप्त की गई है।

🎤 यह कई बोलियों और भावनात्मक नियंत्रण का समर्थन करता है, जिससे भाषा के चयन और भूमिका निभाने की कार्यक्षमता में समृद्धि आती है।

विवरण लिंक: https://github.com/FunAudioLLM/CosyVoice

6. झांग वेनहोंग को AI द्वारा "नकली" सामान बेचने का आरोप

हाल ही में, झांग वेनहोंग के लाइव स्ट्रीमिंग बिक्री वीडियो ने व्यापक ध्यान आकर्षित किया, वास्तव में यह AI तकनीक द्वारा संश्लेषित गहरे फ़र्ज़ीकरण था। कई नेटिज़ेंस ने गलतफहमी में झांग वेनहोंग को सामान बेचते हुए समझा, खासकर कुछ बुजुर्ग दर्शक इस पर विश्वास कर रहे थे और जानकारी साझा कर रहे थे। झांग वेनहोंग ने इस पर कई बार शिकायत की है, और जनता को AI द्वारा संश्लेषित जानकारी के प्रति सतर्क रहने की चेतावनी दी है। यह घटना नई तकनीक के प्रति जनता की जागरूकता में अंतर को उजागर करती है, खासकर बुजुर्गों को गलतफहमी का शिकार बनाती है।

image.png

【AiBase सारांश:】

🌐 AI द्वारा संश्लेषित झांग वेनहोंग ने लाइव स्ट्रीमिंग बिक्री में चर्चा का विषय बना दिया, कुछ नेटिज़ेंस ने उनकी पहचान पर विश्वास किया।

🔍 जनता की नई तकनीक के प्रति जागरूकता में कमी, गलत जानकारी के प्रभाव में आसानी से आ जाती है।

🛡️ तकनीकी सुरक्षा उपायों और जानकारी की निगरानी तंत्र को मजबूत करना, जनता की पहचान क्षमता को बढ़ाना महत्वपूर्ण है।

7. वू वेंक्सिन ने पहले एंड-साइड मल्टी-मोडल समझ ओपन-सोर्स मॉडल Megrez-3B-Omni का लॉन्च किया, फंडिंग लगभग 1 बिलियन युआन

वू वेंक्सिन ने AI क्षेत्र में महत्वपूर्ण प्रगति की है, और दुनिया का पहला एंड-साइड मल्टी-मोडल समझ ओपन-सोर्स AI मॉडल Megrez-3B-Omni लॉन्च किया है, जो तकनीकी नवाचार में इसकी अग्रणी स्थिति को दर्शाता है। साथ ही, कंपनी ने शुद्ध भाषा संस्करण का मॉडल भी लॉन्च किया है, जो उत्पाद लाइन को और समृद्ध करता है। वू वेंक्सिन प्रभावी AI कंप्यूटिंग ऑप्टिमाइजेशन के लिए प्रतिबद्ध है, कई प्रमुख मॉडलों का समर्थन करता है, और सफलतापूर्वक लगभग 500 मिलियन युआन की A दौर फंडिंग पूरी कर चुका है।

image.png

【AiBase सारांश:】

🌟 वू वेंक्सिन ने दुनिया का पहला एंड-साइड मल्टी-मोडल समझ ओपन-सोर्स AI मॉडल Megrez-3B-Omni लॉन्च किया, उत्पाद लाइन को बढ़ाया।

💰 कंपनी की फंडिंग लगभग 1 बिलियन युआन है, अगले 3-5 वर्षों में बड़े पैमाने पर लाभप्रदता हासिल करने का लक्ष्य है।

🤝 वू वेंक्सिन ने कंप्यूटिंग शक्ति के उपयोग की दक्षता को अनुकूलित किया है, और कई प्रमुख निवेश संस्थानों के साथ गहन सहयोग किया है।

विवरण लिंक: https://huggingface.co/Infinigence/Megrez-3B-Omni

8. बाईडू वेनकू ऐप ने "AI परीक्षा宝典" लॉन्च किया, AI छवि लेखन आदि कई कार्यों का समर्थन करता है

परीक्षा की प्रारंभिक परीक्षा के करीब आने के साथ, बाईडू वेनकू ऐप ने पूरी तरह से नया "AI परीक्षा宝典" लॉन्च किया है, जो परीक्षा के छात्रों को प्रभावी अध्ययन और तैयारी का समर्थन प्रदान करता है। यह प्लेटफॉर्म AI तकनीक का उपयोग करता है, नवाचार उपकरणों के माध्यम से छात्रों को पुनरावलोकन की दक्षता और परीक्षा के अंक बढ़ाने में मदद करता है। कार्यों में AI छवि लेखन, स्मार्ट प्रश्न-उत्तर, अंग्रेजी निबंध सुंदरता आदि शामिल हैं, जिससे छात्रों के अध्ययन की प्रक्रिया को बहुत सरल बनाया गया है, जिससे वे परीक्षा की चुनौतियों का बेहतर सामना कर सकें।

image.png

【AiBase सारांश:】

📸 AI छवि लेखन कार्यक्षमता जल्दी से उत्तर विवरण प्राप्त कर सकती है, समस्या समाधान की दक्षता बढ़ा सकती है।

📝 स्मार्ट प्रश्न-उत्तर और AI दस्तावेज़ संक्षेप प्रदान करते हैं, छात्रों को ज्ञान बिंदुओं को व्यवस्थित करने में मदद करते हैं।

🌐 AI संपूर्ण नेटवर्क खोज कार्यक्षमता जानकारी को एकीकृत करती है, संरचित और चित्रित उत्तर प्रदान करती है।

9. मस्क का X प्लेटफॉर्म Grok AI अपग्रेड: तीन गुना गति में वृद्धि, स्रोत संदर्भ पारंपरिक मीडिया से अधिक सटीक

xAI ने हाल ही में अपने Grok AI चैटबॉट में एक महत्वपूर्ण अपग्रेड किया है, Grok-2 संस्करण लॉन्च किया है, जो प्रदर्शन में काफी सुधार करता है, गति पिछले संस्करण की तुलना में तीन गुना है, और सटीकता और भाषा समर्थन में भी स्पष्ट सुधार हुआ है। नया संस्करण न केवल X प्लेटफॉर्म पर पोस्ट जानकारी को संभाल सकता है, बल्कि बाहरी वेबसाइटों की जानकारी को भी संदर्भित कर सकता है, विशेष रूप से समाचार स्रोतों को, जो उत्तर की विश्वसनीयता को बढ़ाता है। इसके अलावा, नए Grok बटन ने चर्चा को संदर्भ प्रदान किया है, जिससे उपयोगकर्ताओं को संवाद की सामग्री को बेहतर ढंग से समझने में मदद मिलती है।

image.png

【AiBase सारांश:】

📈 Grok-2 की गति पिछले संस्करण की तुलना में तीन गुना है, सटीकता और भाषा समर्थन में उल्लेखनीय सुधार हुआ है।

📰 नया संस्करण बाहरी मीडिया की जानकारी को संदर्भित कर सकता है, और स्रोत के साथ जोड़ सकता है, उत्तर की विश्वसनीयता को बढ़ाता है।

🔍 नया Grok बटन चर्चा को संदर्भ प्रदान कर सकता है, और संवाद में छवियों की व्याख्या कर सकता है।

10. वुहान विश्वविद्यालय ने आर्टिफिशियल इंटेलिजेंस कॉलेज की स्थापना की, शियाओमी ग्रुप गहरे सहयोग की उम्मीद करता है

वुहान विश्वविद्यालय का आर्टिफिशियल इंटेलिजेंस कॉलेज की स्थापना इस विश्वविद्यालय के आर्टिफिशियल इंटेलिजेंस क्षेत्र में अनुसंधान और शिक्षा में नए स्तर पर पहुंचने का प्रतीक है। कॉलेज गणितीय आधार, मशीन लर्निंग, स्मार्ट प्राकृतिक विज्ञान और सामाजिक विज्ञान जैसे क्षेत्रों पर ध्यान केंद्रित करेगा। 2025 में स्नातक और मास्टर-डॉक्टर के छात्रों को भर्ती करना शुरू करेगा, और कई क्षेत्रों में इंटरसेक्शनल नवाचार को बढ़ावा देने के लिए प्रतिबद्ध है। इसी समय, शियाओमी ग्रुप कॉलेज के साथ गहरे सहयोग की उम्मीद करता है, आर्टिफिशियल इंटेलिजेंस तकनीक के विकास को एक साथ बढ़ावा देने के लिए।

【AiBase सारांश:】

🌟 वुहान विश्वविद्यालय का आर्टिफिशियल इंटेलिजेंस कॉलेज औपचारिक रूप से उद्घाटन हुआ, और अकादमिक झांग पिंगवेन पहले डीन बने।

🎓 कॉलेज 2025 में स्नातक और मास्टर-डॉक्टर के छात्रों को भर्ती करना शुरू करेगा, कई क्षेत्रों में इंटरसेक्शनल अनुसंधान पर ध्यान केंद्रित करेगा।

🤝 शियाओमी ग्रुप कॉलेज के साथ गहरे सहयोग की उम्मीद करता है, आर्टिफिशियल इंटेलिजेंस तकनीक के अनुप्रयोग और विकास को एक साथ बढ़ावा देने के लिए।

11. नेक्सा AI ने OmniAudio-2.6B लॉन्च किया: किनारे पर तैनाती के लिए तेज ऑडियो भाषा मॉडल