AI दैनिक: o1 को पार करें! देशी बड़े मॉडल DeepSeek R1 ओपन-सोर्स; Kimi मल्टी-मोडल सोच मॉडल k1.5 का प्रदर्शन; Qingying 2.0 लॉन्च किया गया ज़िपू क़िंगयेन

आपका स्वागत है 【AI दैनिक】 कॉलम में! यह आपके लिए हर दिन आर्टिफिशियल इंटेलिजेंस की दुनिया का अन्वेषण करने का गाइड है, हर दिन हम आपको AI क्षेत्र की हॉट सामग्री प्रस्तुत करते हैं, डेवलपर्स पर ध्यान केंद्रित करते हैं, आपको तकनीकी प्रवृत्तियों को समझने में मदद करते हैं, और नवोन्मेषी AI उत्पादों के अनुप्रयोगों के बारे में जानकारी देते हैं।

ताज़ा AI उत्पादजानने के लिए क्लिक करें:https://top.aibase.com/

1. घरेलू बड़े मॉडल में फिर से एक बड़ी सफलता! DeepSeek R1 ओपन-सोर्स, OpenAI के करीब प्रदर्शन, AI समानता के नए युग की शुरुआत

DeepSeek ने हाल ही में अपने नवीनतम विकसित बड़े भाषा मॉडल R1 को जारी और ओपन-सोर्स किया है, जो घरेलू AI तकनीक में एक महत्वपूर्ण सफलता का प्रतीक है। यह मॉडल प्रदर्शन में OpenAI के o1 आधिकारिक संस्करण के समान है, विशेष रूप से गणित, कोड और प्राकृतिक भाषा निष्कर्षण जैसे महत्वपूर्ण कार्यों में उत्कृष्टता दिखाता है।

【AiBase सारांश:】

🌟 DeepSeek R1 ने बाद की प्रशिक्षण चरण में सुदृढ़ीकरण सीखने की तकनीक का उपयोग किया, जिससे निष्कर्षण क्षमता में महत्वपूर्ण सुधार हुआ।

📊 660B पैरामीटर का DeepSeek-R1 और DeepSeek-R1-Zero मॉडल ओपन-सोर्स किया गया, साथ ही 6 छोटे मॉडल प्रदान किए गए, जिससे ओपन-सोर्स पारिस्थितिकी को समृद्ध किया गया।

💰 API मूल्य निर्धारण अधिक प्रतिस्पर्धी है, कैश हिट प्रति मिलियन इनपुट टोकन केवल 1 युआन है, उपयोगकर्ताओं को वाणिज्यिक उपयोग के लिए प्रोत्साहित करता है।

विवरण लिंक:https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf

2. चाँद के अंधेरे पक्ष ने नई पीढ़ी का SOTA मॉडल k1.5 जारी किया: मल्टी-मोडल निष्कर्षण क्षमता में फिर से अपग्रेड

चाँद के अंधेरे पक्ष कंपनी द्वारा प्रस्तुत k1.5 मल्टी-मोडल सोच मॉडल, मल्टी-मोडल निष्कर्षण और सामान्य निष्कर्षण क्षेत्र में एक महत्वपूर्ण सफलता का प्रतीक है। इस मॉडल में उत्कृष्ट मल्टी-मोडल प्रसंस्करण क्षमता है, जो एक साथ पाठ, चित्र और ध्वनि जैसी जानकारी को संसाधित कर सकती है, जटिल कार्यों की समझ और प्रतिक्रिया क्षमता को बढ़ाती है। k1.5 की शक्तिशाली सामान्य निष्कर्षण क्षमता इसे प्रोग्रामिंग, गणितीय समस्या समाधान जैसे कई अनुप्रयोग परिदृश्यों में उत्कृष्ट प्रदर्शन करने में सक्षम बनाती है।

微信截图_20250121082016.png

【AiBase सारांश:】

🌟 k1.5 मॉडल में उत्कृष्ट मल्टी-मोडल निष्कर्षण क्षमता है, जो एक साथ पाठ, चित्र और ध्वनि जानकारी को संसाधित कर सकती है।

🤖 शक्तिशाली सामान्य निष्कर्षण क्षमता k1.5 को प्रोग्रामिंग, गणित आदि कई कार्यों के लिए उपयुक्त बनाती है, अत्यधिक लचीला।

📱 वर्तमान में k1.5 मॉडल का पूर्वावलोकन संस्करण Kimi.com और Kimi स्मार्ट सहायक ऐप पर उपलब्ध है, उपयोगकर्ता नई सुविधाओं का अनुभव कर सकते हैं।

3. मुफ्त परीक्षण! Zhipu ने AI लाइव वीडियो उत्पाद Qingying 2.0 को Zhipu Qingyan पर पूरी तरह से लॉन्च किया है

बीजिंग Zhipu Huazhang टेक्नोलॉजी कंपनी ने AI लाइव वीडियो उत्पाद Qingying 2.0 को पेश किया है, जिसे पूरी तरह से अपग्रेड किया गया है, जिससे मॉडल की क्षमता और वीडियो उत्पादन गुणवत्ता में महत्वपूर्ण सुधार हुआ है। नया संस्करण स्वाभाविक और सुचारू गति और शानदार चित्र उत्पन्न कर सकता है, उपयोगकर्ता केवल सरल संकेत देकर जटिल दृश्य प्राप्त कर सकते हैं। साथ ही, Qingying 2.0 में कला शैली में भी सुधार हुआ है, जो विभिन्न शैलियों के वीडियो उत्पादन का समर्थन करता है।

微信截图_20250121103843.png

【AiBase सारांश:】

🚀 Qingying 2.0 के मूल मॉडल की क्षमता 38% बढ़ गई है, स्वाभाविक और सुचारू वीडियो सामग्री उत्पन्न कर रही है।

🎨 नया संस्करण विभिन्न कला शैलियों के वीडियो उत्पादन का समर्थन करता है, चित्र की सुंदरता को बढ़ाता है।

💡 उपयोगकर्ता सरल संकेत शब्दों के माध्यम से जटिल दृश्यों को प्राप्त कर सकते हैं, रचनात्मकता और स्थिरता को प्रदर्शित करते हैं।

विवरण लिंक:https://chatglm.cn/video?lang=zh

4. Doubao ऐप ने नया वॉइस मोड पेश किया, GPT-4o को पीछे छोड़ते हुए गाना और भूमिका निभाने की क्षमता प्राप्त की

Doubao ऐप द्वारा हाल ही में जारी "एंड-टू-एंड" वॉइस बड़े मॉडल ने वास्तविक समय की वॉइस कॉल कार्यक्षमता में महत्वपूर्ण अपडेट किया है, जो इसकी वॉइस इंटरैक्शन क्षेत्र में एक महत्वपूर्ण सफलता का प्रतीक है। नया मॉडल वॉइस पहचान, समझ और उत्पादन क्षमताओं को एकीकृत करता है, मानव जैसे अभिव्यक्ति और भावनात्मक आउटपुट के साथ, संवाद की बुद्धिमत्ता के स्तर को बढ़ाता है। नया व्यक्तित्व मोड इंटरैक्टिविटी की रुचि को बढ़ाता है, जिससे Doubao भावनात्मक समर्थन और मनोवैज्ञानिक परामर्श जैसे क्षेत्रों में उपयोग के परिदृश्यों को और अधिक व्यापक बनाता है।

【AiBase सारांश:】

🎶 नया "एंड-टू-एंड" वॉइस बड़ा मॉडल वॉइस पहचान, समझ और उत्पादन को एकीकृत करता है, संवाद की प्रवाहिता को बढ़ाता है।

🌟 नया "आत्मा गायक" और "बदलते सितारे" मोड Doubao को गाने और भूमिका निभाने की क्षमता देता है, अद्वितीय व्यक्तित्व को प्रदर्शित करता है।

🤖 नया व्यक्तित्व मोड "सहायता करने वाला छोटा पैकेट" और "प्रशंसा मास्टर" इंटरैक्टिविटी की रुचि को बढ़ाता है, AI के उपयोग के परिदृश्यों का विस्तार करता है।

5. OpenAI जल्द ही कंप्यूटर को नियंत्रित करने वाला AI उपकरण "Operator" लॉन्च करने जा रहा है

OpenAI एक AI उपकरण "Operator" विकसित कर रहा है, जो जनवरी 2025 में जारी होने की उम्मीद है। यह उपकरण व्यक्तिगत कंप्यूटर को स्वतंत्र रूप से नियंत्रित कर सकता है, जिसमें कोड लिखना और यात्रा की योजना बनाना जैसी कई कार्यों को निष्पादित कर सकता है। हालांकि कुछ सुरक्षा मूल्यांकन में प्रदर्शन अच्छा है, लेकिन कार्यों को निष्पादित करने की सफलता दर अभी भी मानव से कम है, विशेषज्ञ इसके संभावित सुरक्षा खतरों को लेकर चिंतित हैं। बाजार विश्लेषण का अनुमान है कि AI एजेंट बाजार अगले कुछ वर्षों में तेजी से बढ़ेगा।

【AiBase सारांश:】

🔍 OpenAI का "Operator" उपकरण स्वतंत्र रूप से कंप्यूटर को नियंत्रित करने की क्षमता रखेगा, और कई कार्यों को निष्पादित कर सकेगा।

🛠️ हालांकि "Operator" कुछ कार्यों पर मानव से कम प्रदर्शन करता है, इसकी सफलता दर अपेक्षाकृत कम है।

⚠️ विशेषज्ञ "Operator" के संभावित सुरक्षा खतरों को लेकर चिंतित हैं, हालांकि इसकी सुरक्षा मूल्यांकन में प्रदर्शन अच्छा है।

6. चीनी फ़ॉन्ट का समर्थन! Meitu WHEE "AI पोस्टर" फ़ीचर जल्द ही लॉन्च होने वाला है

Meitu कंपनी ने हाल ही में WHEE ऐप के "AI पोस्टर" फ़ीचर को लॉन्च करने की घोषणा की है, जिसका उद्देश्य आर्टिफिशियल इंटेलिजेंस तकनीक के माध्यम से पोस्टर बनाने की प्रक्रिया को सरल बनाना है। उपयोगकर्ता केवल एक वाक्य दर्ज करके विभिन्न शैलियों के पोस्टर उत्पन्न कर सकते हैं, विशेष रूप से चीनी फ़ॉन्ट का समर्थन करते हैं, जो व्यक्तिगत आवश्यकताओं को पूरा करते हैं। इसके अलावा, इस फ़ीचर में शक्तिशाली कस्टम लेआउट क्षमता है, जो कई प्रमुख परिदृश्यों को कवर करती है, जिससे उपयोगकर्ताओं को प्रभावी डिज़ाइन में मदद मिलती है।

【AiBase सारांश:】

🎨 उपयोगकर्ता सरल इनपुट के माध्यम से विभिन्न शैलियों के पोस्टर उत्पन्न कर सकते हैं, चीनी फ़ॉन्ट का समर्थन करते हैं।

🛠️ शक्तिशाली कस्टम लेआउट क्षमता प्रदान करता है, जो फिल्मों, ई-कॉमर्स आदि के कई परिदृश्यों के लिए उपयुक्त है।

✨ "बिना काटने की सामग्री" फ़ीचर लॉन्च हो गया है, जो विभिन्न शैलियों के कस्टम PNG सामग्री उत्पन्न करने का समर्थन करता है।

7. Baidu वर्कबुक AI फ़ीचर के मासिक सक्रिय उपयोगकर्ताओं की संख्या 90 मिलियन से अधिक, भुगतान करने वाले उपयोगकर्ताओं की संख्या 40 मिलियन से अधिक

हाल ही में Baidu AI ओपन डे इवेंट में, Baidu के उपाध्यक्ष वांग यिंग ने AI तकनीक के अनुप्रयोग में Baidu वर्कबुक की महत्वपूर्ण प्रगति साझा की। प्लेटफ़ॉर्म के मासिक सक्रिय उपयोगकर्ताओं की संख्या 90 मिलियन से अधिक हो गई है, भुगतान करने वाले उपयोगकर्ताओं की संख्या 40 मिलियन को पार कर गई है, जो AI फ़ीचर्स की बड़ी आकर्षण को दर्शाता है। पिछले वर्ष में, Baidu वर्कबुक ने 100 से अधिक AI फ़ीचर्स जोड़े हैं, जिसमें स्मार्ट PPT, संपूर्ण नेटवर्क खोज आदि जैसे नवोन्मेषी उपकरण शामिल हैं, जो उपयोगकर्ताओं के दस्तावेज़ प्रसंस्करण और अध्ययन अनुभव को बहुत बढ़ाते हैं।

【AiBase सारांश:】

📈 मासिक सक्रिय उपयोगकर्ताओं की संख्या 90 मिलियन से अधिक, दैनिक सक्रिय उपयोगकर्ताओं में वर्ष दर वर्ष 230% की वृद्धि, प्लेटफ़ॉर्म की बड़ी आकर्षण को दर्शाता है।

🛠️ 100 से अधिक AI फ़ीचर्स जोड़े गए, जिसमें स्मार्ट PPT और संपूर्ण नेटवर्क खोज शामिल हैं, जो उपयोगकर्ताओं की विविध आवश्यकताओं को पूरा करते हैं, दस्तावेज़ प्रसंस्करण की दक्षता को बढ़ाते हैं।

🎨 'फ्री कैनवास' फ़ीचर सार्वजनिक परीक्षण के लिए खुला है, जो बहु-कार्यांतर प्रसंस्करण का समर्थन करता है, रचनात्मक प्रक्रिया को सरल बनाता है, उपयोगकर्ता अनुभव को बढ़ाता है।

8. दुनिया का पहला चैटबॉट ELIZA पुनर्जीवित, 60 साल पहले के कोड से

हाल ही में, अमेरिका और ब्रिटेन की एक शोध टीम ने इतिहास के पहले इलेक्ट्रॉनिक चैटबॉट ELIZA के कोड को सफलतापूर्वक पुनर्जीवित किया है। यह कोड मूल रूप से MIT के प्रोफेसर जोसेफ वेज़ेनबाम द्वारा 1960 के दशक में लिखा गया था। शोधकर्ताओं ने मूल कोड की खोज के बाद तकनीकी समायोजन किए, जिससे इसे फिर से चलाया जा सका, हालांकि कुछ समस्याएं हैं, जैसे कि संख्या दर्ज करते समय प्रोग्राम क्रैश हो जाता है।

【AiBase सारांश:】

🗨️ ELIZA पहला इलेक्ट्रॉनिक चैटबॉट है, जिसका कोड जोसेफ वेज़ेनबाम द्वारा 1960 के दशक में लिखा गया था।

💻 शोध टीम ने इस कोड को सफलतापूर्वक पुनर्जीवित किया और कई तकनीकी समस्याओं को हल किया, जिससे इसे सामान्य रूप से चलने में सक्षम बनाया।

📜 ELIZA कंप्यूटर इतिहास में महत्वपूर्ण महत्व रखती है, इसे चैटबॉट के जनक के रूप में माना जाता है।

9. चीन के शोध टीम ने VideoChat-Flash लंबी वीडियो प्रसंस्करण गति में 100 गुना वृद्धि की घोषणा की

चीन के शोध टीम ने VideoChat-Flash सिस्टम पेश किया है, जिसने स्तरित वीडियो टैग संकुचन तकनीक HiCo का उपयोग करके लंबी वीडियो प्रसंस्करण की दक्षता को महत्वपूर्ण रूप से बढ़ा दिया है। यह तकनीक अतिरिक्त जानकारी को कम करके, गणना की आवश्यकताओं को कम करती है, जबकि मॉडल की समझ क्षमता को बढ़ाती है। प्रयोगात्मक परिणाम दिखाते हैं कि यह सिस्टम कई बेंचमार्क परीक्षणों में उत्कृष्ट प्रदर्शन करता है, जो लंबी वीडियो प्रसंस्करण क्षेत्र में एक उन्नत मॉडल बन गया है।

【AiBase सारांश:】

🌟 शोधकर्ताओं ने स्तरित वीडियो टैग संकुचन तकनीक HiCo का प्रस्ताव रखा, जो लंबी वीडियो प्रसंस्करण की गणना आवश्यकताओं को महत्वपूर्ण रूप से कम करती है।

📹 "VideoChat-Flash" सिस्टम ने बहु-चरणीय शिक्षण विधि को अपनाया, जो संक्षिप्त और लंबी वीडियो के संयोजन में प्रशिक्षण करता है, मॉडल की समझ क्षमता को बढ़ाता है।

🔍 प्रयोगात्मक परिणाम दिखाते हैं कि इस विधि ने कई बेंचमार्क परीक्षणों में नए प्रदर्शन मानकों को स्थापित किया है, जो लंबी वीडियो प्रसंस्करण क्षेत्र में एक उन्नत मॉडल बन गया है।

विवरण लिंक:https://arxiv.org/abs/2501.00574

10. पारंपरिक वेब स्क्रैपर को अलविदा! Firecrawl Extract कोड लिखने की आवश्यकता नहीं, किसी भी वेबसाइट के डेटा को आसानी से स्क्रैप करें

Firecrawl Extract का लॉन्च वेब स्क्रैपर युग के धीरे-धीरे अंत का प्रतीक है। इसकी प्राकृतिक भाषा प्रसंस्करण और शक्तिशाली कार्यक्षमता के साथ, उपयोगकर्ताओं को अब स्क्रैपर स्क्रिप्ट लिखने की चिंता नहीं करनी पड़ेगी, बल्कि डेटा विश्लेषण और अनुप्रयोग पर ध्यान केंद्रित कर सकते हैं, कार्यक्षमता को महत्वपूर्ण रूप से बढ़ा सकते हैं। यह नवोन्मेषी उपकरण डेटा स्क्रैपिंग को और अधिक बुद्धिमान और सरल बनाता है, डेटा संग्रहण तकनीक के आगे के विकास को बढ़ावा देता है।

【AiBase सारांश:】

🛠️ Firecrawl Extract प्राकृतिक भाषा प्रसंस्करण तकनीक के माध्यम से, उपयोगकर्ताओं को केवल पाठ संकेतों के माध्यम से वेबसाइट डेटा निकालने की अनुमति देता है, जटिल प्रोग्रामिंग प्रक्रिया को समाप्त करता है।

🌍 यह उपकरण बहु-भाषा और अंतरराष्ट्रीय वेबसाइटों के डेटा स्क्रैपिंग का समर्थन करता है, जो JavaScript द्वारा प्रस्तुत गतिशील पृष्ठ सामग्री को संसाधित कर सकता है, डेटा की सटीक प्राप्ति सुनिश्चित करता है।

🔗 API इंटरफ़ेस प्रदान करता है, अन्य अनुप्रयोगों के साथ एकीकरण को सरल बनाता है, बड़े पैमाने पर डेटा प्रसंस्करण का समर्थन करता है, बड़े डेटा विश्लेषण की आवश्यकताओं को पूरा करता है।

विवरण लिंक:https://github.com/mendableai/firecrawl

AI दैनिक

站长之家

यह लेख AIbase दैनिक से है