एआई दैनिक: OpenAI ने अब तक का सबसे महँगा o1-pro API लॉन्च किया; Tencent का नया निष्कर्षण मॉडल T1 लॉन्च होगा; स्टेप स्टार Step-Video-TI2V वीडियो मॉडल ओपन सोर्स

आपका स्वागत है 【AI दैनिक】 कॉलम में! यह आपका दैनिक मार्गदर्शक है जो आपको कृत्रिम बुद्धिमत्ता की दुनिया का पता लगाने में मदद करेगा। हम प्रतिदिन आपके लिए AI क्षेत्र की नवीनतम खबरें लेकर आते हैं, डेवलपर्स पर ध्यान केंद्रित करते हैं, और आपको तकनीकी रुझानों और नवीन AI उत्पाद अनुप्रयोगों को समझने में मदद करते हैं।

नए AI उत्पादों की जानकारी के लिए यहाँ क्लिक करें: https://top.aibase.com/

1. सबसे महँगा! OpenAI ने अपग्रेडेड AI मॉडल o1-pro लॉन्च किया, जिसकी कीमत o1 से दस गुना अधिक है

OpenAI ने हाल ही में अपनी नई पीढ़ी के AI मॉडल o1-pro को लॉन्च किया है, जिसका उद्देश्य बेहतर तर्क क्षमता प्रदान करना है। हालाँकि, इसकी उच्च कीमत ने व्यापक ध्यान आकर्षित किया है। o1-pro की इनपुट और आउटपुट कीमतें क्रमशः GPT-4.5 और सामान्य o1 से दोगुनी और दस गुना अधिक हैं। फिर भी, OpenAI को इसके प्रदर्शन पर बहुत उम्मीदें हैं और यह मानता है कि यह डेवलपर्स की जटिल कार्यों की आवश्यकताओं को पूरा कर सकता है।

【AiBase सारांश:】
💡 OpenAI ने नया AI मॉडल o1-pro लॉन्च किया है, जिसका उद्देश्य तर्क क्षमता में सुधार करना है।
💰 o1-pro की कीमत बहुत अधिक है, इनपुट कीमत GPT-4.5 से दोगुनी है, और आउटपुट कीमत सामान्य o1 से दस गुना अधिक है।
🤔 शुरुआती उपयोगकर्ताओं की प्रतिक्रिया o1-pro के बारे में मिली-जुली है, लेकिन कोडिंग और गणितीय समस्याओं में यह अधिक विश्वसनीय है।

2. गति नियंत्रण योग्य! चरण तारों Step-Video-TI2V छवि-से-वीडियो मॉडल ओपन सोर्स किया गया

शंघाई चरण तारों इंटेलिजेंट टेक्नोलॉजी कंपनी लिमिटेड द्वारा लॉन्च किया गया Step-Video-TI2V मॉडल छवि-से-वीडियो क्षेत्र में एक उल्लेखनीय नवाचार है। यह मॉडल 30B पैरामीटर के Step-Video-T2V पर आधारित है, जो उच्च-गुणवत्ता वाले वीडियो उत्पन्न कर सकता है और गति और कैमरा गति को नियंत्रित करने की क्षमता रखता है, जो इसे एनीमेशन निर्माण और लघु वीडियो निर्माण के लिए विशेष रूप से उपयुक्त बनाता है। संगति और गतिशीलता में सुधार करके, यह मॉडल रचनाकारों को अधिक लचीला विकल्प प्रदान करता है, जिससे वे विभिन्न आकारों और प्रभावों की आवश्यकताओं को पूरा कर सकते हैं।

【AiBase सारांश:】
🚀 Step-Video-TI2V मॉडल 30B पैरामीटर पर आधारित है, जो 5 सेकंड, 540P रिज़ॉल्यूशन के वीडियो उत्पन्न कर सकता है, और गति और कैमरा गति को नियंत्रित करने की क्षमता रखता है।
🎨 यह मॉडल एनीमेशन प्रभावों में उत्कृष्ट प्रदर्शन करता है, जो एनीमेशन निर्माण और लघु वीडियो निर्माण के लिए उपयुक्त है, और विभिन्न आकारों में वीडियो उत्पन्न कर सकता है।
🔧 छवि शर्तों और AdaLN मॉड्यूल को शामिल करके, उत्पन्न वीडियो और मूल छवि के बीच संगति और गतिशील नियंत्रण क्षमता में सुधार किया गया है।
अधिक जानकारी के लिए लिंक:https://yuewen.cn/videos

3. Tencent HunYuan ने फिर से नया काम किया! नया तर्क मॉडल T1 21 मार्च की शाम को लॉन्च होगा

Tencent HunYuan ने घोषणा की है कि इसका नया तर्क मॉडल T1 आधिकारिक तौर पर 21 मार्च को लॉन्च किया जाएगा, जो कृत्रिम बुद्धिमत्ता के बड़े मॉडल क्षेत्र में इसके तकनीकी पुनरावृत्ति और उत्पाद उन्नयन का प्रतीक है। साथ ही, Tencent HunYuan बड़े मॉडल ने पहली बार Chatbot Arena की वैश्विक शीर्ष 15 रैंकिंग में जगह बनाई है, जो दर्शाता है कि इसकी तकनीकी क्षमता अंतरराष्ट्रीय स्तर पर अग्रणी है। बाहरी दुनिया को T1 मॉडल की तर्क क्षमता में सुधार की उम्मीद है, जिससे वैश्विक बड़े मॉडल प्रतिस्पर्धा में Tencent की स्थिति और मजबूत होगी।

【AiBase सारांश:】
🚀 Tencent HunYuan 21 मार्च को नया तर्क मॉडल T1 लॉन्च करेगा, जो तकनीकी उन्नयन का प्रतीक है।
🏆 Tencent HunYuan बड़े मॉडल ने पहली बार Chatbot Arena की वैश्विक शीर्ष 15 रैंकिंग में जगह बनाई है, जो इसकी तकनीकी क्षमता को दर्शाता है।
🌍 बाहरी दुनिया को T1 मॉडल की तर्क क्षमता में सुधार की उम्मीद है, जिससे वैश्विक प्रतिस्पर्धा में Tencent की स्थिति मजबूत होगी।

4. लागत केवल दसवाँ हिस्सा! Open-Sora 2.0 ओपन सोर्स वीडियो AI व्यावसायिक स्तर की गुणवत्ता प्रदान करता है

HPC-AI Tech द्वारा हाल ही में लॉन्च किया गया Open-Sora2.0 एक क्रांतिकारी वीडियो AI सिस्टम है, जिसकी प्रशिक्षण लागत पारंपरिक सिस्टम की केवल दसवाँ हिस्सा है, और इसकी आउटपुट गुणवत्ता व्यावसायिक स्तर के उत्पादों के बराबर है। इस सिस्टम ने तीन-चरण प्रशिक्षण प्रक्रिया और एक कुशल स्वचालित एन्कोडर के माध्यम से प्रशिक्षण गति में उल्लेखनीय वृद्धि हासिल की है, हालाँकि रिज़ॉल्यूशन और वीडियो लंबाई पर कुछ प्रतिबंध हैं। Open-Sora2.0 के लॉन्च से वीडियो AI क्षेत्र की लागत संरचना पर गहरा प्रभाव पड़ सकता है, जिससे ओपन सोर्स और व्यावसायिक सिस्टम के बीच प्रतिस्पर्धा को बढ़ावा मिलेगा।

【AiBase सारांश:】
💡 Open-Sora2.0 की प्रशिक्षण लागत केवल 200,000 अमेरिकी डॉलर है, जो मौजूदा उच्च-गुणवत्ता वाले वीडियो जेनरेशन सिस्टम की लाखों डॉलर की लागत से बहुत कम है।
⚙️ यह सिस्टम तीन-चरण प्रशिक्षण प्रक्रिया और वीडियो DC-AE स्वचालित एन्कोडर का उपयोग करता है, जिससे 5.2 गुना तेज प्रशिक्षण गति और दस गुना से अधिक वीडियो जेनरेशन गति मिलती है।
📈 Open-Sora2.0 का VBench स्कोर OpenAI के Sora से केवल 0.69% कम है, जो दृश्य गुणवत्ता और संकेत सटीकता जैसे पहलुओं में उत्कृष्ट प्रदर्शन करता है।

5. बोस्टन डायनामिक्स का Atlas रोबोट फिर से सफल हुआ: मानव स्तर के करीब कार्य क्षमता

बोस्टन डायनामिक्स कंपनी ने हाल ही में अपने मानव-आकार के रोबोट Atlas की नवीनतम कार्य क्षमता का प्रदर्शन किया है। प्रबलित सीखने और गति कैप्चर तकनीक के संयोजन से, Atlas स्वयं सीख सकता है और अधिक प्राकृतिक और लचीले मानव जैसे कार्य प्रदर्शित कर सकता है। इस तकनीकी सफलता को मानव-आकार के रोबोटों को वास्तविक अनुप्रयोग परिदृश्यों के करीब लाने के लिए माना जाता है, खासकर औद्योगिक, चिकित्सा और बचाव क्षेत्रों में संभावित अनुप्रयोगों में।

【AiBase सारांश:】
🤖 Atlas ने प्रबलित सीखने और गति कैप्चर तकनीक के माध्यम से अधिक प्राकृतिक मानव जैसे कार्य प्राप्त किए हैं।
🚀 इस तकनीकी सफलता ने जटिल वातावरण में रोबोटों की अनुकूलनशीलता और समन्वय क्षमता में सुधार किया है।
🌐 बोस्टन डायनामिक्स और RAI इंस्टिट्यूट के बीच सहयोग ने मानव-आकार के रोबोट तकनीक के व्यावसायीकरण के लिए अधिक संभावनाएँ जोड़ी हैं।

6. धमाकेदार! मानव-आकार के रोबोट ने "मानव की ऊपरी सीमा" वाली हरकतें दिखाईं, यूशु G1 ने पहली बार साइड फ्लिप पूरा किया, और वास्तविक व्यक्तिगत चुनौती को भी चुनौती दी!

यूशु टेक्नोलॉजी के G1 मानव-आकार के रोबोट ने सफलतापूर्वक एक कठिन साइड फ्लिप पूरा किया और स्थिर रूप से उतरा, जो रोबोट की गति क्षमता में एक महत्वपूर्ण सफलता का प्रतीक है। इस उपलब्धि ने न केवल G1 की उच्च विश्वसनीयता और सफलता दर को दिखाया, बल्कि दुनिया भर के तकनीकी उत्साही लोगों का ध्यान भी आकर्षित किया। अपनी क्षमता को और अधिक सत्यापित करने के लिए, यूशु टेक्नोलॉजी ने "रोबोट साइड फ्लिप मानव चुनौती प्रतियोगिता" भी शुरू की है, जो लोगों को इस कठिन हरकत को करने के लिए प्रोत्साहित करती है, और विजेता को G1 रोबोट या समान मूल्य का उपहार मिलेगा।

【AiBase सारांश:】
🤸‍♂️ यूशु टेक्नोलॉजी का G1 रोबोट साइड फ्लिप करने वाला दुनिया का पहला मानव-आकार का रोबोट बन गया है।
🏆 यूशु टेक्नोलॉजी ने "रोबोट साइड फ्लिप मानव चुनौती प्रतियोगिता" शुरू की है, जो लोगों को इस कठिन हरकत को करने के लिए प्रोत्साहित करती है।
🌍 इस प्रतियोगिता ने दुनिया भर के तकनीकी उत्साही लोगों का ध्यान आकर्षित किया है, और वे रोबोट के साइड फ्लिप को सफलतापूर्वक दोहराने वाले पहले व्यक्ति का इंतजार कर रहे हैं।

7. Adobe ने "Project Slide Wow" प्रोजेक्ट लॉन्च किया, डेटा को आकर्षक PPT में बदल देता है

Adobe के वार्षिक डिजिटल इनोवेशन सम्मेलन में, "Project Slide Wow" प्रोजेक्ट ने बाजार का व्यापक ध्यान आकर्षित किया। यह जेनेरेटिव AI संचालित उपकरण कच्चे ग्राहक डेटा को आकर्षक PowerPoint प्रेजेंटेशन में जल्दी से बदलने के लिए डिज़ाइन किया गया है, जिससे डेटा विश्लेषकों और मार्केटिंग कर्मचारियों का काम बहुत सरल हो जाता है। उच्च-गुणवत्ता वाले स्लाइड और अंतर्निहित बुद्धिमान सहायक के स्वचालित उत्पादन के माध्यम से, उपयोगकर्ता वास्तविक समय में प्रेजेंटेशन सामग्री को अपडेट और समायोजित कर सकते हैं, जिससे सूचना की सटीकता और समयबद्धता सुनिश्चित होती है।

【AiBase सारांश:】
✨ जेनेरेटिव AI उपकरण कच्चे डेटा को उच्च-गुणवत्ता वाले PPT में जल्दी से बदल सकता है, जिससे निर्माण प्रक्रिया बहुत सरल हो जाती है।
🤖 अंतर्निहित बुद्धिमान सहायक उपयोगकर्ता की आवश्यकताओं का वास्तविक समय में जवाब दे सकता है, अतिरिक्त विज़ुअलाइज़ेशन और गतिशील स्लाइड उत्पादन प्रदान कर सकता है।
📊 वास्तविक समय डेटा अपडेट क्षमता के साथ, यह सुनिश्चित करता है कि प्रेजेंटेशन जानकारी हमेशा नवीनतम रहती है, जिससे व्यावसायिक निर्णय लेने की दक्षता में सुधार होता है।

8. Orpheus TTS: भावनात्मक अभिव्यक्ति मानव के करीब है, नई पीढ़ी का TTS मॉडल

Orpheus TTS एक नया लॉन्च किया गया ओपन सोर्स टेक्स्ट-टू-स्पीच मॉडल है, जिसने अपनी अल्ट्रा-लो लेटेंसी और उच्च भावनात्मक अभिव्यक्ति क्षमता के कारण व्यापक ध्यान आकर्षित किया है। यह मॉडल वास्तविक समय वार्तालाप परिदृश्यों में उत्कृष्ट प्रदर्शन करता है, प्राकृतिक और सहज आवाज आउटपुट प्रदान करता है, जिससे बुद्धिमान आवाज इंटरैक्शन के अनुभव में बहुत सुधार होता है। इसकी ओपन सोर्स विशेषता डेवलपर्स को अधिक अनुकूलन संभावनाएँ भी प्रदान करती है, और भविष्य में यह कई क्षेत्रों में एक बेंचमार्क बन सकता है।

【AiBase सारांश:】

AI दैनिक

站长之家

यह लेख AIbase दैनिक से है

संबंधित AI समाचार अनुशंसाएँ

ऐप्पल ऐप्पल मैप्स लुक अराउंड तस्वीरों का उपयोग करके AI मॉडल को प्रशिक्षित करेगा

OpenAI ने एक नया इमेज जेनरेशन मॉडल लॉन्च किया, Google के वन-लाइन इमेज एडिटिंग को चुनौती देता है

गूगल ने नया रीज़निंग AI मॉडल Gemini 2.5 और Gemini 2.5 Pro का परीक्षण संस्करण जारी किया