आपका स्वागत है 【AI दैनिक】 कॉलम में! यह आपका दैनिक मार्गदर्शक है जो आपको कृत्रिम बुद्धिमत्ता की दुनिया का पता लगाने में मदद करेगा। हम प्रतिदिन आपके लिए AI क्षेत्र की नवीनतम खबरें लाते हैं, डेवलपर्स पर ध्यान केंद्रित करते हैं, और आपको तकनीकी रुझानों और नवीन AI उत्पाद अनुप्रयोगों को समझने में मदद करते हैं।
नए AI उत्पादों के बारे में जानने के लिए यहाँ क्लिक करें: https://top.aibase.com/
1. Manus का ओपन-सोर्स विकल्प! Kortix-AI ने आधिकारिक तौर पर ओपन-सोर्स सामान्य AI बुद्धिमान एजेंट प्लेटफॉर्म Suna जारी किया
Kortix-AI ने Suna लॉन्च किया है, जो एक ओपन-सोर्स सामान्य AI बुद्धिमान एजेंट प्लेटफॉर्म है जिसका उद्देश्य Manus का विकल्प बनना है। Suna में कई कार्यक्षमताएँ एकीकृत हैं, जैसे ब्राउज़र ऑटोमेशन, फ़ाइल प्रबंधन और API एकीकरण, जो जटिल कार्यों को स्वचालित करने के लिए प्राकृतिक भाषा संवाद का उपयोग कर सकता है। यह प्रोजेक्ट GitHub पर ऑनलाइन हो गया है और AI डेवलपर्स और ऑटोमेशन उत्साही लोगों का ध्यान आकर्षित कर रहा है।
【AiBase सारांश:】
🌐 Suna में ब्राउज़र ऑटोमेशन, फ़ाइल प्रबंधन और API एकीकरण जैसी कई कार्यक्षमताएँ एकीकृत हैं, जो जटिल कार्यों के स्वचालित प्रसंस्करण का समर्थन करती हैं।
📊 मॉड्यूलर डिज़ाइन के माध्यम से, Suna उपयोगकर्ताओं को डेटा प्रोसेसिंग से लेकर प्रक्रिया स्वचालन तक एक संपूर्ण समाधान प्रदान करता है, जो कई व्यावहारिक परिदृश्यों के लिए उपयुक्त है।
🚀 Suna की ओपन-सोर्स विशेषताएँ और लचीले परिनियोजन विकल्प इसे डेवलपर्स और उद्यमों के लिए एक आदर्श विकल्प बनाते हैं, जिससे विकास और परिनियोजन की बाधाएँ कम हो जाती हैं।
विवरण लिंक:https://github.com/kortix-ai/suna
2. Tencent HunYuan 3D जनरेटिव मॉडल का संस्करण 2.5 आधिकारिक तौर पर जारी किया गया
Tencent HunYuan 3D जनरेटिव मॉडल के संस्करण 2.5 के आधिकारिक तौर पर जारी होने के साथ ही 3D जनरेटिव तकनीक अल्ट्रा-हाई डेफिनिशन युग में प्रवेश कर गई है। इस अपग्रेड ने मॉडलिंग की सटीकता और उपयोगकर्ता अनुभव में उल्लेखनीय सुधार किया है, जिससे 3D सामग्री निर्माण की बाधाएँ कम हो गई हैं। नया संस्करण 4K अल्ट्रा-हाई डेफिनिशन बनावट और बारीक अनाज वाली बम्प मैपिंग का समर्थन करता है, जिससे मॉडल की वास्तविकता और बनावट में काफी वृद्धि हुई है। इसके अलावा, मुफ्त जनरेशन कोटा दोगुना हो गया है, जिससे अधिक रचनाकारों को इसका उपयोग करने और 3D सामग्री निर्माण के प्रसार को बढ़ावा देने के लिए आकर्षित किया गया है।
【AiBase सारांश:】
🚀 मॉडलिंग की सटीकता में सुधार, ज्यामितीय रिज़ॉल्यूशन 1024 तक पहुँच गया है, मॉडल की सतह अधिक चिकनी है, और विवरण अधिक समृद्ध हैं।
💰 मुफ्त जनरेशन कोटा दोगुना हो गया है, जो प्रतिदिन 20 बार तक पहुँच गया है, जिससे अधिक रचनाकारों को इसका उपयोग करने के लिए प्रोत्साहित किया गया है।
🌐 HunYuan 3D जनरेटिव API Tencent Cloud पर ऑनलाइन है, जो उद्यम-स्तरीय अनुप्रयोगों का समर्थन करता है और 3D सामग्री निर्माण के प्रसार को बढ़ावा देता है।
विवरण लिंक:https://3d.hunyuan.tencent.com/
3. Hailuo ने इमेज कैरेक्टर रेफरेंस फ़ंक्शन लॉन्च किया है, जिससे उपयोगकर्ता एकल छवि के आधार पर बहु-कोण और गतिशील मुद्रा वाले पात्र चित्र उत्पन्न कर सकते हैं
MiniMax के अंतर्गत Hailuo AI ने Hailuo Image का एक नया फ़ंक्शन लॉन्च किया है - Character Reference, जो उपयोगकर्ताओं को एकल संदर्भ छवि के आधार पर बहु-कोण और गतिशील मुद्रा वाले पात्र चित्र उत्पन्न करने की अनुमति देता है। इस फ़ंक्शन ने समृद्ध भाव नियंत्रण और सिनेमाई प्रकाश और छाया प्रभाव पेश किए हैं, जिससे AI छवि निर्माण की रचनात्मक अभिव्यक्ति और चरित्र स्थिरता में काफी सुधार हुआ है।
【AiBase सारांश:】
🎭 बहु-कोण और गतिशील मुद्राएँ: उपयोगकर्ता एकल छवि के आधार पर विभिन्न कोणों और मुद्राओं में पात्र चित्र उत्पन्न कर सकते हैं, जबकि पात्र की विशेषताओं को समान बनाए रखते हैं।
💡 समृद्ध भाव नियंत्रण: विभिन्न प्रकार के पात्र भावों के निर्माण का समर्थन करता है, यह सुनिश्चित करता है कि भावनात्मक अभिव्यक्ति प्राकृतिक और जीवंत है, जो कहानी कहने और ब्रांड सामग्री निर्माण के लिए उपयुक्त है।
🎥 सिनेमाई प्रकाश और छाया और संरचना: पेशेवर प्रकाश और छाया प्रभाव और अनुकूलित संरचना प्रदान करता है, जिससे परिणाम सिनेमाई दृश्यों के समान होते हैं, जिससे दृश्य प्रभाव बढ़ता है।
विवरण लिंक:https://hailuoai.video/create
4. Baidu ने "Xīnxiǎng" ऐप लॉन्च किया है, जिसे जटिल कार्यों के लिए एक पूर्ण प्रबंधित सुपर AI बुद्धिमान एजेंट के रूप में वर्णित किया गया है
Baidu ने हाल ही में Xīnxiǎng ऐप लॉन्च किया है, जो मोबाइल उपकरणों के लिए डिज़ाइन किया गया एक बहु-बुद्धिमान एजेंट सहयोग अनुप्रयोग है। यह ऐप बुद्धिमान तरीकों से उपयोगकर्ताओं के दैनिक जीवन में आने वाली जटिल आवश्यकताओं को हल करता है। Xīnxiǎng ऐप में मैप-आधारित MCP फ़ंक्शन एकीकृत हैं, जो स्वचालित यात्रा अंकन और यात्रा बुकिंग अनुशंसाओं का समर्थन करता है। उपयोगकर्ताओं को केवल अपनी आवश्यकताओं का वर्णन करने की आवश्यकता है, और सिस्टम जल्दी से यात्रा योजना बना सकता है। इसके अलावा, इस ऐप ने स्वास्थ्य और कानूनी क्षेत्रों में बहु-बुद्धिमान एजेंट सहयोग तंत्र पेश किया है, जो अधिक पेशेवर परामर्श सेवाएँ प्रदान करता है।
【AiBase सारांश:】
🗺️ Xīnxiǎng ऐप में मैप-आधारित MCP फ़ंक्शन एकीकृत हैं, जो स्वचालित यात्रा अंकन और यात्रा बुकिंग अनुशंसा सेवाएँ प्रदान करते हैं।
🏥 स्वास्थ्य क्षेत्र में, सिस्टम कई "डॉक्टर AI अवतारों" को संचालित करके संयुक्त परामर्श प्रदान करता है, जो व्यापक स्वास्थ्य सलाह प्रदान करता है।
⚖️ कानूनी सेवाओं के संबंध में, "वकील थिंक टैंक" द्वारा गठित कई वकील AI अवतार उपयोगकर्ताओं को उच्च-गुणवत्ता वाली कानूनी सलाह प्रदान करने के लिए मिलकर काम करते हैं।
5. क्रांतिकारी ओपन-सोर्स TTS मॉडल Dia जारी किया गया: भावनाएँ, गैर-भाषाई संकेतों का पूर्ण समर्थन, वास्तविक मानव संवाद के समान
Nari Labs ने अपना ओपन-सोर्स टेक्स्ट-टू-स्पीच मॉडल Dia जारी किया है, जिसमें 1.6 बिलियन पैरामीटर हैं, जिसका उद्देश्य प्राकृतिक संवाद उत्पन्न करना है। ElevenLabs और Google के उत्पादों की तुलना में, Dia का प्रदर्शन बेहतर है, खासकर भावनात्मक स्वर और गैर-भाषाई संकेतों के मामले में। यह मॉडल शून्य निवेश के साथ विकसित किया गया था, और इसे Hugging Face और GitHub पर ओपन-सोर्स किया गया है, जो उपयोगकर्ताओं को डाउनलोड और स्थानीय परिनियोजन करने की अनुमति देता है।
【AiBase सारांश:】
🎤 Dia एक 1.6 बिलियन पैरामीटर वाला ओपन-सोर्स टेक्स्ट-टू-स्पीच मॉडल है, जिसका उद्देश्य प्राकृतिक संवाद उत्पन्न करना है।
💡 यह मॉडल भावनात्मक स्वर और गैर-भाषाई ऑडियो संकेतों का समर्थन करता है, और विभिन्न प्रकार के टेक्स्ट लेबल की सही व्याख्या कर सकता है।
🔗 Dia का कोड और वज़न Hugging Face और GitHub पर ओपन-सोर्स किया गया है, ताकि उपयोगकर्ता इसे डाउनलोड और अनुभव कर सकें।
विवरण लिंक:https://github.com/nari-labs/dia
6. Grok में बड़ा अपडेट! दृश्य क्षमताएँ, बहुभाषी ऑडियो प्रसंस्करण और रीयल-टाइम खोज फ़ंक्शन लॉन्च किए गए
Grok के नवीनतम अपडेट ने उपयोगकर्ताओं के लिए उल्लेखनीय फ़ंक्शन सुधार लाए हैं, खासकर दृश्य प्रसंस्करण, बहुभाषी ऑडियो इंटरैक्शन और रीयल-टाइम खोज में। ये नए फ़ंक्शन न केवल Grok के बुद्धिमत्ता स्तर को बढ़ाते हैं, बल्कि उपयोगकर्ता इंटरैक्शन अनुभव को भी बेहतर बनाते हैं। दृश्य क्षमताओं के माध्यम से, उपयोगकर्ता विश्लेषण के लिए चित्र अपलोड कर सकते हैं, जबकि बहुभाषी ऑडियो प्रसंस्करण 145 भाषाओं में रीयल-टाइम वॉयस इंटरैक्शन का समर्थन करता है, जिससे क्रॉस-भाषा संचार में काफी सुविधा मिलती है।
【AiBase सारांश:】
🖼️ Grok की दृश्य प्रसंस्करण क्षमताएँ अब ऑनलाइन हैं, उपयोगकर्ता जटिल दृश्य सामग्री का विश्लेषण करने के लिए चित्र अपलोड कर सकते हैं, जिससे अनुप्रयोग मूल्य में वृद्धि होती है।
🌍 145 भाषाओं का समर्थन करने वाला बहुभाषी ऑडियो प्रसंस्करण फ़ंक्शन, उपयोगकर्ता सुचारू वॉयस इंटरैक्शन अनुभव का आनंद ले सकते हैं, जो कई परिदृश्यों के लिए उपयुक्त है।
🔍 नया रीयल-टाइम खोज फ़ंक्शन उपयोगकर्ताओं को वॉयस कमांड के माध्यम से जल्दी से नवीनतम जानकारी प्राप्त करने में सक्षम बनाता है, जिससे जानकारी की समयबद्धता और विश्वसनीयता में सुधार होता है।
7. Genspark AI स्लाइड टूल जारी किया गया है, जो पेशेवर प्रेजेंटेशन निर्माण में क्रांति ला रहा है
Genspark द्वारा लॉन्च किया गया AI स्लाइड टूल स्वचालन और बुद्धिमान एकीकरण के माध्यम से पेशेवर प्रेजेंटेशन निर्माण की दक्षता में उल्लेखनीय रूप से सुधार करता है। यह टूल कई डेटा स्वरूपों के प्रसंस्करण का समर्थन करता है, और शैक्षणिक रिपोर्ट और व्यावसायिक प्रेजेंटेशन जल्दी से उत्पन्न कर सकता है, जो विशेष रूप से शैक्षणिक अनुसंधान और कॉर्पोरेट रिपोर्ट के लिए उपयुक्त है। उपयोगकर्ता प्रतिक्रिया सकारात्मक रही है, यह मानते हुए कि इसकी उच्च दक्षता और कलात्मक शैली वाले फ़ंक्शन ने प्रेजेंटेशन निर्माण के लिए नई संभावनाएँ खोली हैं, और भविष्य में इसे और अधिक अनुकूलित और विस्तारित किया जाएगा।
【AiBase सारांश:】
📊 कई स्वरूपों का डेटा एकीकरण: कई डेटा स्वरूपों के प्रसंस्करण का समर्थन करता है, महत्वपूर्ण जानकारी को स्वचालित रूप से निकालता है और मैन्युअल सॉर्टिंग के समय को कम करता है।
📚 शैक्षणिक रिपोर्ट पीढ़ी: प्राकृतिक भाषा प्रसंस्करण का उपयोग करके उद्धरण और दृश्य चार्ट वाली शैक्षणिक रिपोर्ट जल्दी से उत्पन्न करें, जो शैक्षणिक परिदृश्यों के लिए उपयुक्त है।
🎨 कलात्मक शैली का समर्थन: कई दृश्य अभिव्यक्ति विकल्प प्रदान करता है, उपयोगकर्ता ब्रांड आवश्यकताओं के अनुसार व्यक्तिगत प्रेजेंटेशन उत्पन्न कर सकते हैं।
8. Character.AI ने AvatarFX मॉडल लॉन्च किया है: स्थिर चित्रों में पात्रों को "बोलना" सिखाना