एआई दैनिक: X का आधिकारिक खाता निलंबित! Manus का ओपन-सोर्स विकल्प आ रहा है; टेनसेंट का HunYuan वीडियो मॉडल ओपन-सोर्स हुआ; Mistral AI ने दुनिया का सबसे बेहतरीन OCR पेश किया

आपका स्वागत है 【AI दैनिक】 कॉलम में! यह आपका दैनिक मार्गदर्शक है जो आपको कृत्रिम बुद्धिमत्ता की दुनिया का पता लगाने में मदद करता है, हम प्रतिदिन आपके लिए AI क्षेत्र की प्रमुख सामग्री प्रस्तुत करते हैं, डेवलपर्स पर ध्यान केंद्रित करते हैं, जिससे आपको तकनीकी रुझानों को समझने और नवीन AI उत्पाद अनुप्रयोगों को समझने में मदद मिलती है।

नए AI उत्पाद जानकारी के लिए क्लिक करें: https://top.aibase.com/

1, तीन घंटे में Manus की प्रतिकृति! OpenManus का आगमन, GitHub पर 3000+ स्टार प्राप्त किए

OpenManus प्रोजेक्ट ने केवल तीन घंटों में Manus इंटेलिजेंट एजेंट की प्रतिकृति बनाई और जल्दी ही GitHub पर 3300 से अधिक स्टार प्राप्त किए। इस प्रोजेक्ट की स्थापना प्रक्रिया सरल और आसान है, और इसका उपयोग केवल कॉन्फ़िगरेशन फ़ाइल को संशोधित करके किया जा सकता है। OpenManus कई शीर्ष बड़े मॉडल को एकीकृत करता है, जो शक्तिशाली कार्य प्रसंस्करण क्षमता प्रदर्शित करता है, जटिल कार्यों को स्पष्ट चरणों में विभाजित कर सकता है और विस्तृत रिपोर्ट उत्पन्न कर सकता है।

【AiBase सारांश:】
✨ OpenManus ने तीन घंटों में Manus इंटेलिजेंट एजेंट की प्रतिकृति बनाई, और जल्दी ही 3300+ स्टार प्राप्त किए।
🛠️ स्थापना प्रक्रिया सरल है, बस config.toml को संशोधित करें और आप उपयोग शुरू कर सकते हैं।
🤖 कई शीर्ष बड़े मॉडल को एकीकृत करता है, शक्तिशाली कार्य प्रसंस्करण क्षमता प्रदर्शित करता है, और विस्तृत SEO अनुकूलन रिपोर्ट उत्पन्न कर सकता है।
विवरण लिंक:https://github.com/mannaandpoem/OpenManus

2, Manus आमंत्रण कोड के लिए झगड़ा मत करो! CAMEL-AI ने 0 दिनों में Manus सामान्य बुद्धिमान एजेंट OWL को पुनः बनाया

CAMEL-AI टीम द्वारा लॉन्च किया गया OWL प्रोजेक्ट ओपन सोर्स समुदाय के लिए एक नई उम्मीद लाया है। GAIA बेंचमार्क परीक्षण में उत्कृष्ट प्रदर्शन के साथ, OWL ओपन सोर्स फ्रेमवर्क में अग्रणी बन गया है। Manus की तुलना में, OWL न केवल पूरी तरह से ओपन सोर्स है, बल्कि लचीली और कुशल बहु-एजेंट सहयोग क्षमता और शक्तिशाली कार्य स्वचालन कार्य भी प्रदान करता है।

【AiBase सारांश:】
🌟 OWL ने GAIA बेंचमार्क परीक्षण में 58.18 का उच्च स्कोर प्राप्त किया, जो ओपन सोर्स फ्रेमवर्क में पहले स्थान पर है, और Huggingface के Open Deep Research से आगे निकल गया है।
🔧 OWL पूरी तरह से ओपन सोर्स है, डेवलपर्स GitHub पर कोड क्लोन कर सकते हैं, फ्रेमवर्क निर्माण में भाग ले सकते हैं और शक्तिशाली बहु-एजेंट सहयोग क्षमता का अनुभव कर सकते हैं।
📈 CAMEL-AI टीम सक्रिय रूप से भविष्य की योजना बना रही है, जिसमें तकनीकी ब्लॉग लिखना और उपकरण पारिस्थितिकी तंत्र को मजबूत करना शामिल है, जिसका उद्देश्य Manus के कार्यों को पुनः बनाना और उससे आगे निकलना है।
विवरण लिंक:https://github.com/camel-ai/owl

3, अलीबाबा के Tongyi Qianwen रिज़निंग बड़े मॉडल QwQ-32B ने वैश्विक ओपन सोर्स समुदाय में पहला स्थान हासिल किया

अलीबाबा द्वारा लॉन्च किया गया QwQ-32B रिज़निंग मॉडल HuggingFace की रैंकिंग में पहले स्थान पर है, जो उत्कृष्ट प्रदर्शन प्रदर्शित करता है और कई प्रसिद्ध मॉडलों जैसे कि Microsoft के Phi-4 और DeepSeek-R1 से आगे निकल गया है। यह मॉडल गणित और कोड प्रसंस्करण में उत्कृष्ट प्रदर्शन करता है, और इसके छोटे पैरामीटर के कारण, इसे उपभोक्ता-ग्रेड ग्राफिक्स कार्ड पर स्थानीय रूप से तैनात किया जा सकता है, जिससे लागत कम हो जाती है।

【AiBase सारांश:】
🌟 QwQ-32B मॉडल HuggingFace रैंकिंग में पहले स्थान पर है, कई प्रसिद्ध मॉडलों से आगे निकल गया है।
💡 यह मॉडल प्रदर्शन और लागत में एक सफलता है, और उपभोक्ता-ग्रेड ग्राफिक्स कार्ड पर स्थानीय परिनियोजन का समर्थन करता है।
📈 कई बेंचमार्क परीक्षणों में उत्कृष्ट प्रदर्शन, सबसे मजबूत मॉडल DeepSeek-R1 के बराबर।

4, Tencent HunYuan ने इमेज-टू-वीडियो मॉडल HunyuanVideo-I2V जारी किया, और लिप-सिंकिंग जैसे गेमप्ले ऑनलाइन हैं

Tencent ने हाल ही में अपने नए विकसित इमेज-टू-वीडियो जनरेटिव फ्रेमवर्क HunyuanVideo-I2V को ओपन सोर्स किया है, जिसका उद्देश्य ओपन सोर्स समुदाय की खोज को बढ़ावा देना है। यह मॉडल स्थिर छवियों को गतिशील वीडियो में बदल सकता है। उपयोगकर्ताओं को केवल एक छवि अपलोड करने और गतिशील प्रभाव का वर्णन करने की आवश्यकता है, और वे एक जीवंत लघु वीडियो उत्पन्न कर सकते हैं। HunyuanVideo-I2V बहु-मोडल बड़े भाषा मॉडल को एकीकृत करता है, जो छवि अर्थ की समझ को बढ़ाता है।

【AiBase सारांश:】
🖼️ HunyuanVideo-I2V उपयोगकर्ताओं को स्थिर छवियों को जीवंत वीडियो में बदलने की अनुमति देता है, उपयोगकर्ताओं को केवल एक छवि अपलोड करने और गतिशील प्रभाव का वर्णन करने की आवश्यकता है।
🎶 मॉडल स्वचालित रूप से पृष्ठभूमि ध्वनि प्रभाव जोड़ सकता है, वीडियो की रुचि और आकर्षण को बढ़ा सकता है, और लिप-सिंकिंग फ़ंक्शन का भी समर्थन करता है, जिससे पात्र "बोल" या "गा" सकते हैं।
🌐 ओपन सोर्स सामग्री में मॉडल वज़न और अनुमान कोड शामिल हैं, जिन्हें डेवलपर्स GitHub और HuggingFace से डाउनलोड कर सकते हैं, और पहले से ही 900 से अधिक व्युत्पन्न संस्करण हैं।
विवरण लिंक:https://video.hunyuan.tencent.com/

5, दुनिया का सबसे उच्च प्रदर्शन वाला दावा! Mistral ने एक नया OCR API जारी किया जो दस्तावेज़ों का व्यापक विश्लेषण करता है

Mistral द्वारा लॉन्च किया गया OCR API, Mistral OCR, का उद्देश्य उद्यमों की दस्तावेज़ समझ क्षमता में सुधार करना है, जो विभिन्न दस्तावेज़ों से जानकारी को सटीक रूप से निकाल सकता है और इसे संरचित डेटा में व्यवस्थित कर सकता है। यह बहु-भाषाई और बहु-मोडल प्रसंस्करण का समर्थन करता है, दस्तावेज़ स्वरूप को बनाए रखता है, स्व-होस्टिंग विकल्प प्रदान करता है, और बड़े भाषा मॉडल के साथ एकीकृत होता है, जिससे दस्तावेज़ प्रसंस्करण की गति और सटीकता में काफी सुधार होता है। उन उद्यमों के लिए जो असंरचित डेटा चुनौतियों का सामना कर रहे हैं, Mistral OCR निस्संदेह एक क्रांतिकारी तकनीक है जो उद्यमों को डिजिटल परिवर्तन प्राप्त करने में मदद करती है।

【AiBase सारांश:】
📝 Mistral OCR कई भाषाओं और दस्तावेज़ स्वरूपों का समर्थन करता है, हस्तलिखित और मुद्रित पाठ और जटिल चार्ट को सटीक रूप से निकाल सकता है और दस्तावेज़ प्रसंस्करण क्षमता में सुधार कर सकता है।
🔒 स्थानीय परिनियोजन विकल्प प्रदान करता है, जो डेटा सुरक्षा और अनुपालन के लिए उद्यमों की सख्त आवश्यकताओं को पूरा करता है और संवेदनशील जानकारी की सुरक्षा सुनिश्चित करता है।
⚡ Mistral OCR का प्रदर्शन उत्कृष्ट है, प्रसंस्करण गति 2000 पृष्ठ प्रति मिनट तक पहुँच सकती है, जिससे दस्तावेज़ प्रसंस्करण दक्षता में काफी सुधार होता है।
विवरण लिंक:https://mistral.ai/news/mistral-ocr

6, Mobvoi ने TicVoice 7.0 जारी किया, जो सुपरनेचुरल वॉयस क्लोनिंग और क्रॉस-लिंगुअल जनरेशन क्षमता का समर्थन करता है

Mobvoi ने कई शीर्ष विश्वविद्यालयों के साथ मिलकर अगली पीढ़ी के वॉयस जनरेशन मॉडल TicVoice7.0 को लॉन्च किया है, जो वॉयस जनरेशन तकनीक में एक बड़ी सफलता का प्रतीक है। यह इंजन नवीन BiCodec एन्कोडिंग तकनीक का उपयोग करता है, जो वॉयस क्लोनिंग क्षमता और भावनात्मक अभिव्यक्ति में सुधार करता है, और उपयोगकर्ता व्यक्तिगत अनुकूलन के माध्यम से पेशेवर स्तर के वॉयस अनुभव प्राप्त कर सकते हैं।

【AiBase सारांश:】
🎤 TicVoice7.0 BiCodec एन्कोडिंग तकनीक का उपयोग करता है, जो वॉयस टोकन और टेक्स्ट टोकन के उच्च स्तर के एकीकरण को प्राप्त करता है, जिससे जनरेटिंग दक्षता और नियंत्रण में सुधार होता है।
🌟 इस इंजन ने ध्वनि समानता और भावनात्मक अभिव्यक्ति में उल्लेखनीय सुधार किया है, अंतर्राष्ट्रीय सामान्य MOS स्कोर 3.9 से बढ़कर 4.2 हो गया है, जो अधिक प्राकृतिक श्रवण अनुभव प्रदान करता है।
📈 उपयोगकर्ता लिंग, गति आदि विशेषताओं को समायोजित करके व्यक्तिगत अनुकूलन कर सकते हैं, और प्रसारण-स्तरीय पेशेवर डबिंग अनुभव प्राप्त कर सकते हैं, MOS स्कोर 4.7 तक पहुँच गया है, जो फिल्म और खेल जैसे दृश्यों के लिए उपयुक्त है।

7, Windsurf Wave 4 संस्करण जारी किया गया है, जिसमें पूर्वावलोकन फ़ंक्शन जोड़ा गया है, और यह "जहाँ इंगित करें वहाँ संशोधित करें" का समर्थन करता है

Codeium द्वारा हाल ही में जारी किया गया Windsurf Wave 4 प्रोग्रामर के लिए एक नया कोडिंग अनुभव लाया है, खासकर नया पूर्वावलोकन फ़ंक्शन, जिससे कोड संशोधित करते समय प्रभावों को तुरंत देखा जा सकता है, जिससे कोडिंग दक्षता में काफी सुधार होता है। Tab to Import फ़ंक्शन निर्भरता जोड़ना आसान बनाता है, और Cascade सहायक अगले ऑपरेशन के लिए बुद्धिमान सुझाव प्रदान करता है।

【AiBase सारांश:】
🔍 पूर्वावलोकन फ़ंक्शन आपको कोड संशोधित करते समय प्रभावों को तुरंत देखने की अनुमति देता है, जिससे कोडिंग दक्षता में सुधार होता है।
⌨️ Tab to Import फ़ंक्शन निर्भरता पैकेज जोड़ने की प्रक्रिया को सरल करता है, जिससे कार्यप्रवाह में काफी सुधार होता है।
🛠️ Linter एकीकरण वास्तविक समय में कोड गुणवत्ता की जांच करता है, यह सुनिश्चित करता है कि उत्पन्न कोड सटीक है।
विवरण लिंक:https://codeium.com/blog/windsurf-wave-4

8, Anthropic Console का नया प्लेटफ़ॉर्म ऑनलाइन है, जो टीम सहयोग संपादन और प्रॉम्प्ट प्रबंधन फ़ंक्शन का समर्थन करता है

Anthropic ने हाल ही में अपने डेवलपर प्लेटफ़ॉर्म को एक महत्वपूर्ण अपग्रेड दिया है, जिसमें एक नया टीम सहयोग फ़ंक्शन और Claude3.7Sonnet मॉडल की विस्तारित अनुमान क्षमता शुरू की गई है, जिसका उद्देश्य उद्यमों द्वारा कृत्रिम बुद्धिमत्ता के कार्यान्वयन में सामना की जाने वाली समस्याओं का समाधान करना है। नए कार्यों में साझा करने योग्य प्रॉम्प्ट, सोच दृश्य और उच्च-गुणवत्ता वाले प्रॉम्प्ट उत्पन्न करने के लिए उपकरण शामिल हैं, जो टीम सहयोग दक्षता और मॉडल प्रदर्शन में काफी सुधार करते हैं, यह सुनिश्चित करते हैं कि डेवलपर्स अपने AI मॉडल का अधिक आसानी से प्रबंधन और अनुकूलन कर सकें।

AI समाचार

AI दैनिक

AI समयरेखा

अल हार्डवेयर

नवीनतम मामले

छवि संग्रह

वीडियो संग्रह

ऑडियो संग्रह

सामग्री संग्रह

नवीनतम ट्यूटोरियल

AI उत्पाद रैंकिंग

AI ट्रैफ़िक वृद्धि रैंकिंग

AI ट्रैफ़िक गिरावट रैंकिंग

AI साप्ताहिक रैंकिंग

संयुक्त राज्य अमेरिका

चीन

भारत

ब्राजील

छवि निर्माण

निजी सहायक

चरित्र निर्माण

वीडियो निर्माण

AI प्रोजेक्ट रैंकिंग

AI प्रोजेक्ट विकास रैंकिंग

AI डेवलपर रैंकिंग

AI संगठन रैंकिंग

डीपसीक

TTS

LLM

ChatGPT

अवलोकन

站长之家

यह लेख AIbase दैनिक से है