【AI日报】栏目 में आपका स्वागत है! यहाँ हर दिन आप कृत्रिम बुद्धिमत्ता की दुनिया का अन्वेषण करने के लिए एक गाइड है, हर दिन हम आपको AI क्षेत्र की गर्म विषयों को प्रस्तुत करते हैं, डेवलपर्स पर ध्यान केंद्रित करते हैं, आपको तकनीकी प्रवृत्तियों को समझने और नवीन AI उत्पादों के अनुप्रयोगों को जानने में मदद करते हैं।

नवीनतम AI उत्पाद जानने के लिए क्लिक करें: https://top.aibase.com/

1. GPT-SoVITS के समान कम मेमोरी वाले ओपन-सोर्स टेक्स्ट-टू-स्पीच मॉडल Fish Speech

Fish Speech एक नया टेक्स्ट-टू-स्पीच टूल है जो fishaudio द्वारा विकसित किया गया है, यह चीनी, अंग्रेजी और जापानी तीन भाषाओं का समर्थन करता है, इसकी आवाज़ प्रसंस्करण मानव स्तर के करीब है, और यह बड़े पैमाने पर डेटा को प्रोसेस करने के लिए Flash-Attn एल्गोरिदम का उपयोग करता है, जो एक कुशल, सटीक और स्थिर TTS अनुभव प्रदान करता है।

【AiBase सारांश:】

😊 तीन भाषाओं का पूर्ण समर्थन, आवाज़ प्रसंस्करण मानव स्तर के करीब

😊 आवाज़ क्लोनिंग का समर्थन, केवल एक संदर्भ आवाज़ प्रदान करें और क्लोनिंग जल्दी से पूरी हो जाएगी

😊 मेमोरी की बहुत कम आवश्यकता, केवल 4GB, विभिन्न आवाज़ निर्माण मॉडलों का समर्थन करता है

ऑनलाइन अनुभव का पता: https://top.aibase.com/tool/fish-audiowenbenzhuanyuyin

अधिक जानकारी के लिए यहाँ क्लिक करें: https://www.aibase.com/news/9979

2. Meta 3D Gen लॉन्च, 1 मिनट के भीतर टेक्स्ट से 3D संपत्तियों का त्वरित निर्माण

हाल ही में शोधकर्ताओं ने Meta3D Gen (3DGen) नामक एक नई तकनीक का अनावरण किया है, जो एक मिनट से भी कम समय में टेक्स्ट से 3D संपत्तियों का त्वरित निर्माण कर सकती है, उपयोगकर्ताओं को उच्च गुणवत्ता के बनावट और सामग्री के अनुभव प्रदान करती है। यह तकनीक Meta3D AssetGen और Meta3D TextureGen को एकीकृत करती है, जो 3D मॉडल बनाने का एक कुशल तरीका प्रदान करती है, मौजूदा समाधानों की तुलना में तीन से दस गुना तेज।

image.png

【AiBase सारांश:】

🚀 Meta 3D Gen सिस्टम एक मिनट से कम समय में उच्च गुणवत्ता वाली 3D संपत्तियों का निर्माण कर सकता है

💡 Meta3D Gen में Meta3D AssetGen और Meta3DTextureGen की दो प्रमुख तकनीकों का एकीकरण है

✨ AssetGen भौतिक रेंडरिंग पर आधारित सामग्री उत्पन्न करने का समर्थन करता है, जिसमें वास्तविक पुनः प्रकाश प्रभाव होता है।

अधिक जानकारी का लिंक: https://ai.meta.com/research/publications/meta-3d-gen/

3. माइक्रोसॉफ्ट ने GraphRAG ओपन-सोर्स किया, ज्ञान ग्राफ का निर्माण करके बड़े मॉडल की प्रश्नोत्तर, तर्क आदि क्षमताओं को बढ़ाया

माइक्रोसॉफ्ट का नवीनतम ओपन-सोर्स GraphRAG सिस्टम बड़े मॉडल की खोज, प्रश्नोत्तर, सारांश, तर्क आदि क्षमताओं को बढ़ाने के लिए एंटिटी ज्ञान ग्राफ का उपयोग करता है, विशेष रूप से बड़े पैमाने पर डेटा सेट को संभालने के लिए। वैश्विक एंटिटी ज्ञान ग्राफ का निर्माण करके, GraphRAG टेक्स्ट में जटिल संबंधों और इंटरएक्शन को कैप्चर कर सकता है, खोज की सटीकता और व्यापकता को बढ़ा सकता है। इसके अलावा, GraphRAG को टोकन की कम आवश्यकता होती है, जिससे विकास लागत बचती है। समग्र परीक्षणों में यह उत्कृष्ट प्रदर्शन करता है, वर्तमान में सबसे अच्छे RAG तरीकों में से एक है।

【AiBase सारांश:】

💡 GraphRAG एंटिटी ज्ञान ग्राफ का निर्माण करके बड़े मॉडल की खोज, प्रश्नोत्तर, सारांश, तर्क आदि क्षमताओं को बढ़ाता है, विशेष रूप से बड़े पैमाने पर डेटा सेट को संभालने में माहिर है।

💡 GraphRAG के कोर में एंटिटी ज्ञान ग्राफ का निर्माण और सामुदायिक सारांश उत्पन्न करने के दो चरण शामिल हैं, सामुदायिक सारांश डेटा सेट में प्रासंगिक जानकारी निकालता है, जो अधिक व्यापक और सटीक उत्तर उत्पन्न करता है।

💡 GraphRAG की टोकन की आवश्यकता बहुत कम है, जो डेवलपर्स को लागत बचाने में मदद कर सकता है। समग्र परीक्षणों में उत्कृष्ट प्रदर्शन करता है, वर्तमान में सबसे अच्छे RAG तरीकों में से एक है।

अधिक जानकारी का लिंक: https://top.aibase.com/tool/graphrag

4. माइक्रोसॉफ्ट ने डिज़ाइन टूल Designer लॉन्च किया: एक वाक्य में व्यक्तिगत शुभकामना कार्ड बनाएं

माइक्रोसॉफ्ट द्वारा लॉन्च किया गया Microsoft Designer का "Greeting Cards" फ़ीचर उपयोगकर्ताओं को एक अभूतपूर्व व्यक्तिगत शुभकामना कार्ड बनाने का अनुभव प्रदान करता है, जो दैनिक जीवन में AI तकनीक के वास्तविक अनुप्रयोग को प्रदर्शित करता है।

image.png

【AiBase सारांश:】

🎨 टेक्स्ट से डिज़ाइन: उपयोगकर्ता सरल विवरण दर्ज करते हैं, AI इसे अनूठे शुभकामना कार्ड डिज़ाइन में बदलता है।

🖼️ AI द्वारा उत्पन्न छवियाँ: शुभकामना कार्ड डिज़ाइन उपयोगकर्ता के विवरण से प्रेरित होती हैं, और AI द्वारा विस्तृत छवियाँ उत्पन्न की जाती हैं।

✏️ संपादनीय सामग्री: शुभकामना कार्ड के अंदर संपादनीय टेक्स्ट प्रदान किया जाता है, जो उपयोगकर्ताओं की व्यक्तिगत आवश्यकताओं को पूरा करता है।

अधिक जानकारी का लिंक: https://designer.microsoft.com/

5. Tencent का अनुवादक एजेंट कंपनी TRANSAGENTS लॉन्च

TRANSAGENTS Tencent AI प्रयोगशाला द्वारा विकसित एक मल्टी-एजेंट वर्चुअल ट्रांसलेशन पब्लिशिंग कंपनी है, जो साहित्यिक अनुवाद के लिए विशेष रूप से डिज़ाइन की गई है, वास्तविक अनुवाद कंपनियों के वर्चुअल रोल सहयोग मॉडल का अनुकरण करके, सुचारू और कुशल साहित्यिक कार्यों के अनुवाद को संभव बनाती है। TRANSAGENTS का उपयोग करके साहित्यिक अनुवाद की लागत पेशेवर मानव अनुवादकों की तुलना में 80 गुना कम है, और क्षेत्र विशेष ज्ञान की आवश्यकताओं में मानव अनुवाद को पार करती है। यह प्लेटफॉर्म साहित्यिक अनुवाद के क्षेत्र में AI तकनीक की क्षमता को प्रदर्शित करता है, साहित्यिक निर्माण और प्रसार के लिए नई संभावनाएं प्रदान करता है।

image.png

【AiBase सारांश:】

🔑 TRANSAGENTS एक मल्टी-एजेंट वर्चुअल ट्रांसलेशन पब्लिशिंग कंपनी है, जो सुपर लंबे साहित्यिक सामग्री के अनुवाद के लिए विशेष रूप से बनाई गई है, वास्तविक अनुवाद कंपनियों के रोल सहयोग मॉडल का अनुकरण करती है।

💰 TRANSAGENTS का उपयोग करके साहित्यिक अनुवाद की लागत पेशेवर मानव अनुवादकों की तुलना में 80 गुना कम है, अनुवाद लागत को कम करता है और उत्कृष्ट साहित्यिक कार्यों के प्रसार को बढ़ावा देता है।

🌟 TRANSAGENTS क्षेत्र विशेष ज्ञान की आवश्यकताओं में मानव अनुवाद को पार करती है, मानव मूल्यांकनकर्ताओं और उच्च स्तरीय भाषा मॉडल की पसंदीदा है।

अधिक जानकारी का लिंक: https://top.aibase.com/tool/transagents

6. Suno ने iOS क्लाइंट लॉन्च किया, संगीत उत्पन्न करने के लिए आवाज़ का समर्थन करता है

Suno कंपनी द्वारा लॉन्च किया गया iOS एप्लिकेशन मोबाइल फोन को एक वर्चुअल म्यूजिक स्टूडियो में बदल देता है, संगीत निर्माण में क्रांति लाता है, जो डिजिटल युग में रचनात्मक अभिव्यक्ति के तरीकों को बदल सकता है। कानूनी चुनौतियों का सामना करते हुए, लेकिन तकनीक का दावा है कि यह नए कार्यों का निर्माण करने के लिए है। Suno का iOS एप्लिकेशन AI द्वारा उत्पन्न संगीत को大众 तक पहुँचाने की दिशा में एक महत्वपूर्ण कदम है, जो संगीत क्षेत्र के भविष्य के रुझानों का नेतृत्व करता है।

【AiBase सारांश:】

🎵 मोबाइल पर संगीत स्टूडियो: उपयोगकर्ता टेक्स्ट प्रॉम्प्ट दर्ज करके या गुनगुनाते हुए पूरी गाने उत्पन्न कर सकते हैं, विभिन्न संगीत शैलियों की आवश्यकताओं को पूरा करते हैं।

⚖️ कानूनी चुनौतियाँ और स्थिति पर जोर: रिकॉर्ड कंपनियों द्वारा मुकदमा, AI द्वारा उत्पन्न नए कार्यों का दावा, कानूनी लड़ाई का परिणाम AI संगीत उद्योग के विकास को प्रभावित कर सकता है।

🔮 AI संगीत का भविष्य: AI और मानव संगीत निर्माण के बीच की सीमाएँ धुंधली हो गई हैं, जो रचनात्मकता, संगीत उद्योग के भविष्य आदि के बारे में गहन प्रश्न उठाती हैं।

7. Apple के कार्यकारी ने OpenAI बोर्ड में पर्यवेक्षक के रूप में शामिल हुए

मुझे लगता है कि इस लेख में Apple के कार्यकारी Phil Schiller के OpenAI बोर्ड में पर्यवेक्षक के रूप में शामिल होने की खबर दी गई है। इससे Apple को OpenAI के आंतरिक कामकाज को समझने में मदद मिलेगी, और iOS और macOS में ChatGPT को एकीकृत करने की उम्मीद है, Siri की बुद्धिमत्ता को बढ़ाने की संभावना है। Microsoft ने भी OpenAI बोर्ड में शामिल हुआ है, जिससे सहयोग संबंध और जटिल हो गया है।

【AiBase सारांश:】

🍏 Apple के कार्यकारी Phil Schiller OpenAI बोर्ड में पर्यवेक्षक के रूप में शामिल हुए, OpenAI को समझने में मदद करता है।

🤖 Schiller का बोर्ड में शामिल होना iOS और macOS में ChatGPT को एकीकृत करने को बढ़ावा देगा, Siri की बुद्धिमत्ता को बढ़ाएगा।

🔗 Microsoft भी OpenAI बोर्ड में गैर-मतदाता पर्यवेक्षक के रूप में शामिल हुआ है, जिससे OpenAI बोर्ड और जटिल हो गया है।

8. AI द्वारा उत्पन्न वीडियो में पांडा नूडल खा रहा है, Douyin पर 420,000 से अधिक लाइक्स

हाल ही में, Douyin पर AI द्वारा उत्पन्न वीडियो तकनीक ने नई ऊँचाइयों को छू लिया, पांडा और बिल्ली द्वारा चॉपस्टिक से नूडल खाने का वीडियो अविश्वसनीय है। हालाँकि इसमें कुछ खामियाँ हैं, लेकिन भविष्य में AI वीडियो और अधिक यथार्थवादी होंगे।

QQ截图20240703114243.jpg

【AiBase सारांश:】

🐼 वीडियो की यथार्थता ने लोगों को हैरान कर दिया, जो नेटिज़न्स के बीच चर्चा का विषय बना।

😺 AI तकनीक वीडियो निर्माण के क्षेत्र में व्यापक रूप से लागू हो रही है, जो निर्माताओं और दर्शकों को एक नया अनुभव प्रदान करती है।

💻 घरेलू और विदेशी वीडियो बड़े मॉडल की प्रतिस्पर्धा तेज हो रही है, AI द्वारा निर्मित फिल्म और टीवी शो के प्रसिद्ध दृश्य Douyin चुनौती सूची में Top26 पर हैं।

अधिक जानकारी: https://www.aibase.com/news/9993

9. नेटिज़न्स ने GPT-4V को घरेलू कैमरे से जोड़ा, लाखों नेटिज़न्स ने इसे देखा!

एक विदेशी नेटिज़न ने GPT-4Vision को अपने घरेलू कैमरे से जोड़ा, जिससे लाखों नेटिज़न्स का ध्यान आकर्षित हुआ। यह कार्य दैनिक जीवन में AI तकनीक की संभावनाओं को प्रदर्शित करता है, लेकिन यह गोपनीयता और सुरक्षा मुद्दों पर चर्चा को भी जन्म देता है। तकनीक के विकास के साथ, हम और अधिक नवोन्मेषी और सुरक्षित अनुप्रयोगों की अपेक्षा करते हैं।

image.png

【AiBase सारांश:】

👀 GPT-4Vision को घरेलू कैमरे से जोड़ा गया, जिससे लाखों नेटिज़न्स का ध्यान आकर्षित हुआ।

🔒 गोपनीयता और सुरक्षा मुद्दों पर चर्चा को जन्म देता है, व्यक्तिगत जानकारी की सुरक्षा पर ध्यान देने की आवश्यकता को उजागर करता है।

💡 दैनिक जीवन में AI तकनीक की संभावनाओं को प्रदर्शित करता है, तकनीकी अनुप्रयोगों पर लोगों के विचारों को प्रेरित करता है।

अधिक जानकारी: https://www.aibase.com/news/9995

10. गुस्सा! स्कॉटिश कलाकार ने "स्वयं-विनाश" किया, AI के कला पर नकारात्मक प्रभाव का विरोध किया

स्कॉटिश कलाकार माइकल फोर्ब्स ने अपनी कला कृतियों को बर्बाद करके AI के कला क्षेत्र पर नकारात्मक प्रभाव के खिलाफ विरोध जताया। फोर्ब्स ने चार चित्रों पर "संशोधन" किया है, जिनमें जॉन लेनन और अमेरिकी गायक टेलर स्विफ्ट के कार्य शामिल हैं। वह अपनी कार्रवाई के माध्यम से कला क्षेत्र में AI के उल्लंघन के मामलों पर ध्यान आकर्षित करना चाहते हैं। कलाकार अब कंप्यूटर-जनित छवियों के साथ प्रतिस्पर्धा नहीं कर पा रहे हैं, जिससे कई लोगों ने कलाकार के पेशे को छोड़ दिया है।

image.png

【AiBase सारांश:】

⭐ स्कॉटिश कलाकार माइकल फोर्ब्स ने अपनी कला कृतियों को बर्बाद करके AI के कला क्षेत्र पर नकारात्मक प्रभाव के खिलाफ विरोध जताया।

⭐ फोर्ब्स ने चार चित्रों पर "संशोधन" किया है, जिनमें जॉन लेनन और अमेरिकी गायक टेलर स्विफ्ट के कार्य शामिल हैं, वह अपनी कार्रवाई के माध्यम से AI के कला क्षेत्र में उल्लंघनों पर ध्यान आकर्षित करना चाहते हैं।

⭐ कलाकार अब कंप्यूटर-जनित छवियों के साथ प्रतिस्पर्धा नहीं कर पा रहे हैं, जिससे कई लोगों ने कलाकार के पेशे को छोड़ दिया है।