आपका स्वागत है 【AI दैनिक】 कॉलम में! यह हर दिन कृत्रिम बुद्धिमत्ता की दुनिया की खोज करने का आपका मार्गदर्शक है, हर दिन हम आपको AI क्षेत्र की हॉट सामग्री प्रस्तुत करते हैं, डेवलपर्स पर ध्यान केंद्रित करते हैं, आपको तकनीकी रुझानों को समझने और नवाचार AI उत्पादों के अनुप्रयोगों को जानने में मदद करते हैं।
ताजा AI उत्पादजानने के लिए क्लिक करें:https://top.aibase.com/
1. अली ने FLUX.1-Turbo-Alpha जारी किया: FLUX.1-dev पर आधारित, 8 चरणों में Lora का शुद्धिकरण
अली मामा की क्रिएटिव टीम ने FLUX.1-dev मॉडल प्रशिक्षण पर आधारित FLUX.1-Turbo-Alpha जारी किया है, जो 8 चरणों में Lora मॉडल का उपयोग करता है, मल्टी-हेड डिस्क्रिमिनेटर ने शुद्धिकरण गुणवत्ता को महत्वपूर्ण रूप से बढ़ा दिया है, और विभिन्न FLUX संबंधित अनुप्रयोगों का समर्थन करता है। अनुशंसा मार्गदर्शक स्केल को 3.5 पर सेट किया गया है, Lora स्केल 1 है, भविष्य में और कम चरणों वाले संस्करण जारी किए जाएंगे। मॉडल को Diffusers फ्रेमवर्क के साथ उपयोग किया जा सकता है, कुछ पंक्तियों के कोड के माध्यम से मॉडल को लोड करके उच्च गुणवत्ता वाली छवियां उत्पन्न की जा सकती हैं। प्रशिक्षण प्रक्रिया 10 लाख से अधिक छवियों पर की गई, प्रतिकूल प्रशिक्षण विधि का उपयोग किया गया, 6.3 से अधिक सौंदर्य स्कोर प्राप्त किया गया, और रिज़ॉल्यूशन 800 से अधिक है। FLUX.1-Turbo-Alpha का लॉन्च कृत्रिम बुद्धिमत्ता प्रौद्योगिकी के प्रसार और अनुप्रयोग को बढ़ावा देता है।
【AiBase सारांश:】
🌟 FLUX.1-dev पर आधारित, 8 चरणों के शुद्धिकरण और मल्टी-हेड डिस्क्रिमिनेटर का उपयोग करके छवि उत्पन्न करने की गुणवत्ता में सुधार।
🖼️ टेक्स्ट से छवि उत्पन्न करने और मरम्मत नियंत्रण नेटवर्क का समर्थन करता है, उपयोगकर्ता आसानी से विभिन्न दिलचस्प दृश्यों का निर्माण कर सकते हैं।
📊 प्रशिक्षण प्रक्रिया में प्रतिकूल प्रशिक्षण का उपयोग किया गया, प्रशिक्षण डेटा 10 लाख से अधिक छवियों का है, जो मॉडल के उच्च गुणवत्ता वाले आउटपुट को सुनिश्चित करता है।
विवरण लिंक: https://huggingface.co/alimama-creative/FLUX.1-Turbo-Alpha
2. जटिल संरेखण को अलविदा! F5-TTS टेक्स्ट से वॉयस में रूपांतरण को आसान बनाता है!
हाल ही में, शंघाई जियाओटोंग यूनिवर्सिटी, कैम्ब्रिज यूनिवर्सिटी और गीली ऑटोमोबाइल रिसर्च इंस्टीट्यूट के शोध टीम ने एक नई टेक्स्ट-टू-स्पीच (TTS) प्रणाली, F5-TTS, पेश की है। इस प्रणाली की विशेषता यह है कि यह एक बिना स्व-रिपीटिंग विधि का उपयोग करती है, जो प्रवाह मिलान और प्रसार परिवर्तक (DiT) को जोड़ती है, जिससे पारंपरिक TTS मॉडल में जटिल कदमों को सफलतापूर्वक सरल किया गया है।
【AiBase सारांश:】
🌟 F5-TTS एक नई बिना स्व-रिपीटिंग टेक्स्ट-टू-स्पीच प्रणाली है, जो पारंपरिक TTS मॉडल की जटिलता को सरल बनाती है।
⚡ यह प्रणाली ConvNeXt और DiT को जोड़ती है, टेक्स्ट और वॉयस के संरेखण प्रभाव को बढ़ाती है, और संश्लेषण गुणवत्ता को सुधारती है।
🔒 शोध टीम नैतिक मुद्दों पर ध्यान केंद्रित कर रही है, दुरुपयोग को रोकने के लिए जलचिह्न और पहचान तंत्र को लागू करने की सिफारिश करती है।
परियोजना का प्रवेश: https://github.com/SWivid/F5-TTS
अनुभव लिंक: https://huggingface.co/spaces/mrfakename/E2-F5-TTS
3. OPPO दस्तावेज़ AI नई सुविधाओं का खुलासा! Apple iWork फ़ॉर्मेट रूपांतरण, दस्तावेज़ अनुवाद, स्कैन दस्तावेज़ आदि का समर्थन!
OPPO ने आज एक पूर्व सूचना जारी की, जिसमें घोषणा की गई कि वह एक नई दस्तावेज़ एप्लिकेशन लॉन्च करने जा रहा है। पूर्व सूचना के अनुसार, इस एप्लिकेशन में कई सुविधाओं का समर्थन होगा, जिसमें "दस्तावेज़ आसानी से खोलें", "AI सहायता से लिखें", "फॉर्मेट आसानी से बदलें" और "दस्तावेज़ आसानी से खोजें" शामिल हैं।
【AiBase सारांश:】
📝 OPPO नई दस्तावेज़ एप्लिकेशन लॉन्च करने जा रहा है, जो कई AI सुविधाओं का समर्थन करता है।
🔄 एप्लिकेशन Apple iWork फ़ॉर्मेट रूपांतरण कर सकता है, संगतता में सुधार करता है।
📄 दस्तावेज़ स्कैनिंग और अनुवाद सुविधाएं प्रदान करता है, दस्तावेज़ प्रसंस्करण अनुभव को अनुकूलित करता है।
4. एंट ग्रुप CodeFuse IDE0.6 संस्करण जारी, संपादक निदान समस्या AI सुधार का समर्थन करता है
एंट ग्रुप ने CodeFuse IDE0.6 संस्करण जारी किया, जिसमें संपादक निदान समस्या AI सुधार कार्यक्षमता और अंतर्निहित पूर्णता विशेषता जोड़ी गई है, जो कोड लेखन की सुविधा और दक्षता को बढ़ाती है। IDE प्रमुख प्रोग्रामिंग भाषाओं का समर्थन करता है, कोड लेखन सुझाव, समस्या सुधार आदि की सुविधाएं प्रदान करता है।
【AiBase सारांश:】
🚀 IDE ने संपादक निदान समस्या AI सुधार कार्यक्षमता जोड़ी है, डेवलपर्स माउस होवर करके स्मार्ट सुधार बटन को सक्रिय कर सकते हैं।
⚙️ कोड स्मार्ट पूर्णता अनुभव को अनुकूलित किया गया है, जो ड्रॉपडाउन पूर्णता और अंतर्निहित पूर्णता को एक साथ प्रदर्शित करता है, उपयोगकर्ता Tab कुंजी के माध्यम से अंतर्निहित पूर्णता को तेजी से स्वीकार कर सकते हैं।
💻 CodeFuse IDE एंट द्वारा विकसित बड़े मॉडल और OpenSumi फ्रेमवर्क पर आधारित है, जो स्मार्ट टर्मिनल, यूनिट परीक्षण उत्पन्न करने आदि की सुविधाएं प्रदान करता है।
विवरण लिंक: https://github.com/codefuse-ai/codefuse-ide
5. एप्पल का "मल्टी-मोडल लैब" फिर से उन्नत! MM1.5 ने टेक्स्ट-घनत्व, बहु-चित्र समझ को बढ़ाया
एप्पल ने हाल ही में अपने मल्टी-मोडल आर्टिफिशियल इंटेलिजेंस मॉडल MM1 के लिए एक महत्वपूर्ण अपडेट जारी किया है, इसे MM1.5 संस्करण में अपग्रेड किया गया है। यह अपडेट केवल एक साधारण संस्करण संख्या परिवर्तन नहीं है, बल्कि यह पूरी तरह से क्षमता में सुधार है, जिससे मॉडल विभिन्न क्षेत्रों में अधिक शक्तिशाली प्रदर्शन प्रदर्शित करता है। MM1.5 का मुख्य अपग्रेड इसके नवोन्मेषी डेटा प्रोसेसिंग तरीके में है, जिसमें उच्च-परिभाषा OCR डेटा और संश्लेषित छवि विवरण का उपयोग किया गया है, साथ ही ऑप्टिमाइज्ड विज़ुअल इंस्ट्रक्शन फाइन-ट्यूनिंग डेटा मिश्रण भी है।
【AiBase सारांश:】
🚀 MM1.5 डेटा-केंद्रित प्रशिक्षण विधि का उपयोग करता है, प्रशिक्षण डेटा सेट को अनुकूलित करता है, जो टेक्स्ट पहचान, छवि समझ और दृश्य निर्देशों के कार्यान्वयन में महत्वपूर्ण सुधार प्रदर्शित करता है।
💡 MM1.5 में 10 अरब से 30 अरब पैरामीटर के कई संस्करण शामिल हैं, जिसमें घनत्व और विशेषज्ञ मिश्रण (MoE) रूपांतरण शामिल हैं, यहां तक कि छोटे मॉडल भी प्रभावशाली प्रदर्शन स्तर प्राप्त कर सकते हैं।
🔍 MM1.5 की क्षमता में सुधार मुख्य रूप से टेक्स्ट-घनत्व छवि समझ, दृश्य संदर्भ और स्थान, बहु-छवि तर्क, वीडियो समझ और मोबाइल UI समझ में देखा जाता है, जो अनुप्रयोग परिदृश्यों का विस्तार करता है।
विवरण लिंक: https://arxiv.org/pdf/2409.20566
6. संश्लेषित डेटा विषैला है! मेटा टीम ने पुष्टि की: 1% डेटा बड़े मॉडल को पूरी तरह से नष्ट कर सकता है
हाल ही में AI सर्कल में एक अजीब घटना हुई, जैसे एक खाने वाला ब्लॉगर अचानक अपने द्वारा बनाए गए व्यंजन खाने लगा, और वह धीरे-धीरे अधिक से अधिक व्यस्त होता गया, और व्यंजन भी अधिक से अधिक बुरे होते गए। यह बात सुनने में डरावनी लगती है, पेशेवर शब्द इसे मॉडल क्रैश (model collapse) कहते हैं। मॉडल क्रैश तब होता है जब AI मॉडल प्रशिक्षण प्रक्रिया के दौरान अपने द्वारा उत्पन्न डेटा पर अत्यधिक निर्भर होता है, जिससे एक दुष्चक्र में फंस जाता है, जिससे मॉडल द्वारा उत्पन्न गुणवत्ता धीरे-धीरे खराब होती जाती है, और अंततः पूरी तरह से नष्ट हो जाता है।
【AiBase सारांश:】
🔍 मॉडल क्रैश घटना: AI मॉडल प्रशिक्षण में संश्लेषित डेटा पर अत्यधिक निर्भरता के कारण उत्पन्न गुणवत्ता में गिरावट, अंततः क्रैश।
💡 समाधान: वास्तविक डेटा का प्राथमिक उपयोग करें, संश्लेषित डेटा का सावधानी से उपयोग करें, मॉडल के आकार को नियंत्रित करें, और मॉडल क्रैश से बचें।
📈 प्रयोग से पता चला: केवल 1% संश्लेषित डेटा का उपयोग करने से भी मॉडल क्रैश हो सकता है, और मॉडल का आकार बढ़ने पर क्रैश की घटना अधिक गंभीर होती है।
विवरण लिंक: https://arxiv.org/pdf/2410.04840
7. पुरस्कार विजेता AI चित्र "स्पेस ओपेरा" का कॉपीराइट आवेदन अस्वीकृत
हाल ही में, सिंथेटिक मीडिया कलाकार जेसन एलेन ने अपनी रचना "स्पेस ओपेरा" के लिए कॉपीराइट कार्यालय द्वारा पंजीकरण से इनकार किए जाने के कारण विवाद उत्पन्न किया। एलेन ने निर्णय से असंतोष व्यक्त किया और अपील की, यह मानते हुए कि कार्य में मानव रचनात्मकता का एक बड़ा हिस्सा है, जिसे कॉपीराइट संरक्षण प्राप्त होना चाहिए। AI द्वारा उत्पन्न कार्यों को कॉपीराइट संरक्षण मिलना चाहिए या नहीं, यह एक मुख्य बिंदु बन गया है, जिससे AI कला रचनाओं के कॉपीराइट कानून पर चर्चा हुई है।
【AiBase सारांश:】
🌟 एलेन का मानना है कि कार्य में मानव रचनात्मकता का एक बड़ा हिस्सा है, जिसे कॉपीराइट संरक्षण प्राप्त होना चाहिए।
🤖 कॉपीराइट कार्यालय का मानना है कि AI द्वारा उत्पन्न कार्य में पर्याप्त मानव रचनात्मकता की कमी है, इसलिए पंजीकरण से इनकार किया गया।
📜 एलेन की अपील AI कला रचनाओं के कॉपीराइट कानून पर आगे चर्चा को बढ़ावा दे सकती है।
8. ताइवान सेमीकंडक्टर की तीसरी तिमाही का लाभ 40% बढ़ा, AI उछाल से मांग में वृद्धि
हाल ही में, ताइवान सेमीकंडक्टर ने घोषणा की कि तीसरी तिमाही का शुद्ध लाभ 40% बढ़ने की उम्मीद है, जो AI चिप्स की मांग में वृद्धि के कारण है। कंपनी के ग्राहकों में एप्पल, एनवीडिया जैसी प्रसिद्ध कंपनियां शामिल हैं, जो AI तकनीक के विकास को बढ़ावा देती हैं। बाजार ताइवान सेमीकंडक्टर के भविष्य के प्रदर्शन के प्रति आशावादी है, राजस्व और पूंजी व्यय योजनाओं में भी वृद्धि हुई है।
【AiBase सारांश:】
💰 ताइवान सेमीकंडक्टर की तीसरी तिमाही का शुद्ध लाभ 298.2 बिलियन नए ताइवान डॉलर होने की उम्मीद है, जो पिछले वर्ष की समान अवधि की तुलना में 40% अधिक है।
📈 ताइवान सेमीकंडक्टर के ग्राहक नए उत्पादों को लॉन्च कर रहे हैं, जो इसकी प्रदर्शन को अपेक्षाओं से अधिक बढ़ावा दे रहे हैं।
🌍 ताइवान सेमीकंडक्टर ने नए कारखानों के निर्माण में अधिक निवेश करने की योजना बनाई है, भविष्य में पूंजी व्यय 30 से 32 अरब डॉलर के बीच होने की उम्मीद है।
9. एंथ्रोपिक के सीईओ: AI मानवता को बीमारियों से लड़ने में मदद करेगा, 5-10 वर्षों में मानव जीवनकाल 150 वर्ष तक बढ़ सकता है
एंथ्रोपिक के सीईओ दारियो अमोदेई के लेख में, उन्होंने भविष्य में कृत्रिम बुद्धिमत्ता (AI) के विकास की大胆 भविष्यवाणी की। हालांकि जनता AI के जोखिमों के बारे में चिंतित है, लेकिन उनका मानना है कि AI की सकारात्मक क्षमता विशाल है, जो मानव समाज को अभूतपूर्व प्रगति प्रदान कर सकती है। अमोदेई ने AI जोखिमों से निपटने की तात्कालिकता पर जोर दिया, और तकनीक द्वारा उत्पन्न संभावित भ्रांतियों के बारे में चेतावनी दी। उन्होंने बायोलॉजी, स्वास्थ्य, न्यूरोसाइंस, मानसिक स्वास्थ्य, अर्थशास्त्र, गरीबी और बुद्धिमान राष्ट्रों जैसे क्षेत्रों में AI के परिवर्तन की दृष्टि रखी।
【AiBase सारांश:】
🔬 बायोलॉजी और स्वास्थ्य: AI चिकित्सा प्रगति को तेज कर सकता है, संक्रामक रोगों को नियंत्रित कर सकता है, कैंसर मृत्यु दर को कम कर सकता है, आनुवंशिक रोगों का इलाज कर सकता है, और अनुमानित मानव जीवनकाल 150 वर्ष तक दोगुना हो सकता है।
🧬 बायोलॉजिकल स्वतंत्रता: AI मानव को अधिक बायोलॉजिकल विशेषताओं के नियंत्रण का अधिकार प्रदान करता है, जिसमें प्रजनन और रूप-रंग का चयन शामिल है।
🧠 न्यूरोसाइंस और मानसिक स्वास्थ्य: AI अनुप्रयोग मानसिक रोगों की समझ और उपचार में सुधार करते हैं, मानसिक स्वास्थ्य को बढ़ाते हैं।
10. एप्पल अगले वर्ष 2000 डॉलर की कीमत वाला Vision हेडसेट लॉन्च कर सकता है
एप्पल एक नई प्रकार का Vision हेडसेट लॉन्च करने की योजना बना रहा है, जिसकी कीमत लगभग 2,000 डॉलर है, जो सस्ते सामग्री और कम प्रदर्शन वाले प्रोसेसर का उपयोग करता है। इस उपकरण में EyeSight सुविधा शामिल नहीं है, और यह एप्पल की मिश्रित वास्तविकता योजना का हिस्सा है। एप्पल दूसरे पीढ़ी के Vision Pro, स्मार्ट चश्मे और कैमरा वाले AirPods, साथ ही किफायती iPad जैसे स्क्रीन और यांत्रिक भुजा वाले डेस्कटॉप उपकरण भी लॉन्च करेगा। हालांकि मिश्रित वास्तविकता योजना ने बड़ी सफलता नहीं पाई, एप्पल फिर भी संबंधित उत्पादों के विकास को आगे बढ़ाने के लिए प्रतिबद्ध है।
【AiBase सारांश:】