आपका स्वागत है 【AI दैनिक】 कॉलम में! यहाँ हर दिन कृत्रिम बुद्धिमत्ता की दुनिया का अन्वेषण करने के लिए आपका मार्गदर्शक है, हर दिन हम आपको AI क्षेत्र की हॉट सामग्री प्रस्तुत करते हैं, डेवलपर्स पर ध्यान केंद्रित करते हैं, तकनीकी प्रवृत्तियों को समझने में आपकी मदद करते हैं और नवीन AI उत्पादों के अनुप्रयोगों के बारे में जानकारी देते हैं।
नवीनतम AI उत्पादजानने के लिए क्लिक करें:https://top.aibase.com/
1. काईशौ ने "केलिंग AI" स्वतंत्र ऐप लॉन्च किया, मोबाइल AI रचनात्मकता में विस्तार किया
काईशौ ने हाल ही में "केलिंग AI" स्वतंत्र ऐप लॉन्च किया है, जो मोबाइल प्लेटफॉर्म पर AI रचनात्मकता के क्षेत्र को विस्तार देने के लिए समर्पित है। यह ऐप काईशौ द्वारा विकसित केलिंग बड़े मॉडल और के图 बड़े मॉडल पर आधारित है, जो वीडियो और चित्र उत्पन्न करने और संपादित करने की क्षमता प्रदान करता है। हालांकि, इसकी कार्यक्षमता वेब संस्करण की तुलना में कम है, लेकिन इसने 3.6 मिलियन उपयोगकर्ताओं को आकर्षित किया है, जिन्होंने 37 मिलियन से अधिक वीडियो और 100 मिलियन चित्र बनाए हैं। यह डॉयिन के "जेड्रीम AI" ऐप के साथ प्रतिस्पर्धा कर रहा है।
【AiBase सारांश:】
🚀 काईशौ ने "केलिंग AI" स्वतंत्र ऐप लॉन्च किया, मोबाइल AI रचनात्मकता में विस्तार किया।
💡 "केलिंग AI" ऐप अपने स्वयं के विकसित बड़े मॉडल पर आधारित है, वीडियो और चित्र उत्पन्न करने और संपादित करने की क्षमता प्रदान करता है।
💪 इसने 3.6 मिलियन उपयोगकर्ताओं को आकर्षित किया है, 37 मिलियन वीडियो और 100 मिलियन चित्र बनाए हैं। डॉयिन के "जेड्रीम AI" के साथ प्रतिस्पर्धा कर रहा है।
2. ज़ीपु AI ने नवीनतम वीडियो मॉडल CogVideoX v1.5 का ओपन-सोर्स संस्करण जारी किया
ज़ीपु तकनीकी टीम ने नवीनतम वीडियो जनरेशन मॉडल CogVideoX v1.5 जारी किया है और इसे ओपन-सोर्स कर दिया है। इस संस्करण में वीडियो जनरेशन क्षमताओं में महत्वपूर्ण सुधार किया गया है, 5/10 सेकंड वीडियो, 768P रिज़ॉल्यूशन और 16 फ्रेम जनरेशन क्षमताओं का समर्थन करता है। नया क्लीयर साउंड प्लेटफॉर्म लॉन्च किया गया है, जो CogSound ऑडियो मॉडल के साथ मिलकर अल्ट्रा HD 4K वीडियो जनरेशन प्रदान करता है। डेटा प्रोसेसिंग और एल्गोरिदम नवाचार वीडियो की गुणवत्ता और निरंतरता सुनिश्चित करते हैं।
【AiBase सारांश:】
🚀 CogVideoX v1.5 ओपन-सोर्स, 5/10 सेकंड वीडियो, 768P रिज़ॉल्यूशन और 16 फ्रेम जनरेशन क्षमताओं का समर्थन करता है।
🎬 नया क्लीयर साउंड प्लेटफॉर्म लॉन्च किया गया है, जो CogSound ऑडियो मॉडल के साथ मिलकर अल्ट्रा HD 4K वीडियो जनरेशन प्रदान करता है।
🔬 डेटा प्रोसेसिंग और एल्गोरिदम नवाचार वीडियो की गुणवत्ता और निरंतरता सुनिश्चित करते हैं।
विवरण लिंक:https://github.com/thudm/cogvideo
3. रिपोर्ट के अनुसार, बाइडू एक AI सहायक के साथ स्मार्ट चश्मे लॉन्च करेगा, जो वेंक्शिन मॉडल पर आधारित है
बाइडू एक AI सहायक के साथ स्मार्ट चश्मे लॉन्च करने की योजना बना रहा है, जिसे 2024 बाइडू वर्ल्ड कॉन्फ्रेंस में प्रदर्शित किया जाएगा। ये चश्मे नवीन कार्यक्षमताओं के साथ आते हैं, जो एक नई स्मार्ट अनुभव प्रदान करते हैं।
【AiBase सारांश:】
🌟 चश्मे में कैमरा होगा, जो फोटो और वीडियो लेने की क्षमता का समर्थन करेगा।
📷 चश्मे एर्नी मॉडल पर आधारित वॉयस इंटरैक्शन का समर्थन करते हैं, उपयोगकर्ता अनुभव को बढ़ाते हैं।
🗣️ बाइडू स्मार्ट चश्मे व्यक्तिगत, चीन के उपयोगकर्ताओं की आवश्यकताओं के अनुसार समाधान प्रदान करेगा।
4. पैसे खर्च करने वाले खिलाड़ियों की खुशी! Krea AI ने Lora प्रशिक्षण सुविधा लॉन्च की
Krea AI ने Lora प्रशिक्षण सुविधा लॉन्च की है, जो उपयोगकर्ताओं को व्यक्तिगत पात्रों, शैलियों, उत्पादों आदि के लिए प्रशिक्षण सेवाएं प्रदान करती है। उपयोगकर्ता कई चित्र अपलोड करके प्रशिक्षण शुरू कर सकते हैं, इंटरफेस सरल और उपयोग में आसान है। प्रशिक्षण पैरामीटर सेट करना आसान है, और प्रशिक्षण का परिणाम अच्छा है, यह शुरुआती उपयोगकर्ताओं के लिए अनुकूल है। सदस्यता की कीमत प्रति माह 10 डॉलर है, जो व्यावसायिक उपयोग का समर्थन करती है।
【AiBase सारांश:】
🔥 Krea AI ने Lora प्रशिक्षण सुविधा लॉन्च की, जिससे उपयोगकर्ता व्यक्तिगत पात्रों, शैलियों, उत्पादों आदि के लिए प्रशिक्षण सेवाएं कस्टमाइज़ कर सकते हैं।
💡 इंटरफेस सरल है, चित्र अपलोड करने के बाद, उपयोगकर्ता आधारभूत पैरामीटर सेट कर सकते हैं, प्रशिक्षण प्रक्रिया सरल और उपयोग में आसान है।
💰 सदस्यता की कीमत प्रति माह 10 डॉलर है, 720 FLux छवियाँ, 36,000 रीयल-टाइम छवियाँ उत्पन्न करने का समर्थन करता है, व्यावसायिक उपयोग का समर्थन करता है।
विवरण लिंक:https://www.krea.ai/train
5. केलिंग ने कस्टम मॉडल कार्यक्षमता लॉन्च की, AI वीडियो जनरेशन में पात्रों की संगति की समस्या को हल किया
केलिंग द्वारा हाल ही में लॉन्च की गई कस्टम मॉडल कार्यक्षमता AI वीडियो जनरेशन के क्षेत्र में एक महत्वपूर्ण突破 है, जो पात्रों की संगति की तकनीकी समस्या को हल करती है। यह कार्यक्षमता रचनाकारों को प्रशिक्षण के लिए कई वीडियो क्लिप अपलोड करने की अनुमति देती है, जो केलिंग द्वारा स्वयं उत्पन्न AI वीडियो का उपयोग करने का समर्थन करती है, जिससे अधिक लचीलापन मिलता है। प्रशिक्षण के बाद, प्रणाली पात्रों की संगति बनाए रखने वाले वीडियो सामग्री उत्पन्न कर सकती है, जो रंगीन रचनात्मक संभावनाओं को प्रदर्शित करती है।
【AiBase सारांश:】
🔑 रचनाकारों को प्रशिक्षण के लिए कई वीडियो क्लिप अपलोड करने की अनुमति है, जो केलिंग द्वारा स्वयं उत्पन्न AI वीडियो का उपयोग करते हैं, अधिक लचीलापन प्रदान करते हैं।
🚀 प्रशिक्षण के बाद, प्रणाली पात्रों की संगति बनाए रखने वाले वीडियो सामग्री उत्पन्न कर सकती है, जो 360 डिग्री घूर्णन प्रदर्शन और जटिल दृश्यों की स्थिर दृश्य विशेषताओं को प्रदर्शित करती है।
💡 KLING1.5 संस्करण 1080p HD वीडियो आउटपुट का समर्थन करता है, विभिन्न प्रारूप विकल्प प्रदान करता है, विभिन्न प्लेटफार्मों की सामग्री आवश्यकताओं को पूरा करता है। आंदोलन ब्रश उपकरण वीडियो रचना की सटीकता और लचीलापन बढ़ाते हैं।
6. छोटा लेकिन शक्तिशाली! पॉकेट स्तर का दृश्य AI मॉडल moondream2, मोबाइल पर चल सकता है
Moondream द्वारा लॉन्च किया गया moondream2 एक प्रदर्शन में उत्कृष्ट कॉम्पैक्ट दृश्य भाषा मॉडल है, जिसमें केवल 1.6 अरब पैरामीटर हैं, जो स्मार्टफोन जैसे छोटे उपकरणों पर चल सकता है। इस मॉडल में शक्तिशाली पाठ और चित्र प्रसंस्करण क्षमताएँ हैं, जो विभिन्न बेंचमार्क परीक्षणों में उत्कृष्ट प्रदर्शन करती हैं। Moondream टीम लगातार मॉडल प्रदर्शन को अपडेट कर रही है, सफलतापूर्वक 4.5 मिलियन डॉलर की फंडिंग जुटाई है, और CEO के पास समृद्ध अनुभव है।
【AiBase सारांश:】
🌟 Moondream ने moondream2 लॉन्च किया, जिसमें केवल 1.6 अरब पैरामीटर हैं, जो स्मार्टफोन जैसे छोटे उपकरणों पर चल सकता है।
💰 Moondream ने सफलतापूर्वक 4.5 मिलियन डॉलर की फंडिंग जुटाई है, CEO ने अमेज़न में काम किया है, और टीम लगातार मॉडल प्रदर्शन को अपडेट कर रही है।
📈 moondream2 में शक्तिशाली पाठ और चित्र प्रसंस्करण क्षमताएँ हैं, जो प्रश्नों का उत्तर देने, OCR, वस्तु गणना और वर्गीकरण करने में सक्षम है, और बेंचमार्क परीक्षणों में उत्कृष्ट प्रदर्शन करती है।
विवरण लिंक:https://huggingface.co/vikhyatk/moondream2
7. शियाओमी ने बड़े मॉडल शियाओ आई के अपग्रेड की घोषणा की: कई उपकरणों पर "संगीत प्रश्नोत्तर" कार्यक्षमता का समर्थन
शियाओमी ने बड़े मॉडल शियाओ आई के संगीत क्षमताओं के अपग्रेड की आधिकारिक घोषणा की है, जिसमें "संगीत प्रश्नोत्तर" कार्यक्षमता जोड़ी गई है, जिसका उपयोगकर्ता कई उपकरणों पर अनुभव कर सकते हैं। यह कार्यक्षमता कृत्रिम बुद्धिमत्ता क्षमताओं में सुधार के आधार पर है, जो उपयोगकर्ताओं को गाने की जानकारी खोजने और पेशेवर संगीत ज्ञान के उत्तर देने में मदद करती है। शियाओ साथी ने इस वर्ष जुलाई में एक महत्वपूर्ण संस्करण अपडेट का अनुभव किया, जिसने प्राकृतिक प्रश्नोत्तर और स्मार्ट सहायक क्षमताओं को全面提升 किया है, उपयोगकर्ता अनुभव को बेहतर बनाया है।
【AiBase सारांश:】
🎵 शियाओमी शियाओ साथी ने "संगीत प्रश्नोत्तर" कार्यक्षमता जोड़ी, जो गाने की जानकारी खोजने और पेशेवर संगीत ज्ञान के उत्तर देने का समर्थन करती है।
📱 यह कार्यक्षमता कई उपकरणों पर उपलब्ध है, उपयोगकर्ताओं को शियाओ साथी को नवीनतम संस्करण में अपग्रेड करने की आवश्यकता है।
🚗 शियाओ साथी ने पिछले अपडेट में प्राकृतिक प्रश्नोत्तर और स्मार्ट सहायक की कई क्षमताओं को全面提升 किया है, उपयोगकर्ता अनुभव को बेहतर बनाया है।
8. Mistral AI ने बहुभाषी सामग्री समीक्षा API लॉन्च किया, OpenAI को चुनौती
Mistral AI ने एक नई सामग्री समीक्षा API लॉन्च की है, जिसका उद्देश्य उद्योग के नेताओं के साथ प्रतिस्पर्धा करना है, AI सुरक्षा और सामग्री फ़िल्टरिंग की समस्याओं को हल करना है। यह API Ministral8B मॉडल पर आधारित है, जो कई प्रकार की हानिकारक सामग्री का पता लगा सकती है, बहुभाषा का समर्थन करती है, और इसे Le Chat प्लेटफॉर्म पर लागू किया गया है। Mistral कई कंपनियों के साथ सहयोग कर रहा है, अपनी परिपक्व तकनीक और यूरोपीय दृष्टिकोण को प्रदर्शित कर रहा है।
【AiBase सारांश:】
🌍 बहुभाषा समर्थन: API 11 भाषाओं को कवर करता है, अश्लील सामग्री, नफरत भरे भाषण आदि हानिकारक सामग्री का पता लगाने में सक्षम है।
🔗 कंपनियों के साथ सहयोग: Le Chat प्लेटफॉर्म पर लागू, माइक्रोसॉफ्ट एज़्योर, क्वालकॉम आदि के साथ सहयोग स्थापित किया।
🔒 तकनीकी लाभ: संवाद के संदर्भ पर आधारित, संभावित हानिकारक सामग्री का पता लगाने की क्षमता को बढ़ाता है।
विवरण लिंक:https://docs.mistral.ai/capabilities/guardrailing/
9. AI "इलेक्ट्रॉनिक जीभ" आई! खाद्य स्वाद का स्वाद ले सकती है, खाद्य ताजगी की आसान जांच
वैज्ञानिकों ने एक नई प्रकार की डिवाइस विकसित की है जिसे "इलेक्ट्रॉनिक जीभ" कहा जाता है, जो कृत्रिम बुद्धिमत्ता तकनीक का उपयोग करके विभिन्न कॉफी मिश्रणों को सटीक रूप से भिन्न कर सकती है, खाद्य और पेय पदार्थों की ताजगी की जांच कर सकती है, और खाद्य परीक्षण और गुणवत्ता नियंत्रण के लिए एक नया समाधान प्रदान कर सकती है। इलेक्ट्रॉनिक जीभ मानव स्वाद तकनीक की नकल करती है, सटीकता और कार्यकुशलता बढ़ाती है, स्वाद विकास को तेज करती है और उत्पाद की गुणवत्ता सुनिश्चित करती है। इसमें खाद्य ताजगी की निगरानी करने की क्षमता है, उपभोक्ताओं के स्वास्थ्य की रक्षा करती है, और व्यापारियों के गुणवत्ता नियंत्रण को सुनिश्चित करती है। भविष्य में इसके अनुप्रयोग की संभावनाएं व्यापक हैं, जो चिकित्सा और पर्यावरण निगरानी जैसे कई क्षेत्रों में विस्तारित हो सकती हैं।
【AiBase सारांश:】
🌟 इलेक्ट्रॉनिक जीभ कृत्रिम बुद्धिमत्ता तकनीक का उपयोग करती है, विभिन्न कॉफी मिश्रणों को सटीक रूप से भिन्न करती है।
🍽️ खाद्य और पेय पदार्थों की ताजगी की जांच करती है, बिगड़ने से रोकती है।
🔬 भविष्य में इलेक्ट्रॉनिक जीभ चिकित्सा और पर्यावरण निगरानी जैसे कई क्षेत्रों में उपयोग की संभावना है।
विवरण लिंक:https://www.nature.com/articles/s41586-024-08003-w
10. गूगल की तकनीक ReCapture: एक क्लिक में "मल्टी-एंगल" वीडियो ब्लॉकबस्टर उत्पन्न कर सकती है
ReCapture तकनीक गूगल रिसर्च इंस्टीट्यूट द्वारा पेश की गई एक नवीन तकनीक है, जो कस्टम कैमरा ट्रैकिंग के साथ वीडियो को फिर से उत्पन्न करती है, जिससे उपयोगकर्ताओं को मूल वीडियो सामग्री को नए दृष्टिकोण से अनुभव करने की अनुमति मिलती है। इस तकनीक के पीछे का सिद्धांत जटिल नहीं है, यह बहु-दृष्टिकोण फैलाव मॉडल और मास्क वीडियो ट्यूनिंग तकनीक के माध्यम से मोटे वीडियो को स्पष्ट, संगत, गतिशील वीडियो में परिवर्तित करता है। गूगल के शोधकर्ताओं ने कहा कि ReCapture को बड़े पैमाने पर प्रशिक्षण डेटा की आवश्यकता नहीं है, यह विभिन्न वीडियो और दृष्टिकोण परिवर्तनों के लिए उपयुक्त है, जिससे सामान्य उपयोगकर्ता भी पेशेवर स्तर के "मल्टी-एंगल" वीडियो को आसानी से बना सकते हैं।
【AiBase सारांश:】
🔍 ReCapture तकनीक उपयोगकर्ताओं को वीडियो को फिर से अनुभव करने की अनुमति देती है, कस्टम कैमरा ट्रैकिंग के साथ नए संस्करण उत्पन्न करती है।
🛠️ बहु-दृष्टिकोण फैलाव मॉडल और मास्क वीडियो ट्यूनिंग तकनीक का उपयोग करके मोटे वीडियो को स्पष्ट, संगत, गतिशील वीडियो में परिवर्तित करती है।
🎥 ReCapture को बड़े पैमाने पर प्रशिक्षण डेटा की आवश्यकता नहीं है, यह विभिन्न वीडियो और दृष्टिकोण परिवर्तनों के लिए उपयुक्त है, जिससे सामान्य उपयोगकर्ता भी पेशेवर स्तर के "मल्टी-एंगल" वीडियो बना सकते हैं।
विवरण लिंक:https://generative-video-camera-controls.github.io/