आपका स्वागत है 【AI दैनिक】 कॉलम में! यह आपके लिए हर दिन आर्टिफिशियल इंटेलिजेंस की दुनिया की खोज करने का एक गाइड है, हर दिन हम आपको AI क्षेत्र की हॉट सामग्री प्रदान करते हैं, डेवलपर्स पर ध्यान केंद्रित करते हैं, ताकि आप तकनीकी रुझानों को समझ सकें और नवीनतम AI उत्पादों के अनुप्रयोगों को जान सकें।
नए AI उत्पादों के लिए जानने के लिए क्लिक करें:https://top.aibase.com/
📰🤖📢AI की ताज़ा खबरें
OpenAI ने GPT-4-Turbo का आधिकारिक संस्करण जारी किया, जिसमें छवि पढ़ने की क्षमता है
【AiBase सारांश:】
⭐GPT-4-Turbo का आधिकारिक संस्करण पूरी तरह से खुला है, इसे "gpt-4-turbo" के माध्यम से उपयोग किया जा सकता है, नवीनतम संस्करण "gpt-4-turbo-2024-04-09" है।
⭐GPT-4-Turbo एक दृश्य क्षमता वाला मॉडल है, जो 128k संदर्भ को संभाल सकता है।
⭐ कीमत अपरिवर्तित है, इनपुट $10.00/1000000 टोकन, आउटपुट $30.00/1000000 टोकन, छवि पढ़ना: न्यूनतम $0.00085/ छवि
API जानकारी: https://platform.openai.com/docs/models/continuous-model-upgrades
मूल्य जानकारी: https://openai.com/pricing
संबंधित सीमाएँ: https://platform.openai.com/docs/guides/rate-limits/usage-tiers?context=tier-five
महत्वपूर्ण! GPT-4API का पूरी तरह से उपयोग करने के लिए खुला
【AiBase सारांश:】
⚙️ GPT-4 में अधिक रचनात्मकता है, यह रचनात्मकता और तकनीकी लेखन कार्यों को उत्पन्न करने, संपादित करने और सह-परिष्कृत करने का समर्थन करता है।
🔍 GPT-4 में लंबी संदर्भ प्रक्रिया की क्षमता है, यह लंबे प्रारूप की सामग्री, विस्तारित संवाद और दस्तावेज़ खोज और विश्लेषण जैसे परिदृश्यों के लिए उपयुक्त है।
🏢 कंपनियाँ जैसे कि मॉर्गन स्टेनली ने GPT-4 का उपयोग करना शुरू कर दिया है, इसे आंतरिक रोबोटों में एकीकृत किया है, ताकि वित्तीय पेशेवरों को डेटा खोजने में मदद मिल सके और समय की बचत हो सके।
API के विस्तृत उपयोग निर्देश: https://platform.openai.com/docs/guides/gpt
गूगल ने Gemini1.5Pro का API खोला, कई नई सुविधाएँ जोड़ीं
【AiBase सारांश:】
🎵 Gemini1.5Pro ने मूल ऑडियो समझ क्षमता पेश की है, बिना पहले टेक्स्ट में बदलने की आवश्यकता।
📄 Gemini1.5Pro ने इनपुट मोड की सीमा को विस्तारित किया है, वीडियो सामग्री प्रोसेसिंग का समर्थन करता है।
💻 Gemini API में सुधार किया गया है, जिसमें सिस्टम निर्देशों को मॉडल प्रतिक्रिया और JSON प्रारूप में शामिल किया गया है।
विवरण के लिए यहाँ क्लिक करें:
https://developers.googleblog.com/2024/04/gemini-15-pro-in-public-preview-with-new-features.html
ऑडियो समझ क्षमता:
https://github.com/google-gemini/cookbook/blob/main/quickstarts/Audio.ipynb
SD3 मध्य अप्रैल में जारी होगा! छह विभिन्न आकार के मॉडल होने की उम्मीद है
【AiBase सारांश:】
⭐ SD3 मध्य अप्रैल में आधिकारिक रूप से जारी होने की योजना है, SD3 और SD3Turbo पर दो पेपर पहले ही जारी किए जा चुके हैं।
⭐ SD3 में छह विभिन्न आकार के मॉडल हो सकते हैं, जो विभिन्न आवश्यकताओं को पूरा करते हैं।
⭐ SD3 में 80 अरब पैरामीटर हैं, RTX4090 के लिए उपयुक्त है, 1024x1024 छवि उत्पन्न करने में 34 सेकंड लगते हैं।
SD3 पेपर: https://arxiv.org/abs/2403.12015
SD3Turbo पेपर: https://arxiv.org/abs/2403.03206
अधिक SD3 छवियों को बनाने के लिए यहाँ क्लिक करें: https://sd3.art/
H100 से अधिक प्रदर्शन! इंटेल ने नई पीढ़ी के आर्टिफिशियल इंटेलिजेंस चिप Gaudi3 की घोषणा की, NVIDIA पर दबाव डाला!
【AiBase सारांश:】
⭐ Gaudi3 का प्रदर्शन NVIDIA H100 से बेहतर है, यह सबसे शक्तिशाली AI चिप्स में से एक है।
⭐ Gaudi3 की ऊर्जा दक्षता NVIDIA चिप्स की तुलना में दो गुना से अधिक है, और इसकी गति भी तेज है।
⭐ Gaudi3 में उन्नत 5nm प्रक्रिया है, जिसमें 128GB HBM2e मेमोरी है।
विवरण:
https://www.intel.com/content/www/us/en/newsroom/news/vision-2024-gaudi-3-ai-accelerator.html#gs.7q25hh
Poe ने AI रोबोट निर्माताओं के लिए संदेश-आधारित मूल्य निर्धारण आय मॉडल पेश किया
【AiBase सारांश:】
⭐ Poe ने एक सूचना शुल्क आय मॉडल पेश किया है।
⭐ नया आय मॉडल विभिन्न प्रकार के रोबोट बनाने के लिए प्रोत्साहित करेगा।
⭐ निर्माता अपने रोबोट के लिए प्रति संदेश मूल्य सेट कर सकते हैं, जिससे आय अर्जित कर सकते हैं।
हाल ही में, Mistral AI ने नवीनतम मैग्नेट लिंक जारी किया! 8x22B MoE मॉडल, 281GB का अनलॉक
【AiBase सारांश:】
🌟 Mistral AI ने फिर से मैग्नेट लिंक जारी किया है, 281GB के 8x22B MoE मॉडल को अनलॉक किया है।
🌟 Mistral AI ने एक मैग्नेट लिंक के माध्यम से AI समुदाय में हलचल मचाई है।
🌟 नया MoE मॉडल बहुभाषी है, प्रदर्शन में शक्तिशाली है, और इसका फ्लैगशिप संस्करण सीधे GPT-4 को टारगेट करता है।
Douyin AI विशेष प्रभाव एक-क्लिक जनरेशन में गोबली हुआ
【AiBase सारांश:】
⭐ फिल्म प्रचार टीम ने Douyin के साथ मिलकर Miyazaki एनिमेशन शैली के AI विशेष प्रभाव लॉन्च किए, जिसमें 2 मिलियन उपयोगकर्ताओं ने भाग लिया।
⭐ विशेष प्रभावों के उपयोग ने विवाद को जन्म दिया, समर्थकों ने इसे Miyazaki को श्रद्धांजलि माना, जबकि विरोधियों ने इसे मास्टर की इच्छा के खिलाफ माना।
⭐ विवाद में यह बताया गया कि Miyazaki AI एनीमेशन तकनीक का विरोध करते हैं, लेकिन वास्तविक वीडियो AI तकनीक नहीं है।
Suno संगीत Bilibili के किचन क्षेत्र में धूम मचा रहा है "स्टील गेट ढीली" सबसे लोकप्रिय विषय बन गया है
【AiBase सारांश:】
🎶 गाना "आपका स्टील गेट ढीला है" Bilibili पर एक हलचल पैदा कर रहा है, जो लाखों नेटिज़न्स का ध्यान आकर्षित कर रहा है।
🎤 AI संगीत का उभार, Suno सॉफ़्टवेयर ने किचन संगीत रचना में नेतृत्व किया, और महत्वपूर्ण सफलता हासिल की।
📈 AI संगीत की टिप्पणियों का माहौल सौहार्दपूर्ण है, नेटिज़न्स ने हास्य और मजाक के तरीके से बातचीत की, जिससे रचनात्मकता का प्रदर्शन हुआ।
Apple ने नए मशीन लर्निंग भाषा मॉडल MLLLLM Ferret-UI का अनावरण किया, जो ऐप UI इंटरफेस को समझने के लिए है
【AiBase सारांश:】
⭐️ Ferret-UI मोबाइल UI स्क्रीन के लिए विशेष रूप से डिज़ाइन किया गया MLLLLM है, जिसमें संदर्भ, स्थिति और निष्कर्षण की क्षमता है।
⭐️ "किसी भी रिज़ॉल्यूशन" तकनीक का उपयोग करके, छोटे ऑब्जेक्ट्स की समझने की सटीकता बढ़ाई जाती है।
⭐️ Ferret-UI संवाद क्षमता के माध्यम से विस्तृत विवरण, इंटरएक्टिव संवाद और कार्यों में उत्कृष्टता प्रदर्शन करता है।
पेपर का पता: https://arxiv.org/pdf/2404.05719.pdf
Jack Ma ने आंतरिक नेटवर्क पर आवाज उठाई: अलीबाबा के परिवर्तन के एक वर्ष के परिणामों की पुष्टि की, कहा कि AI युग अभी आया है
【AiBase सारांश:】
⭐ Jack Ma ने अलीबाबा के नए प्रबंधन की हिम्मत की सराहना की, कहा कि कंपनी स्वस्थ विकास की पटरी पर लौट आई है।
⭐ Jack Ma का मानना है कि अलीबाबा का सबसे केंद्रीय परिवर्तन ग्राहक मूल्य की पटरी पर लौटना है।
⭐ Jack Ma ने भविष्यवाणी की है कि इंटरनेट उद्योग में अगले तीन से पांच वर्षों में बड़े बदलाव होंगे, AI युग सही समय पर है।
🤖📱💼AI अनुप्रयोग
बaidu वाणिज्यिक ने AI रचनात्मकता जनरेशन टूल "超能画布" लॉन्च किया
【AiBase सारांश:】
⭐ अद्वितीय छवि बड़े मॉडल और स्मार्ट चेहरे के संयोजन एल्गोरिदम।
⭐ समृद्ध पृष्ठभूमि, कपड़ों के स्विचिंग विकल्प प्रदान करता है।
⭐ व्यक्तियों की भावनाओं, बालों के रंग को स्थानीय रूप से फिर से चित्रित किया जा सकता है।
अनुभव के लिए पता: https://top.aibase.com/tool/chaonenghuabu
वर्तमान में प्रभावी मुफ्त (लॉगिन की आवश्यकता नहीं) GPT-3.5 परियोजनाएँ
1⃣Aurora https://github.com/aurora-develop/aurora
(विभिन्न तरीके से मुफ्त, Render/Vercel आदि के एक-क्लिक तैनाती का समर्थन करता है)
2⃣ChatGPT https://github.com/PawanOsman/ChatGPT
(Docker & Android का समर्थन करता है, बहुत स्थिर)
3⃣FreeGPT35 https://github.com/missuo/FreeGPT35
(कई पैरामीटर, Nginx रिवर्स प्रॉक्सी का समर्थन करता है)
गूगल एक नया AI वीडियो टूल Google Vids लॉन्च करेगा, जिसमें कई सुविधाएँ एकीकृत हैं
【AiBase सारांश:】
📱 Google Vids कई सुविधाओं को एकीकृत करता है, जो उपयोगकर्ताओं को स्टोरीबोर्ड बनाने में मदद करता है।
🖼️ AI तकनीक सामग्री को संपादित करने में मदद करती है, उपयुक्त दृश्यों, चित्रों और संगीत का चयन करती है।
🎙️ उपयोगकर्ता वीडियो में वॉयसओवर जोड़ सकते हैं, जिससे वीडियो की व्यक्तिगतता और पेशेवरता बढ़ती है।
AI अब टाइम-लैप्स वीडियो भी उत्पन्न कर सकता है MagicTime टेक्स्ट इनपुट करके पौधों के बढ़ने का वीडियो उत्पन्न करता है
【AiBase सारांश:】
⭐️ MagicTime मॉडल समय-लैप्स वीडियो उत्पन्न करने पर ध्यान केंद्रित करता है।
⭐️ उत्पन्न वीडियो वास्तविक दुनिया के भौतिक नियमों के अनुसार हैं, जो पौधों के बढ़ने की प्रक्रिया का अपेक्षाकृत प्राकृतिक वीडियो उत्पन्न कर सकते हैं।
⭐️ संकेतों की समझ अधिक सटीक है, उत्पन्न गुणवत्ता भी उच्च है।
परियोजना प्रदर्शन: https://top.aibase.com/tool/magictime
कोड: https://github.com/PKU-YuanGroup/MagicTime
DreamWalk: छवि उत्पन्न करने की शैली और सामग्री पर बारीकी से नियंत्रण प्राप्त करना
【AiBase सारांश:】
⭐ उपयोगकर्ता यह अधिक स्वतंत्रता से निर्धारित कर सकते हैं कि छवि में कौन सा हिस्सा किसी विशेष शैली को अधिक दृढ़ता से दर्शाना चाहिए।
⭐ DreamWalk विभिन्न शैलियों के बीच सहज संक्रमण का समर्थन करता है, जिससे उत्पन्न छवि अधिक सामंजस्यपूर्ण और एकीकृत होती है।