ओपन-स्रोत एआई की नई ऊँचाई: DeepSeek V3 Llama3.1 को पार करता है, प्रशिक्षण डेटा 14.8 ट्रिलियन टोकन तक पहुँचता है

AIbase基地

द्वारा प्रकाशितAI समाचार · 3 मिनट पढ़ें · Dec 27, 2024

289

चीन की आर्टिफिशियल इंटेलिजेंस कंपनी DeepSeek ने हाल ही में एक मील का पत्थर साबित होने वाला ओपन-सोर्स बड़ा भाषा मॉडल DeepSeek V3 लॉन्च किया है। इस मॉडल में 6710 अरब पैरामीटर हैं, जो न केवल Meta के Llama3.1 को पार करता है, बल्कि कई बेंचमार्क परीक्षणों में GPT-4 सहित प्रमुख बंद-स्रोत मॉडलों को भी पीछे छोड़ता है।

DeepSeek V3 की प्रमुख विशेषताएँ इसकी मजबूत प्रदर्शन और कुशल विकास प्रक्रिया में निहित हैं। इस मॉडल ने प्रोग्रामिंग प्लेटफॉर्म Codeforces की प्रतियोगिताओं में उत्कृष्ट प्रदर्शन किया है और Aider Polyglot परीक्षण में प्रतिस्पर्धियों से आगे रहा है, जो कोड इंटीग्रेशन क्षमताओं का परीक्षण करता है। मॉडल का प्रशिक्षण 14.8 ट्रिलियन टोकन के विशाल डेटासेट पर किया गया है, जिसका पैरामीटर आकार Llama3.1 के 1.6 गुना है।

AI रोबोट आर्टिफिशियल इंटेलिजेंस (2)

अधिक ध्यान देने योग्य बात यह है कि DeepSeek ने केवल दो महीने और 550 लाख डॉलर की लागत में मॉडल प्रशिक्षण पूरा किया, जो समान उत्पादों के विकास निवेश से काफी कम है।

DeepSeek के पीछे चीन के क्वांटिटेटिव हेज फंड High-Flyer Capital Management का समर्थन है। इस फंड ने 10,000 Nvidia A100 GPU के साथ लगभग 1.38 अरब डॉलर की मूल्यवान सर्वर क्लस्टर का निर्माण किया है। High-Flyer के संस्थापक लियांग वेनफेंग ने कहा कि ओपन-सोर्स AI अंततः वर्तमान बंद मॉडल के एकाधिकार लाभ को तोड़ देगा।

DeepSeek V3 को एक उदार लाइसेंस के तहत जारी किया गया है, जो डेवलपर्स को इसे डाउनलोड, संशोधित करने और व्यावसायिक उपयोग सहित विभिन्न अनुप्रयोगों के लिए उपयोग करने की अनुमति देता है। हालांकि पूर्ण संस्करण को चलाने के लिए अभी भी शक्तिशाली हार्डवेयर समर्थन की आवश्यकता है, लेकिन इस ओपन-सोर्स मॉडल का प्रकाशन AI क्षेत्र में खुले नवाचार की दिशा में एक महत्वपूर्ण कदम का प्रतीक है।

ChatGPT ने गुलाब की छवि बनाने से इंकार कर दिया, जिससे ऑनलाइन बहस छिड़ गई, AI निषिद्ध शब्दों में एक और जोड़ा गया

ChatGPT ने एक गुलाब की छवि बनाने से इनकार करने के बाद ऑनलाइन एक बहस छिड़ गई है, जिससे कृत्रिम बुद्धिमत्ता के लिए निषिद्ध शब्दों की सूची में एक और शब्द जुड़ गया है। यह घटना AI की सीमाओं और इसके संभावित दुरुपयोग पर सवाल उठाती है।

OpenAI ने सभी ChatGPT Plus उपयोगकर्ताओं के लिए GPT-4.5 को चरणबद्ध तरीके से जारी करने की घोषणा की

OpenAI ने अपने नवीनतम और सबसे बड़े कृत्रिम बुद्धिमत्ता मॉडल - GPT-4.5 को ChatGPT Plus उपयोगकर्ताओं के लिए जारी करना शुरू करने की घोषणा की है। कंपनी की योजना के अनुसार, ChatGPT Plus के सब्सक्राइबरों को अगले एक से तीन दिनों में इस मॉडल तक पहुँच मिल जाएगी। OpenAI के मुख्य कार्यकारी अधिकारी सैम अल्टमैन ने बताया कि क्षमता की सीमा के कारण, शुरुआती उपयोगकर्ता पहुँच को नियंत्रित किया जाएगा ताकि उपयोगकर्ताओं की अपेक्षाओं का प्रबंधन किया जा सके। GPT-4.5 OpenAI

बायोमेडिकल अनुसंधान में सहायता करने वाला ओपन-सोर्स फ़्रेमवर्क BioChatter, LLM के उपयोग की बाधाओं को कम करता है

BioChatter एक ओपन-सोर्स फ़्रेमवर्क है जो बायोमेडिकल अनुसंधान को आसान बनाने के लिए डिज़ाइन किया गया है। यह बड़े भाषा मॉडल (LLM) के उपयोग की बाधाओं को कम करके शोधकर्ताओं को जटिल डेटा से अंतर्दृष्टि निकालने में मदद करता है।

कृत्रिम बुद्धिमत्ता बनाम सुपर मारियो! क्लाउड 3.7 का शानदार प्रदर्शन: जेमीनी, GPT-4o का बुरा हाल, खेल जगत का असली राजा कौन है?

क्लाउड 3.7 ने सुपर मारियो जैसे खेलों में अपनी अद्भुत क्षमता दिखाई है, जबकि जेमीनी और GPT-4o पीछे छूट गए हैं। क्या क्लाउड 3.7 खेल जगत का नया राजा बनने जा रहा है? इस लेख में जानिए इस रोमांचक एआई बनाम वीडियो गेम की लड़ाई के बारे में।

AI समाचार

ओपन-स्रोत एआई की नई ऊँचाई: DeepSeek V3 Llama3.1 को पार करता है, प्रशिक्षण डेटा 14.8 ट्रिलियन टोकन तक पहुँचता है

AIbase基地

संबंधित AI समाचार अनुशंसाएँ

ChatGPT ने गुलाब की छवि बनाने से इंकार कर दिया, जिससे ऑनलाइन बहस छिड़ गई, AI निषिद्ध शब्दों में एक और जोड़ा गया

OpenAI ने सभी ChatGPT Plus उपयोगकर्ताओं के लिए GPT-4.5 को चरणबद्ध तरीके से जारी करने की घोषणा की

बायोमेडिकल अनुसंधान में सहायता करने वाला ओपन-सोर्स फ़्रेमवर्क BioChatter, LLM के उपयोग की बाधाओं को कम करता है