माइक्रोसॉफ्ट ने नया Phi-3.5 श्रृंखला AI मॉडल लॉन्च किया, गूगल, OpenAI आदि को हराया

AIbase基地

द्वारा प्रकाशितAI समाचार · 5 मिनट पढ़ें · Aug 21, 2024

420

माइक्रोसॉफ्ट ने तीन नए Phi-3.5 मॉडल जारी करने की घोषणा की है, जो बहुभाषी और बहु-आकृति कृत्रिम बुद्धिमत्ता के विकास में इसके नेतृत्व की स्थिति को और मजबूत करते हैं। ये तीन नए मॉडल हैं: Phi-3.5-mini-instruct, Phi-3.5-MoE-instruct और Phi-3.5-vision-instruct, जो विभिन्न अनुप्रयोग परिदृश्यों के लिए हैं।

Phi-3.5Mini Instruct मॉडल एक हल्का AI मॉडल है, जिसमें 3.8 करोड़ पैरामीटर हैं, जो सीमित गणना क्षमता वाले वातावरण के लिए बहुत उपयुक्त है। यह 128k के संदर्भ लंबाई का समर्थन करता है और विशेष रूप से निर्देश निष्पादन क्षमता के लिए अनुकूलित है, जो कोड उत्पन्न करने, गणितीय समस्याओं को हल करने और तार्किक तर्क जैसे कार्यों के लिए उपयुक्त है। आकार में छोटा होने के बावजूद, इस मॉडल ने बहुभाषी और बहु-चरण संवाद कार्यों में उल्लेखनीय प्रतिस्पर्धा दिखाई है, जो समान अन्य मॉडलों को पीछे छोड़ देता है।

लिंक: https://huggingface.co/microsoft/Phi-3.5-mini-instruct

Phi-3.5MoE मॉडल, यह एक "विशेषज्ञ मिश्रण" मॉडल है, जिसमें विभिन्न प्रकार के मॉडल का संयोजन है, प्रत्येक विशिष्ट कार्य पर ध्यान केंद्रित करता है। इसमें 41.9 अरब पैरामीटर हैं, 128k के संदर्भ लंबाई का समर्थन करता है और विभिन्न तर्क कार्यों में मजबूत प्रदर्शन दिखा सकता है। यह मॉडल कोड, गणित और बहुभाषी समझ में उत्कृष्ट प्रदर्शन करता है, और कुछ बेंचमार्क परीक्षणों में बड़े मॉडल जैसे OpenAI के GPT-4o mini को भी पीछे छोड़ देता है।

लिंक: https://huggingface.co/microsoft/Phi-3.5-MoE-instruct

Phi-3.5Vision Instruct मॉडल एक उन्नत बहु-आकृति AI मॉडल है, जिसमें पाठ और चित्र प्रसंस्करण क्षमता का समावेश है, जो चित्र समझ, ऑप्टिकल कैरेक्टर पहचान, चार्ट और तालिका विश्लेषण, और वीडियो सारांश जैसे कार्यों के लिए उपयुक्त है। यह मॉडल भी 128k के संदर्भ लंबाई का समर्थन करता है, जो जटिल बहु-फ्रेम दृश्य कार्यों को संभाल सकता है।

लिंक: https://huggingface.co/microsoft/Phi-3.5-vision-instruct

इन तीन मॉडलों को प्रशिक्षित करने के लिए, माइक्रोसॉफ्ट ने बड़े पैमाने पर डेटा प्रोसेसिंग की। Mini Instruct मॉडल ने 3.4 ट्रिलियन टोकन का उपयोग किया, 512 H100-80G GPU पर 10 दिनों तक प्रशिक्षित किया गया; Vision Instruct मॉडल ने 500 अरब टोकन का उपयोग किया, 6 दिनों की प्रशिक्षण अवधि के बाद; जबकि MoE मॉडल ने 23 दिनों में 4.9 ट्रिलियन टोकन का उपयोग किया।

यह उल्लेखनीय है कि ये तीनों Phi-3.5 मॉडल MIT ओपन-सोर्स लाइसेंस के तहत जारी किए गए हैं, जिससे डेवलपर्स इन सॉफ़्टवेयरों का स्वतंत्र रूप से उपयोग, संशोधन और वितरण कर सकते हैं। यह न केवल माइक्रोसॉफ्ट के ओपन-सोर्स समुदाय के प्रति समर्थन को दर्शाता है, बल्कि अधिक डेवलपर्स को अपने अनुप्रयोगों में अत्याधुनिक AI क्षमताओं को एकीकृत करने की अनुमति देता है।

मुख्य बिंदु:
🌟 माइक्रोसॉफ्ट ने तीन नए AI मॉडल लॉन्च किए हैं, जो हल्के तर्क, मिश्रित विशेषज्ञ और बहु-आकृति कार्यों के लिए हैं।
📊 Phi-3.5MoE ने बेंचमार्क परीक्षणों में GPT-4o mini को पीछे छोड़ दिया, उत्कृष्ट प्रदर्शन किया।
📜 तीनों मॉडल MIT ओपन-सोर्स लाइसेंस के तहत हैं, डेवलपर्स स्वतंत्र रूप से उपयोग और संशोधन कर सकते हैं।

CoreWeave और OpenAI ने 119 अरब डॉलर के AI इन्फ्रास्ट्रक्चर समझौते पर हस्ताक्षर किए, गहरे सहयोग को बढ़ाया

हाल ही में, GPU क्लाउड सेवा कंपनी CoreWeave ने OpenAI के साथ 119 अरब डॉलर के एक रणनीतिक सहयोग समझौते की घोषणा की, जो पाँच वर्षों तक चलेगा। समझौते के अनुसार, CoreWeave OpenAI को अपने AI मॉडल के प्रशिक्षण और वितरण को बढ़ावा देने के लिए आवश्यक कंप्यूटिंग शक्ति प्रदान करेगा। यह बड़ा लेन-देन कृत्रिम बुद्धिमत्ता के क्षेत्र में दोनों कंपनियों के गहन सहयोग का प्रतीक है। सहयोग के हिस्से के रूप में, CoreWeave OpenAI को 3.

माइक्रोसॉफ्ट ने दक्षिण अफ़्रीका में कृत्रिम बुद्धिमत्ता के बुनियादी ढाँचे के लिए $2.98 अरब का निवेश किया

प्रौद्योगिकी दिग्गज माइक्रोसॉफ्ट ने हाल ही में दक्षिण अफ़्रीका में कृत्रिम बुद्धिमत्ता और डेटा केंद्र के बुनियादी ढांचे के निर्माण के लिए $2.98 अरब का निवेश करने की घोषणा की है। यह कदम दक्षिण अफ़्रीका के डिजिटल अर्थव्यवस्था के विकास को बढ़ावा देने और स्थानीय व्यवसायों और व्यक्तियों को बेहतर तकनीकी सहायता और सेवाएँ प्रदान करने के उद्देश्य से है। जैसा कि दुनिया भर में कृत्रिम बुद्धिमत्ता की मांग लगातार बढ़ रही है, माइक्रोसॉफ्ट का निवेश दक्षिण अफ़्रीका की इस क्षेत्र में प्रतिस्पर्धा को मजबूत करने में मदद करेगा। माइक्रोसॉफ्ट की निवेश योजना में न केवल धन का निवेश शामिल है, बल्कि प्रौद्योगिकी की शुरूआत और प्रतिभा का विकास भी शामिल है। स्थानीय व्यवसायों और शिक्षण संस्थानों के साथ सहयोग से, माइक्रोसॉफ्ट दक्षिण अफ़्रीका में...

AI बाज़ार में बड़ा उलटफेर: Black Forest Labs ने मारी बाज़ी, DALL-E में 80% की गिरावट

कृत्रिम बुद्धिमत्ता बाज़ार अभूतपूर्व बदलाव का सामना कर रहा है। Poe प्लेटफ़ॉर्म की नवीनतम समग्र रिपोर्ट के अनुसार, 2025 की शुरुआत में AI क्षेत्र में प्रतिस्पर्धा का स्वरूप नाटकीय रूप से बदल गया है, और उभरते हुए उद्यम तेज़ी से दिग्गज कंपनियों के बाज़ार हिस्सेदारी को कम कर रहे हैं। 100 से अधिक AI मॉडल वाले प्लेटफ़ॉर्म के रूप में, Poe पिछले एक साल के लाखों उपयोगकर्ताओं के इंटरैक्शन डेटा के आधार पर, हमें टेक्स्ट, इमेज और वीडियो जेनरेशन तकनीक के उपयोग पैटर्न का एक अनूठा परिप्रेक्ष्य प्रदान करता है। ये आमतौर पर कड़ाई से संरक्षित उपयोग डेटा, तकनीकी निर्णय लेने वालों को बहुमूल्य बाज़ार अंतर्दृष्टि प्रदान करते हैं। बाज़ार का बिखराव और नया...

DeepSeek R2 की संभावित रिलीज़ 17 मार्च को, Claude Sonnet 3.7 को चुनौती दे सकती है

X प्लेटफ़ॉर्म पर हाल ही में आई खबरों के अनुसार, DeepSeek का अगली पीढ़ी का AI मॉडल, DeepSeek R2, 17 मार्च को आधिकारिक तौर पर लॉन्च किया जा सकता है। इस खबर ने उद्योग में तुरंत ध्यान खींचा है, और कई लोगों का मानना है कि यह नया मॉडल मौजूदा AI दिग्गजों, जैसे Anthropic के Claude Sonnet 3.7 को कड़ी चुनौती दे सकता है। X उपयोगकर्ता tanvitabs द्वारा आज सुबह पोस्ट की गई पोस्ट के अनुसार, DeepSeek R2 कई महत्वपूर्ण क्षेत्रों में सफलता का दावा करता है, जिसमें बेहतर...