OpenAI ने फिर से एक बड़ा कदम उठाया है! उनका नवीनतम उत्पाद GPT-4o mini, जिसे "सबसे किफायती" छोटे मॉडल के रूप में पेश किया गया है। यह केवल एक मॉडल का उन्नयन नहीं है, बल्कि एक स्मार्ट क्रांति की शुरुआत की तरह है। आज, चलो हम मिलकर GPT-4o mini के रहस्य से पर्दा उठाते हैं और देखते हैं कि यह कैसे बुद्धिमत्ता को और "जमीनी" बनाता है।
ज्यादा बुद्धिमान, ज्यादा किफायती
OpenAI का दृष्टिकोण है कि बुद्धिमत्ता हर जगह मौजूद होनी चाहिए, और GPT-4o mini इस दृष्टिकोण का नवीनतम उदाहरण है। इस मॉडल की लागत में भारी कमी आई है, और प्रदर्शन में भी यह कम नहीं है। इसकी कीमत प्रति मिलियन इनपुट टोकन 15 सेंट और प्रति मिलियन आउटपुट टोकन 60 सेंट है, जो पिछले अग्रणी मॉडल से एक मात्रा में सस्ती है, और GPT-3.5Turbo की तुलना में 60% से अधिक सस्ती है।
GPT-4o mini की कम लागत और कम विलंबता इसे कई कार्यों को करने में सक्षम बनाती है, जैसे कि कई मॉडल (जैसे कई API को कॉल करना) को श्रृंखला या समानांतर में कॉल करना, मॉडल को बहुत सारा संदर्भ देना (जैसे कि पूरा कोड संग्रह या संवाद इतिहास), या तेजी से वास्तविक समय पाठ प्रतिक्रियाओं के माध्यम से ग्राहकों के साथ बातचीत करना (जैसे ग्राहक सहायता चैट बॉट)।
वर्तमान में, GPT-4o mini पाठ और दृश्य API का समर्थन करता है, और भविष्य में यह पाठ, चित्र, वीडियो और ऑडियो के इनपुट और आउटपुट का समर्थन करेगा। मॉडल में 128K टोकन का संदर्भ विंडो है, प्रत्येक अनुरोध में 16K आउटपुट टोकन तक का समर्थन है, और ज्ञान की कटौती तिथि अक्टूबर 2023 है। GPT-4o के साथ साझा किए गए सुधारित टोकनाइज़र के कारण, गैर-अंग्रेजी पाठ को अब और अधिक आर्थिक रूप से प्रभावी ढंग से संसाधित किया जा सकता है।
छोटे आकार में बड़ी बुद्धिमत्ता
GPT-4o mini ने शैक्षणिक बेंचमार्क परीक्षणों में GPT-3.5Turbo और अन्य छोटे मॉडलों को पीछे छोड़ दिया है, चाहे वह पाठ बुद्धिमत्ता हो या मल्टी-मोडल तर्क। यह GPT-4o के समान भाषा रेंज का समर्थन करता है और कार्यों को कॉल करने में उत्कृष्ट प्रदर्शन दिखाता है, जिससे डेवलपर्स को ऐसे एप्लिकेशन बनाने की अनुमति मिलती है जो बाहरी सिस्टम से डेटा प्राप्त कर सकते हैं या क्रियाएँ कर सकते हैं, और GPT-3.5Turbo की तुलना में लंबे संदर्भ प्रदर्शन में सुधार हुआ है।
महत्वपूर्ण बेंचमार्क परीक्षणों में, GPT-4o mini का प्रदर्शन इस प्रकार है:
तर्क कार्य: पाठ और दृश्य तर्क कार्यों में, GPT-4o mini ने 82.0% स्कोर किया, जबकि Gemini Flash ने 77.9% और Claude Haiku ने 73.8% स्कोर किया।
गणित और कोडिंग क्षमताएँ: गणितीय तर्क और कोडिंग कार्यों में, GPT-4o mini ने भी उत्कृष्ट प्रदर्शन किया। MGSM (गणितीय तर्क) परीक्षण में, इसका स्कोर 87.0% है, जबकि Gemini Flash का 75.5% और Claude Haiku का 71.7% है। HumanEval (कोडिंग प्रदर्शन) परीक्षण में, इसका स्कोर 87.2% है, जबकि Gemini Flash का 71.5% और Claude Haiku का 75.9% है।
मल्टी-मोडल तर्क: MMMU (मल्टी-मोडल तर्क मूल्यांकन) में, GPT-4o mini ने 59.4% स्कोर किया, जबकि Gemini Flash ने 56.1% और Claude Haiku ने 50.2% स्कोर किया।
निर्मित सुरक्षा उपाय
सुरक्षा हमेशा OpenAI मॉडल विकास का मुख्य केंद्र रही है। पूर्व-प्रशिक्षण चरण में, OpenAI ने उन सूचनाओं को फ़िल्टर किया जो मॉडल को सीखने या आउटपुट करने की इच्छा नहीं थी, जैसे नफरत भरी बातें, वयस्क सामग्री, व्यक्तिगत जानकारी के मुख्य संग्रहण साइटें और स्पैम। प्रशिक्षण के बाद, OpenAI ने मानव प्रतिक्रिया (RLHF) जैसी तकनीकों का उपयोग किया, ताकि मॉडल के व्यवहार को OpenAI की नीतियों के अनुरूप बनाया जा सके, और मॉडल की प्रतिक्रियाओं की सटीकता और विश्वसनीयता में सुधार किया जा सके।
GPT-4o mini में GPT-4o के समान सुरक्षा उपाय हैं, और OpenAI ने मूल तैयारी ढांचे और स्वैच्छिक प्रतिबद्धता के आधार पर, स्वचालन और मानव मूल्यांकन के माध्यम से सावधानीपूर्वक मूल्यांकन किया। 70 से अधिक सामाजिक मनोविज्ञान और गलत सूचना जैसे क्षेत्रों के बाहरी विशेषज्ञों ने GPT-4o का परीक्षण किया है ताकि संभावित जोखिमों की पहचान की जा सके, और वर्तमान में OpenAI ने इन मुद्दों को हल कर लिया है, और आगामी GPT-4o सिस्टम कार्ड और तैयारी स्कोर कार्ड में विवरण साझा करने की योजना बना रहा है। इन विशेषज्ञों के मूल्यांकन से मिली अंतर्दृष्टि ने GPT-4o और GPT-4o mini की सुरक्षा में सुधार करने में मदद की है।
उपलब्धता और मूल्य निर्धारण
GPT-4o mini अब सहायक API, चैट पूर्णता API और बैच API में पाठ और दृश्य मॉडल के रूप में उपलब्ध है। डेवलपर्स प्रति 1M इनपुट टोकन 15 सेंट और प्रति 1M आउटपुट टोकन 60 सेंट का भुगतान करते हैं (जो लगभग मानक पुस्तक में 2500 पृष्ठों के बराबर है)। हम आने वाले दिनों में GPT-4o mini के लिए फाइन-ट्यूनिंग सुविधाओं को लॉन्च करने की योजना बना रहे हैं।
ChatGPT में, मुफ्त, Plus और टीम उपयोगकर्ता आज से GPT-4o mini तक पहुँच प्राप्त कर सकेंगे, जो GPT-3.5 का स्थान लेगा। व्यवसाय उपयोगकर्ता भी अगले सप्ताह से पहुँच प्राप्त करेंगे, जो OpenAI के मिशन के अनुरूप है कि सभी को AI के लाभों का अनुभव हो।
भविष्य की दृष्टि
OpenAI टीम ने कहा: "पिछले कुछ वर्षों में, हमने AI बुद्धिमत्ता में महत्वपूर्ण प्रगति देखी है, जबकि लागत में भारी कमी आई है। उदाहरण के लिए, 2022 में लॉन्च किए गए कम शक्तिशाली text-davinci-003 मॉडल से, GPT-4o mini की प्रति टोकन लागत 99% कम हो गई है। हम लागत को कम करने के साथ-साथ मॉडल की क्षमताओं को बढ़ाने के लिए प्रतिबद्ध हैं।"
"हम जो भविष्य की कल्पना कर रहे हैं वह है कि मॉडल हर एप्लिकेशन और हर वेबसाइट में बिना किसी रुकावट के एकीकृत हो जाएं। GPT-4o mini डेवलपर्स के लिए शक्तिशाली AI एप्लिकेशन को अधिक कुशलता और किफायती तरीके से बनाने और विस्तारित करने का रास्ता खोलता है। AI का भविष्य अधिक सुलभ, विश्वसनीय होता जा रहा है, और हमारे दैनिक जीवन के डिजिटल अनुभवों में समाहित होता जा रहा है, और हम इस प्रवृत्ति का नेतृत्व करने के लिए उत्साहित हैं।"