OpenAI का प्रमुख मॉडल GPT-4o ("o" का अर्थ "omni") मई में जारी किया गया, और इसकी ऑडियो समझने की क्षमता ने बहुत ध्यान आकर्षित किया। GPT-4o मॉडल औसतन 320 मिलीसेकंड की गति से ऑडियो इनपुट का उत्तर देने में सक्षम है, जो मानवों के सामान्य वार्तालाप में प्रतिक्रिया समय के समान है।

ChatGPT OpenAI आर्टिफिशियल इंटेलिजेंस (1)

OpenAI ने यह भी घोषणा की कि ChatGPT का वॉयस मोड फीचर GPT-4o मॉडल की ऑडियो क्षमताओं का उपयोग करेगा, जिससे उपयोगकर्ताओं को बिना किसी बाधा के वॉयस वार्तालाप का अनुभव मिलेगा। GPT-4o की वॉयस क्षमताओं के बारे में, OpenAI टीम ने लिखा:

"GPT-4o के माध्यम से, हमने एक नया मॉडल प्रशिक्षित किया है, जो टेक्स्ट, विज़ुअल और ऑडियो तीन मोडालिटीज का एंड-टू-एंड प्रशिक्षण करता है, अर्थात् सभी इनपुट और आउटपुट एक ही न्यूरल नेटवर्क द्वारा संसाधित होते हैं। चूंकि GPT-4o हमारा पहला मॉडल है जो इन सभी मोडालिटीज को जोड़ता है, हम अभी भी मॉडल की संभावनाओं और सीमाओं की प्रारंभिक खोज कर रहे हैं।"

जून में, OpenAI ने घोषणा की कि वह उन्नत वॉयस मोड को बाद में ChatGPT Plus उपयोगकर्ताओं के एक छोटे समूह के लिए अल्फा संस्करण में लॉन्च करने की योजना बना रहा है, लेकिन कुछ सामग्री की पहचान और अस्वीकार करने की क्षमता में सुधार की आवश्यकता के कारण यह योजना एक महीने के लिए टल गई। इसके अलावा, OpenAI अपने बुनियादी ढांचे को भी तैयार कर रहा है ताकि लाखों उपयोगकर्ताओं के लिए वास्तविक समय में प्रतिक्रिया देते हुए विस्तार किया जा सके।

अब, OpenAI के CEO सैम आल्टमैन ने X के माध्यम से पुष्टि की है कि वॉयस मोड का अल्फा संस्करण अगले सप्ताह ChatGPT Plus सब्सक्राइबर्स के लिए उपलब्ध होगा।

image.png

वर्तमान ChatGPT वॉयस मोड औसतन 2.8 सेकंड (GPT-3.5) और 5.4 सेकंड (GPT-4) की देरी के कारण उपयोग में सहज नहीं है। GPT-4o पर आधारित आगामी उन्नत वॉयस मोड ChatGPT सब्सक्राइबर्स को बिना किसी देरी के सहज वार्तालाप करने की अनुमति देगा।

इसके अलावा, OpenAI ने आज बहुप्रतीक्षित SearchGPT जारी किया है, जो उनके वेब सर्च अनुभव का एक नया प्रयास है। वर्तमान में SearchGPT एक प्रोटोटाइप है, जो AI सर्च क्षमताएं प्रदान करता है, जिससे स्पष्ट और प्रासंगिक स्रोतों से तेजी से सटीक उत्तर मिलते हैं। आप यहाँ और जान सकते हैं।

मुख्य बिंदु:

- ChatGPT Plus सब्सक्राइबर्स को अगले सप्ताह नया वॉयस मोड फीचर मिलेगा, जो बिना किसी देरी के सहज वार्तालाप अनुभव प्रदान करेगा।

- GPT-4o मॉडल ने टेक्स्ट, विज़ुअल और ऑडियो तीन मोडालिटीज के प्रशिक्षण को जोड़ा, जिससे OpenAI ने और अधिक संभावनाएं और सीमाएं खोजी हैं।

- OpenAI ने SearchGPT भी जारी किया, जो तेजी से सटीक AI सर्च सुविधाएं प्रदान करता है।