MiniGPT-v2 ने दृश्य क्षमताओं में बड़े पैमाने पर सुधार किया, GitHub परियोजना को 20,000 सितारों की प्राप्ति

量子位

द्वारा प्रकाशितAI समाचार · 1 मिनट पढ़ें · Oct 19, 2023

159

चाइनीज टीम द्वारा विकसित MiniGPT-v2 दृश्य मॉडल ने GitHub पर 20,000 से अधिक सितारे प्राप्त किए हैं, जो कई दृश्य कार्यों को पूरा कर सकता है, जिसमें लक्ष्य वस्तु का वर्णन, दृश्य स्थिति निर्धारण और चित्र विवरण शामिल हैं। MiniGPT-v2 ने बहु-चरण प्रशिक्षण का उपयोग किया है, दृश्य प्रश्न उत्तर और ग्राउंड बेंचमार्क परीक्षण में उत्कृष्ट प्रदर्शन करते हुए, ViT दृश्य आधार पर आधारित है, और सरल मल्टी-मोडल निर्देशों के माध्यम से कुशलता से कार्यों को पूरा करता है।

ChatGPT का बड़ा अपडेट: नया इमेज लाइब्रेरी फीचर जोड़ा गया, GPT से जनरेट की गई सभी तस्वीरें देख सकते हैं

OpenAI ने ChatGPT में एक बड़ा अपडेट जारी किया है: एक नया इमेज लाइब्रेरी फीचर लॉन्च किया गया है, जिससे यूज़र्स एक ही इंटरफ़ेस में GPT-4o मॉडल से जनरेट की गई सभी तस्वीरों को देख, एडिट और शेयर कर सकते हैं। यह फीचर अब मुफ़्त, Plus और Pro यूज़र्स के लिए धीरे-धीरे उपलब्ध कराया जा रहा है, जिससे AI इमेज जनरेशन में यूज़र्स के अनुभव में काफी सुधार हुआ है। इमेज लाइब्रेरी फीचर: AI क्रिएशन का एक-स्टॉप मैनेजमेंटChatGPT का इमेज लाइब्रेरी फीचर यूज़र्स को एक केंद्रीकृत प्लेटफ़ॉर्म देता है, जहाँ वे GPT-4 से जनरेट की गई सभी तस्वीरों को स्टोर और मैनेज कर सकते हैं

OpenAI ने GPT-4.1 प्रॉम्प्ट इंजीनियरिंग गाइड जारी किया, डेवलपर्स को मॉडल को सटीक रूप से संचालित करने में मदद करता है

कृत्रिम बुद्धिमत्ता तकनीक के तेजी से विकास ने प्रॉम्प्ट इंजीनियरिंग (Prompt Engineering) पर उच्च माँग रखी है। AIbase को सोशल मीडिया से पता चला है कि OpenAI ने हाल ही में GPT-4.1 के लिए प्रॉम्प्ट इंजीनियरिंग गाइड जारी किया है, जिसमें स्पष्ट और सटीक प्रॉम्प्ट के माध्यम से मॉडल के प्रदर्शन को अधिकतम करने के तरीके के बारे में विस्तार से बताया गया है। यह गाइड न केवल पारंपरिक सर्वोत्तम अभ्यासों को जारी रखता है, बल्कि GPT-4.1 की अनूठी विशेषताओं के लिए अनुकूलित सुझाव भी प्रदान करता है। यहाँ AIbase द्वारा इस गाइड का गहन विश्लेषण दिया गया है, जो आपको इसकी मुख्य सामग्री को समझने में मदद करेगा।

घरेलू तौर पर पहला ओपन-सोर्स AI इमेज जेनरेशन मॉडल HiDream-I1 जारी, GPT-4o जितना ही सक्षम

HiDream-I1, एक घरेलू तौर पर विकसित ओपन-सोर्स AI इमेज जेनरेशन मॉडल, हाल ही में जारी किया गया है। इसकी क्षमताएँ GPT-4o जितनी ही प्रभावशाली बताई जा रही हैं। यह मॉडल AI इमेज जेनरेशन के क्षेत्र में एक महत्वपूर्ण उपलब्धि है और ओपन-सोर्स समुदाय के लिए एक बड़ा योगदान है।

OpenAI ने GPT-4.1 निर्देश संकेत अभियांत्रिकी मार्गदर्शिका जारी की

15 अप्रैल को, OpenAI ने GPT-4.1 के लिए संकेत अभियांत्रिकी मार्गदर्शिका जारी की, जिससे डेवलपर्स को AI अनुप्रयोगों के निर्माण और अनुकूलन के लिए व्यापक सुझाव और सर्वोत्तम अभ्यास प्रदान किए गए हैं। यह मार्गदर्शिका GPT-4.1 की विशेषताओं का विस्तृत विवरण देती है और बुनियादी सिद्धांतों से लेकर उन्नत रणनीतियों तक कई तरह की युक्तियाँ प्रदान करती है, जिसका उद्देश्य डेवलपर्स को GPT-4.1 की शक्तिशाली क्षमताओं का पूरा उपयोग करने में मदद करना है।

कर्सर और विंडसर्फ ने GPT-4.1 को पूरी तरह से खोल दिया, डेवलपर्स की दक्षता में उल्लेखनीय वृद्धि

14 अप्रैल को, AIbase को पता चला कि पिछले साल AI-संचालित इंटीग्रेटेड डेवलपमेंट एन्वायरमेंट (IDE) टूल कर्सर और विंडसर्फ ने सभी उपयोगकर्ताओं के लिए GPT-4.1 मॉडल खोल दिया है। कोडिंग टूल के क्षेत्र में यह एक और महत्वपूर्ण प्रगति है, जो डेवलपर्स को अधिक कुशल और बुद्धिमान प्रोग्रामिंग अनुभव प्रदान करता है। GPT-4.1 द्वारा संचालित, कोडिंग प्रदर्शन में उन्नयन OpenAI द्वारा हाल ही में जारी जानकारी के अनुसार, GPT-4.1 में कोड जेनरेशन, संदर्भ समझ और जटिल कार्यों को संभालने के मामले में पिछले मॉडल की तुलना में उल्लेखनीय सुधार हुआ है।

OpenAI ने GPT-4.1 श्रृंखला के मॉडल जारी किए; कोडिंग और मल्टीमॉडल क्षमताओं में हुआ व्यापक उन्नयन

कृत्रिम बुद्धिमत्ता के क्षेत्र में प्रतिस्पर्धा दिनोंदिन बढ़ती जा रही है, और OpenAI ने फिर से तकनीकी सफलता के साथ इस क्षेत्र में अग्रणी भूमिका निभाई है। सोशल मीडिया से मिली जानकारी के अनुसार, OpenAI ने हाल ही में API के माध्यम से तीन नए मॉडल जारी किए हैं: GPT-4.1, GPT-4.1mini और GPT-4.1nano। ये मॉडल मौजूदा GPT-4 और GPT-4 mini से प्रदर्शन में बेहतर हैं, खासकर कोडिंग, निर्देशों का पालन करने और मल्टीमॉडल क्षमताओं में। यह AIbase द्वारा इस महत्वपूर्ण अपडेट का गहन विश्लेषण है।

THUDM ने GLM 4 जारी किया: 32 अरब पैरामीटर वाला मॉडल, GPT-4o और DeepSeek-V3 से सीधी टक्कर

तेजी से विकसित हो रहे भाषा मॉडल के क्षेत्र में, शोधकर्ताओं और संगठनों को कई चुनौतियों का सामना करना पड़ता है। इन चुनौतियों में शामिल हैं तर्क क्षमता में सुधार, शक्तिशाली बहुभाषी समर्थन प्रदान करना और जटिल खुले कार्यों का प्रभावी ढंग से प्रबंधन करना। हालाँकि छोटे मॉडल आमतौर पर अधिक सुलभ और कम लागत वाले होते हैं, लेकिन प्रदर्शन में वे बड़े मॉडल से पीछे रह जाते हैं। इसलिए, कम्प्यूटेशनल दक्षता और मजबूत तर्क और निर्देश अनुसरण क्षमता के बीच प्रभावी संतुलन बनाने के लिए मध्यम आकार के मॉडल विकसित करना वर्तमान प्रवृत्ति बन गया है। हाल ही में, त्सिंगुआ विश्वविद्यालय ने GLM4 जारी किया है, खासकर इसके GLM-Z1-32B-0414 वेरिएंट को।

OpenAI、GPT-4.1シリーズモデルを発表：前世代を凌駕する能力

4月15日、OpenAIは公式ブログで、GPT-4.1、GPT-4.1 mini、GPT-4.1 nanoの3つのサブモデルを含むGPT-4.1シリーズモデルの正式リリースを発表しました。このシリーズは、プログラミング能力、指示理解、長文処理において大きな進歩を遂げ、前世代のGPT-4oおよびGPT-4o miniを全面的に凌駕しています。特に、モデルコンテキストウィンドウは100万トークンに拡張され、ナレッジベースは2024年6月まで更新されており、複雑な…