AI समाचार

AI समाचार

वैश्विक AI नवाचार का कोई भी क्षण न चूकें

AI दैनिक

दैनिक तीन मिनट का AI उद्योग रुझान

AI समयरेखा

AI उद्योग मील के पत्थर

AI मुद्रीकरण गाइड

नवीनतम मामले

AI मुद्रीकरण मामला साझा करना

छवि संग्रह

AI छवि निर्माण मुद्रीकरण मामले

वीडियो संग्रह

AI वीडियो निर्माण मुद्रीकरण मामले

ऑडियो संग्रह

AI ऑडियो निर्माण मुद्रीकरण मामले

सामग्री संग्रह

AI सामग्री लेखन मुद्रीकरण मामले

AI ट्यूटोरियल

नवीनतम ट्यूटोरियल

नवीनतम AI ट्यूटोरियल का मुफ्त साझाकरण

AI उत्पाद रैंकिंग

AI उत्पाद रैंकिंग

AI वेबसाइटों की कुल विज़िट रैंकिंग दिखाता है

AI ट्रैफ़िक वृद्धि रैंकिंग

ट्रैफ़िक द्वारा सबसे तेज़ी से बढ़ती AI वेबसाइटों को ट्रैक करें

AI ट्रैफ़िक गिरावट रैंकिंग

महत्वपूर्ण ट्रैफ़िक गिरावट वाली AI वेबसाइटों पर ध्यान दें

AI साप्ताहिक रैंकिंग

AI वेबसाइटों की साप्ताहिक विज़िट रैंकिंग दिखाता है

लोकप्रिय देश रैंकिंग

संयुक्त राज्य अमेरिका

अमेरिकी उपयोगकर्ताओं के साथ सबसे लोकप्रिय AI वेबसाइटें

चीन

चीनी उपयोगकर्ताओं के साथ सबसे लोकप्रिय AI वेबसाइटें

भारत

भारतीय उपयोगकर्ताओं के साथ सबसे लोकप्रिय AI वेबसाइटें

ब्राजील

ब्राज़ीलियाई उपयोगकर्ताओं के साथ सबसे लोकप्रिय AI वेबसाइटें

लोकप्रिय श्रेणी रैंकिंग

छवि निर्माण

AI छवि निर्माण वेबसाइटों की कुल विज़िट रैंकिंग

निजी सहायक

AI निजी सहायक वेबसाइटों की कुल विज़िट रैंकिंग

चरित्र निर्माण

AI चरित्र निर्माण वेबसाइटों की कुल विज़िट रैंकिंग

वीडियो निर्माण

AI वीडियो निर्माण वेबसाइटों की कुल विज़िट रैंकिंग

लोकप्रिय ओपन सोर्स डेटा रैंकिंग

AI प्रोजेक्ट रैंकिंग

कुल सितारों द्वारा GitHub लोकप्रिय AI प्रोजेक्ट

AI प्रोजेक्ट विकास रैंकिंग

विकास दर द्वारा GitHub लोकप्रिय AI प्रोजेक्ट

AI डेवलपर रैंकिंग

GitHub लोकप्रिय AI डेवलपर रैंकिंग

AI संगठन रैंकिंग

GitHub लोकप्रिय AI संगठन रैंकिंग

लोकप्रिय ओपन सोर्स श्रेणियाँ

डीपसीक

GitHub लोकप्रिय डीपसीक ओपन सोर्स प्रोजेक्ट

TTS

GitHub लोकप्रिय TTS ओपन सोर्स प्रोजेक्ट

LLM

GitHub लोकप्रिय LLM ओपन सोर्स प्रोजेक्ट

ChatGPT

GitHub लोकप्रिय ChatGPT ओपन सोर्स प्रोजेक्ट

AI ओपन सोर्स प्रोजेक्ट लाइब्रेरी

अवलोकन

GitHub लोकप्रिय AI ओपन सोर्स प्रोजेक्ट का अवलोकन

उत्पाद लाइब्रेरी टूल नेविगेशन

VideoLLaMA2-7B-16F-Base

दृश्य प्रश्नोत्तर और वीडियो उपशीर्षक पीढ़ी के लिए एक बड़ा वीडियो भाषा मॉडल।

सामान्य उत्पादवीडियोवीडियो प्रश्नोत्तरवीडियो उपशीर्षक

वेबसाइट खोलें

VideoLLaMA2-7B-16F-Base DAMO-NLP-SG टीम द्वारा विकसित एक बड़ा वीडियो भाषा मॉडल है, जो वीडियो प्रश्नोत्तर (Visual Question Answering) और वीडियो उपशीर्षक पीढ़ी पर केंद्रित है। यह मॉडल उन्नत स्थानिक-कालिक मॉडलिंग और ऑडियो समझ क्षमताओं को जोड़ता है, बहु-मोडल वीडियो सामग्री विश्लेषण के लिए एक शक्तिशाली समर्थन प्रदान करता है। यह दृश्य प्रश्नोत्तर और वीडियो उपशीर्षक पीढ़ी कार्यों में उत्कृष्ट प्रदर्शन दिखाता है, जटिल वीडियो सामग्री को संसाधित करने और सटीक विवरण और उत्तर उत्पन्न करने में सक्षम है।

VideoLLaMA2-7B-16F-Base

वेबसाइट खोलें

VideoLLaMA2-7B-16F-Base नवीनतम ट्रैफ़िक स्थिति

मासिक कुल विज़िट

29742941

बाउंस दर

44.20%

प्रति विज़िट औसत पृष्ठ

5.9

औसत विज़िट अवधि

00:04:44

VideoLLaMA2-7B-16F-Base विज़िट प्रवृत्ति

VideoLLaMA2-7B-16F-Base विज़िट भौगोलिक वितरण

VideoLLaMA2-7B-16F-Base ट्रैफ़िक स्रोत

VideoLLaMA2-7B-16F-Base विकल्प

VideoLLaMA2-7B-16F-Base — दृश्य प्रश्नोत्तर और वीडियो उपशीर्षक पीढ़ी के लिए एक बड़ा वीडियो भाषा मॉडल।

वीडियो

•वीडियो प्रश्नोत्तर•वीडियो उपशीर्षक

MistralOCR.net — Mistral OCR एक शक्तिशाली दस्तावेज़ समझ OCR उत्पाद है जो PDF और छवियों से पाठ, छवियों, तालिकाओं और समीकरणों को अत्यधिक सटीकता के साथ निकाल सकता है।

उत्पादकता

•दस्तावेज़ प्रसंस्करण•OCR

R1-Omni — R1-Omni एक प्रबलित अधिगम के साथ संयुक्त पूर्ण-मोडल भावना पहचान मॉडल है, जो बहु-मोडल भावना पहचान की व्याख्यात्मकता को बेहतर बनाने पर केंद्रित है।

प्रोग्रामिंग

•बहु-मोडल•भावना पहचान

आया विजन — आया विजन कोहरे द्वारा लॉन्च किया गया एक बहुभाषी बहु-मोडल दृश्य मॉडल है, जिसका उद्देश्य बहुभाषी परिदृश्यों में दृश्य और पाठ समझ क्षमता को बढ़ाना है।

अंतर्राष्ट्रीय चयन

•बहुभाषी•बहु-मोडल

एगोलाइफ़ — एगोलाइफ़ एक दीर्घकालिक, बहु-मोडल, बहु-दृष्टिकोण दैनिक जीवन AI सहायक परियोजना है, जिसका उद्देश्य दीर्घकालिक संदर्भ समझ अनुसंधान को आगे बढ़ाना है।

उत्पादकता

•बहु-मोडल•बहु-दृष्टिकोण

UniTok — UniTok एक एकीकृत दृश्य टोकनित्र है जिसका उपयोग दृश्य निर्माण और समझ के लिए किया जाता है।

•कृत्रिम बुद्धिमत्ता•दृश्य निर्माण

ViDoRAG — ViDoRAG एक दृश्य दस्तावेज़ पुनर्प्राप्ति संवर्धित पीढ़ी गतिशील पुनरावृति तर्क एजेंट ढांचा है।

प्रोग्रामिंग

•बहु-मोडल•पुनर्प्राप्ति संवर्धित पीढ़ी

मैजिशियन — मैजिशियन एक बहु-मोडल बड़ा भाषा मॉडल है जो बहु-छवि स्थानीयकरण पर केंद्रित है, जो मुक्त-रूप बहु-छवि सटीक स्थानीयकरण को प्राप्त कर सकता है।

•बहु-मोडल•छवि स्थानीयकरण

Mochii AI — Mochii AI एक व्यक्तिगत कृत्रिम बुद्धिमत्ता पारिस्थितिकी तंत्र है जो अत्याधुनिक मॉडल द्वारा समर्थित है, जो मानव और AI सहयोग के भविष्य को बढ़ावा देता है।

चीनी चयन

•कृत्रिम बुद्धिमत्ता•उत्पादकता उपकरण

TheoremExplainAgent — TheoremExplainAgent एक बुद्धिमान प्रणाली है जो बहु-मोडल प्रमेय व्याख्या वीडियो बनाने के लिए उपयोग की जाती है।

शिक्षा

•कृत्रिम बुद्धिमत्ता•शिक्षा

Magma — Magma एक बहु-मोडल इनपुट को समझने और निष्पादित करने वाला एक आधार मॉडल है, जिसका उपयोग जटिल कार्यों और वातावरणों में किया जा सकता है।

उत्पादकता

•बहु-मोडल•रोबोट

वीडियोRAG — वीडियोRAG अत्यधिक लंबे संदर्भ वाले वीडियो को संसाधित करने के लिए एक पुनर्प्राप्ति-वर्धित जेनरेटिव ढाँचा है।

वीडियो

•वीडियो समझ•पुनर्प्राप्ति-वर्धित

मेडरेक्स (MedRAX) — मेडरेक्स छाती के एक्स-रे की व्याख्या के लिए एक चिकित्सा तर्क AI एजेंट है, जिसमें कई विश्लेषण उपकरण एकीकृत हैं, और जटिल चिकित्सा प्रश्नों को संभालने के लिए अतिरिक्त प्रशिक्षण की आवश्यकता नहीं है।

•चिकित्सा•छाती का एक्स-रे

Qwen2.5-VL — Qwen2.5-VL एक शक्तिशाली दृश्य भाषा मॉडल है जो छवियों और वीडियो सामग्री को समझ सकता है और उसके अनुसार पाठ उत्पन्न कर सकता है।

चीनी चयन

•बहु-मोडल•छवि पहचान

Gemini 2.0 Pro — Gemini Pro, Google DeepMind द्वारा विकसित एक उच्च-प्रदर्शन वाला AI मॉडल है, जो जटिल कार्यों के संसाधन और प्रोग्रामिंग क्षमता पर केंद्रित है।

अंतर्राष्ट्रीय चयन

•प्रोग्रामिंग•जटिल कार्य

MILS — LLM को किसी भी प्रशिक्षण की आवश्यकता के बिना देख और सुन सकता है।

•कृत्रिम बुद्धिमत्ता•बहु-मोडल

MNN बड़ा भाषा मॉडल Android ऐप — एक बहु-मोडल फ़ंक्शन वाला पूर्ण-सुविधा वाला बड़ा भाषा मॉडल एंड्रॉइड ऐप।

उत्पादकता

•बड़ा भाषा मॉडल•बहु-मोडल

Janus-Pro-7B — Janus-Pro-7B एक नया स्व-पुनरावर्ती ढाँचा है जो बहु-मोडल समझ और उत्पादन को एकीकृत करता है।

•बहु-मोडल•छवि उत्पादन

Janus-Pro-1B — Janus-Pro-1B एक एकीकृत बहु-मोडल समझ और पीढ़ी वाला स्व-पुनरावर्ती ढाँचा है।

•बहु-मोडल•छवि पीढ़ी

SmolVLM-500M-निर्देश — SmolVLM-500M एक हल्का बहु-मोडल मॉडल है जो छवि और पाठ इनपुट को संसाधित कर सकता है और पाठ आउटपुट उत्पन्न कर सकता है।

•बहु-मोडल•छवि विवरण

विडियोLLaMA3 — विडियोLLaMA3 एक अत्याधुनिक बहु-मोडल आधारभूत मॉडल है जो छवि और वीडियो समझ पर केंद्रित है।

वीडियो

•बहु-मोडल•वीडियो समझ

UI-TARS — UI-TARS एक अगली पीढ़ी का मूल GUI एजेंट मॉडल है जो ग्राफ़िकल यूज़र इंटरफ़ेस इंटरैक्शन को स्वचालित करने के लिए डिज़ाइन किया गया है।

चीनी चयन

•कृत्रिम बुद्धिमत्ता•स्वचालन

जेमिनी 2.0 फ्लैश थिंकिंग प्रयोगात्मक — जेमिनी 2.0 फ्लैश थिंकिंग प्रयोगात्मक एक उन्नत तर्क मॉडल है जो अपनी सोच प्रक्रिया को प्रदर्शित करके प्रदर्शन और व्याख्यात्मकता में सुधार करता है।

उत्पादकता

•तर्क•बहु-मोडल

कैप्शनर रेडनोट एक्सप्रेस — वीडियो में चीनी उपशीर्षक जोड़ने में मदद करता है, जिससे क्रिएटर लाल नोट पर चीनी दर्शकों के साथ स्वतंत्र रूप से संवाद कर सकते हैं।

वीडियो

•वीडियो उपशीर्षक•चीनी अनुवाद

InternVL2_5-78B-MPO — यह एक उन्नत बहु-मोडल बड़ा भाषा मॉडल श्रृंखला है जो उत्कृष्ट समग्र प्रदर्शन दर्शाता है।

उत्पादकता

•बहु-मोडल•बड़ा भाषा मॉडल

MinMo — MinMo एक बहु-मोडल बड़ा भाषा मॉडल है, जो निर्बाध आवाज़ इंटरैक्शन के लिए डिज़ाइन किया गया है।

चैटिंग

•आवाज़ इंटरैक्शन•बहु-मोडल

MiniCPM-o-2_6 — MiniCPM-o 2.6 एक शक्तिशाली बहु-मोडल बड़ा भाषा मॉडल है, जो दृश्य, वाक् और बहु-मोडल लाइव स्ट्रीमिंग के लिए उपयुक्त है।

•बहु-मोडल•भाषा मॉडल

MiniCPM-o

MiniCPM-o — MiniCPM-o 2.6: एक GPT-4o-स्तरीय MLLM जो मोबाइल पर दृश्य, ध्वनि और बहु-मोडल लाइव स्ट्रीमिंग को सक्षम बनाता है।

•बहु-मोडल•भाषा मॉडल

अल्बस AI — सर्वश्रेष्ठ AI कार्यस्थान, वास्तविक समय ध्वनि सहायक और बहु-मोडल कैनवास के साथ, कुशल निर्माण और विचारों को बढ़ावा देता है।

उत्पादकता

•कृत्रिम बुद्धिमत्ता•वास्तविक समय ध्वनि

मूनड्रीम AI — यह एक ओपन-सोर्स दृश्य भाषा मॉडल है जो कई उपकरणों पर चल सकता है।

•कृत्रिम बुद्धिमत्ता•ओपन-सोर्स