AI समाचार

AI समाचार

वैश्विक AI नवाचार का कोई भी क्षण न चूकें

AI दैनिक

दैनिक तीन मिनट का AI उद्योग रुझान

AI समयरेखा

AI उद्योग मील के पत्थर

अल हार्डवेयर

सभी ऐ हार्डवेयर उत्पादों की सूची देता है.

AI मुद्रीकरण गाइड

नवीनतम मामले

AI मुद्रीकरण मामला साझा करना

छवि संग्रह

AI छवि निर्माण मुद्रीकरण मामले

वीडियो संग्रह

AI वीडियो निर्माण मुद्रीकरण मामले

ऑडियो संग्रह

AI ऑडियो निर्माण मुद्रीकरण मामले

सामग्री संग्रह

AI सामग्री लेखन मुद्रीकरण मामले

AI ट्यूटोरियल

नवीनतम ट्यूटोरियल

नवीनतम AI ट्यूटोरियल का मुफ्त साझाकरण

AI उत्पाद रैंकिंग

AI उत्पाद रैंकिंग

AI वेबसाइटों की कुल विज़िट रैंकिंग दिखाता है

AI ट्रैफ़िक वृद्धि रैंकिंग

ट्रैफ़िक द्वारा सबसे तेज़ी से बढ़ती AI वेबसाइटों को ट्रैक करें

AI ट्रैफ़िक गिरावट रैंकिंग

महत्वपूर्ण ट्रैफ़िक गिरावट वाली AI वेबसाइटों पर ध्यान दें

AI साप्ताहिक रैंकिंग

AI वेबसाइटों की साप्ताहिक विज़िट रैंकिंग दिखाता है

लोकप्रिय देश रैंकिंग

संयुक्त राज्य अमेरिका

अमेरिकी उपयोगकर्ताओं के साथ सबसे लोकप्रिय AI वेबसाइटें

चीन

चीनी उपयोगकर्ताओं के साथ सबसे लोकप्रिय AI वेबसाइटें

भारत

भारतीय उपयोगकर्ताओं के साथ सबसे लोकप्रिय AI वेबसाइटें

ब्राजील

ब्राज़ीलियाई उपयोगकर्ताओं के साथ सबसे लोकप्रिय AI वेबसाइटें

लोकप्रिय श्रेणी रैंकिंग

छवि निर्माण

AI छवि निर्माण वेबसाइटों की कुल विज़िट रैंकिंग

निजी सहायक

AI निजी सहायक वेबसाइटों की कुल विज़िट रैंकिंग

चरित्र निर्माण

AI चरित्र निर्माण वेबसाइटों की कुल विज़िट रैंकिंग

वीडियो निर्माण

AI वीडियो निर्माण वेबसाइटों की कुल विज़िट रैंकिंग

लोकप्रिय ओपन सोर्स डेटा रैंकिंग

AI प्रोजेक्ट रैंकिंग

कुल सितारों द्वारा GitHub लोकप्रिय AI प्रोजेक्ट

AI प्रोजेक्ट विकास रैंकिंग

विकास दर द्वारा GitHub लोकप्रिय AI प्रोजेक्ट

AI डेवलपर रैंकिंग

GitHub लोकप्रिय AI डेवलपर रैंकिंग

AI संगठन रैंकिंग

GitHub लोकप्रिय AI संगठन रैंकिंग

लोकप्रिय ओपन सोर्स श्रेणियाँ

डीपसीक

GitHub लोकप्रिय डीपसीक ओपन सोर्स प्रोजेक्ट

TTS

GitHub लोकप्रिय TTS ओपन सोर्स प्रोजेक्ट

LLM

GitHub लोकप्रिय LLM ओपन सोर्स प्रोजेक्ट

ChatGPT

GitHub लोकप्रिय ChatGPT ओपन सोर्स प्रोजेक्ट

AI ओपन सोर्स प्रोजेक्ट लाइब्रेरी

अवलोकन

GitHub लोकप्रिय AI ओपन सोर्स प्रोजेक्ट का अवलोकन

उत्पाद लाइब्रेरी टूल नेविगेशन

MA-LMM

दीर्घकालिक वीडियो समझ के लिए बड़ा बहु-मोडल मॉडल

सामान्य उत्पादवीडियोवीडियो समझबहु-मोडल

वेबसाइट खोलें

MA-LMM एक बड़ा बहु-मोडल मॉडल है जो बड़े भाषा मॉडल पर आधारित है, और मुख्य रूप से दीर्घकालिक वीडियो समझ के लिए डिज़ाइन किया गया है। यह वीडियो को ऑनलाइन संसाधित करने की विधि का उपयोग करता है, और पिछले वीडियो की जानकारी को मेमोरी में संग्रहीत करता है, जिससे भाषा मॉडल के संदर्भ की लंबाई सीमा या GPU मेमोरी सीमा से अधिक हुए बिना, ऐतिहासिक वीडियो सामग्री का संदर्भ लेकर दीर्घकालिक विश्लेषण किया जा सकता है। MA-LMM को वर्तमान बहु-मोडल भाषा मॉडल में सहज रूप से एकीकृत किया जा सकता है, और दीर्घ वीडियो समझ, वीडियो प्रश्नोत्तर और वीडियो उपशीर्षक जैसे कार्यों में अग्रणी प्रदर्शन प्राप्त करता है।

MA-LMM

वेबसाइट खोलें

MA-LMM नवीनतम ट्रैफ़िक स्थिति

मासिक कुल विज़िट

1374

बाउंस दर

51.94%

प्रति विज़िट औसत पृष्ठ

1.0

औसत विज़िट अवधि

00:00:00

MA-LMM विज़िट प्रवृत्ति

MA-LMM विज़िट भौगोलिक वितरण

MA-LMM ट्रैफ़िक स्रोत

MA-LMM विकल्प

MA-LMM — दीर्घकालिक वीडियो समझ के लिए बड़ा बहु-मोडल मॉडल

वीडियो

•वीडियो समझ•बहु-मोडल

वीडियोRAG — वीडियोRAG अत्यधिक लंबे संदर्भ वाले वीडियो को संसाधित करने के लिए एक पुनर्प्राप्ति-वर्धित जेनरेटिव ढाँचा है।

वीडियो

•वीडियो समझ•पुनर्प्राप्ति-वर्धित

Qwen2.5-VL — Qwen2.5-VL एक शक्तिशाली दृश्य भाषा मॉडल है जो छवियों और वीडियो सामग्री को समझ सकता है और उसके अनुसार पाठ उत्पन्न कर सकता है।

चीनी चयन

•बहु-मोडल•छवि पहचान

MNN बड़ा भाषा मॉडल Android ऐप — एक बहु-मोडल फ़ंक्शन वाला पूर्ण-सुविधा वाला बड़ा भाषा मॉडल एंड्रॉइड ऐप।

उत्पादकता

•बड़ा भाषा मॉडल•बहु-मोडल

विडियोLLaMA3 — विडियोLLaMA3 एक अत्याधुनिक बहु-मोडल आधारभूत मॉडल है जो छवि और वीडियो समझ पर केंद्रित है।

वीडियो

•बहु-मोडल•वीडियो समझ

InternVL2_5-78B-MPO — यह एक उन्नत बहु-मोडल बड़ा भाषा मॉडल श्रृंखला है जो उत्कृष्ट समग्र प्रदर्शन दर्शाता है।

उत्पादकता

•बहु-मोडल•बड़ा भाषा मॉडल

MinMo — MinMo एक बहु-मोडल बड़ा भाषा मॉडल है, जो निर्बाध आवाज़ इंटरैक्शन के लिए डिज़ाइन किया गया है।

चैटिंग

•आवाज़ इंटरैक्शन•बहु-मोडल

InternVL2_5-38B-MPO — InternVL2.5-MPO श्रृंखला मॉडल, InternVL2.5 और मिश्रित वरीयता अनुकूलन पर आधारित, उत्कृष्ट प्रदर्शन प्रदर्शित करता है।

चैटिंग

•बहु-मोडल•बड़ा भाषा मॉडल

InternVL2_5-26B-MPO-AWQ

InternVL2_5-26B-MPO-AWQ — यह एक उन्नत बहु-मोडल बड़ा भाषा मॉडल है, जिसमें बेहतरीन बहु-मोडल तर्क क्षमता है।

प्रोग्रामिंग

•बहु-मोडल•बड़ा भाषा मॉडल

VITA-1.5 — VITA-1.5: वास्तविक समय दृश्य और ध्वनि संपर्क वाला GPT-4o स्तरीय बहु-मोडल बड़ा भाषा मॉडल

प्रोग्रामिंग

•बहु-मोडल•बड़ा भाषा मॉडल

वैली (Valley) — बहु-मोडल बड़ा भाषा मॉडल, जो टेक्स्ट, इमेज और वीडियो डेटा को संसाधित करता है

•बहु-मोडल•बड़ा भाषा मॉडल

InternVL2_5-38B — उन्नत बहु-मोडल बड़े भाषा मॉडल श्रृंखला

•बहु-मोडल•बड़ा भाषा मॉडल

Qwen2-VL-7B — Qwen2-VL-7B एक नवीनतम दृश्य भाषा मॉडल है जो बहु-मोडल समझ और पाठ निर्माण का समर्थन करता है।

•दृश्य भाषा मॉडल•बहु-मोडल

Qwen2-VL-2B — अत्याधुनिक दृश्य भाषा मॉडल, बहु-मोडल समझ और पाठ निर्माण का समर्थन करता है।

•दृश्य भाषा मॉडल•बहु-मोडल

Pixtral-Large-Instruct-2411 — 124B पैरामीटर वाला बहु-मोडल बड़ा भाषा मॉडल

उत्पादकता

•बहु-मोडल•बड़ा भाषा मॉडल

PPLLaVA — वीडियो अनुक्रम समझ के लिए GPU-आधारित मॉडल

वीडियो

•वीडियो समझ•बड़ा भाषा मॉडल

Ferret-UI-Llama8b — Llama-3-8B पर आधारित बहु-मोडल बड़ा भाषा मॉडल, जो UI कार्यों पर केंद्रित है।

प्रोग्रामिंग

•बहु-मोडल•बड़ा भाषा मॉडल

वीडियोLLaMA2-7B — एक विशाल वीडियो-भाषा मॉडल जो दृश्य प्रश्नोत्तर और वीडियो उपशीर्षक पीढ़ी प्रदान करता है।

वीडियो

•वीडियो समझ•भाषा मॉडल

वीडियोLLaMA 2 — वीडियो समझ के क्षेत्र में उन्नत स्थान-समय मॉडलिंग और ऑडियो समझ मॉडल।

वीडियो

•वीडियो समझ•स्थान-समय मॉडलिंग

वीक्लोन — उच्च-गुणवत्ता वाले ध्वनि क्लोनिंग को लागू करने के लिए वीचैट चैट रिकॉर्ड के साथ बड़े भाषा मॉडल को ठीक करना।

उत्पादकता

•डिजिटल क्लोनिंग•ध्वनि क्लोनिंग

ड्रीम 7B — ड्रीम 7B सबसे शक्तिशाली खुला प्रसार बड़ा भाषा मॉडल है।

उत्पादकता

•प्रसार मॉडल•बड़ा भाषा मॉडल

MistralOCR.net — Mistral OCR एक शक्तिशाली दस्तावेज़ समझ OCR उत्पाद है जो PDF और छवियों से पाठ, छवियों, तालिकाओं और समीकरणों को अत्यधिक सटीकता के साथ निकाल सकता है।

उत्पादकता

•दस्तावेज़ प्रसंस्करण•OCR

R1-Omni — R1-Omni एक प्रबलित अधिगम के साथ संयुक्त पूर्ण-मोडल भावना पहचान मॉडल है, जो बहु-मोडल भावना पहचान की व्याख्यात्मकता को बेहतर बनाने पर केंद्रित है।

प्रोग्रामिंग

•बहु-मोडल•भावना पहचान

Argo — अपना खुद का बड़ा मॉडल आसानी से बनाएँ, विशेष बुद्धिमत्ता, केवल स्थानीय रूप से।

चीनी चयन

•बड़ा भाषा मॉडल•स्थानीय परिनियोजन

आया विजन — आया विजन कोहरे द्वारा लॉन्च किया गया एक बहुभाषी बहु-मोडल दृश्य मॉडल है, जिसका उद्देश्य बहुभाषी परिदृश्यों में दृश्य और पाठ समझ क्षमता को बढ़ाना है।

अंतर्राष्ट्रीय चयन

•बहुभाषी•बहु-मोडल

एगोलाइफ़ — एगोलाइफ़ एक दीर्घकालिक, बहु-मोडल, बहु-दृष्टिकोण दैनिक जीवन AI सहायक परियोजना है, जिसका उद्देश्य दीर्घकालिक संदर्भ समझ अनुसंधान को आगे बढ़ाना है।

उत्पादकता

•बहु-मोडल•बहु-दृष्टिकोण

UniTok — UniTok एक एकीकृत दृश्य टोकनित्र है जिसका उपयोग दृश्य निर्माण और समझ के लिए किया जाता है।

•कृत्रिम बुद्धिमत्ता•दृश्य निर्माण

ViDoRAG — ViDoRAG एक दृश्य दस्तावेज़ पुनर्प्राप्ति संवर्धित पीढ़ी गतिशील पुनरावृति तर्क एजेंट ढांचा है।

प्रोग्रामिंग

•बहु-मोडल•पुनर्प्राप्ति संवर्धित पीढ़ी

मैजिशियन — मैजिशियन एक बहु-मोडल बड़ा भाषा मॉडल है जो बहु-छवि स्थानीयकरण पर केंद्रित है, जो मुक्त-रूप बहु-छवि सटीक स्थानीयकरण को प्राप्त कर सकता है।

•बहु-मोडल•छवि स्थानीयकरण

Mochii AI — Mochii AI एक व्यक्तिगत कृत्रिम बुद्धिमत्ता पारिस्थितिकी तंत्र है जो अत्याधुनिक मॉडल द्वारा समर्थित है, जो मानव और AI सहयोग के भविष्य को बढ़ावा देता है।

चीनी चयन

•कृत्रिम बुद्धिमत्ता•उत्पादकता उपकरण