AI समाचार

AI समाचार

वैश्विक AI नवाचार का कोई भी क्षण न चूकें

AI दैनिक

दैनिक तीन मिनट का AI उद्योग रुझान

AI समयरेखा

AI उद्योग मील के पत्थर

अल हार्डवेयर

सभी ऐ हार्डवेयर उत्पादों की सूची देता है.

AI मुद्रीकरण गाइड

नवीनतम मामले

AI मुद्रीकरण मामला साझा करना

छवि संग्रह

AI छवि निर्माण मुद्रीकरण मामले

वीडियो संग्रह

AI वीडियो निर्माण मुद्रीकरण मामले

ऑडियो संग्रह

AI ऑडियो निर्माण मुद्रीकरण मामले

सामग्री संग्रह

AI सामग्री लेखन मुद्रीकरण मामले

AI ट्यूटोरियल

नवीनतम ट्यूटोरियल

नवीनतम AI ट्यूटोरियल का मुफ्त साझाकरण

AI उत्पाद रैंकिंग

AI उत्पाद रैंकिंग

AI वेबसाइटों की कुल विज़िट रैंकिंग दिखाता है

AI ट्रैफ़िक वृद्धि रैंकिंग

ट्रैफ़िक द्वारा सबसे तेज़ी से बढ़ती AI वेबसाइटों को ट्रैक करें

AI ट्रैफ़िक गिरावट रैंकिंग

महत्वपूर्ण ट्रैफ़िक गिरावट वाली AI वेबसाइटों पर ध्यान दें

AI साप्ताहिक रैंकिंग

AI वेबसाइटों की साप्ताहिक विज़िट रैंकिंग दिखाता है

लोकप्रिय देश रैंकिंग

संयुक्त राज्य अमेरिका

अमेरिकी उपयोगकर्ताओं के साथ सबसे लोकप्रिय AI वेबसाइटें

चीन

चीनी उपयोगकर्ताओं के साथ सबसे लोकप्रिय AI वेबसाइटें

भारत

भारतीय उपयोगकर्ताओं के साथ सबसे लोकप्रिय AI वेबसाइटें

ब्राजील

ब्राज़ीलियाई उपयोगकर्ताओं के साथ सबसे लोकप्रिय AI वेबसाइटें

लोकप्रिय श्रेणी रैंकिंग

छवि निर्माण

AI छवि निर्माण वेबसाइटों की कुल विज़िट रैंकिंग

निजी सहायक

AI निजी सहायक वेबसाइटों की कुल विज़िट रैंकिंग

चरित्र निर्माण

AI चरित्र निर्माण वेबसाइटों की कुल विज़िट रैंकिंग

वीडियो निर्माण

AI वीडियो निर्माण वेबसाइटों की कुल विज़िट रैंकिंग

लोकप्रिय ओपन सोर्स डेटा रैंकिंग

AI प्रोजेक्ट रैंकिंग

कुल सितारों द्वारा GitHub लोकप्रिय AI प्रोजेक्ट

AI प्रोजेक्ट विकास रैंकिंग

विकास दर द्वारा GitHub लोकप्रिय AI प्रोजेक्ट

AI डेवलपर रैंकिंग

GitHub लोकप्रिय AI डेवलपर रैंकिंग

AI संगठन रैंकिंग

GitHub लोकप्रिय AI संगठन रैंकिंग

लोकप्रिय ओपन सोर्स श्रेणियाँ

डीपसीक

GitHub लोकप्रिय डीपसीक ओपन सोर्स प्रोजेक्ट

TTS

GitHub लोकप्रिय TTS ओपन सोर्स प्रोजेक्ट

LLM

GitHub लोकप्रिय LLM ओपन सोर्स प्रोजेक्ट

ChatGPT

GitHub लोकप्रिय ChatGPT ओपन सोर्स प्रोजेक्ट

AI ओपन सोर्स प्रोजेक्ट लाइब्रेरी

अवलोकन

GitHub लोकप्रिय AI ओपन सोर्स प्रोजेक्ट का अवलोकन

उत्पाद लाइब्रेरी टूल नेविगेशन

Florence-VL

दृश्य भाषा मॉडल एन्हांस्मेंट टूल, जनरेटिव दृश्य एन्कोडर और गहन चौड़ाई फ्यूजन तकनीक को जोड़ता है।

सामान्य उत्पादप्रोग्रामिंगदृश्य भाषा मॉडलबहु-विधा अधिगम

वेबसाइट खोलें

Florence-VL एक दृश्य भाषा मॉडल है जो जनरेटिव दृश्य एन्कोडर और गहन चौड़ाई फ्यूजन तकनीक को शामिल करके, मॉडल की दृश्य और भाषा संबंधी सूचनाओं को संसाधित करने की क्षमता को बढ़ाता है। इस तकनीक का महत्व इस बात में है कि यह मशीनों की छवियों और पाठ को समझने की क्षमता को बढ़ाती है, जिससे मल्टी-मॉडल कार्यों में बेहतर परिणाम प्राप्त होते हैं। Florence-VL LLaVA प्रोजेक्ट पर आधारित है, और यह प्री-ट्रेनिंग और फाइन-ट्यूनिंग के लिए कोड, मॉडल चेकपॉइंट और डेमो प्रदान करता है।

Florence-VL

वेबसाइट खोलें

Florence-VL नवीनतम ट्रैफ़िक स्थिति

मासिक कुल विज़िट

521149929

बाउंस दर

35.96%

प्रति विज़िट औसत पृष्ठ

6.1

औसत विज़िट अवधि

00:06:29

Florence-VL विज़िट प्रवृत्ति

Florence-VL विज़िट भौगोलिक वितरण

Florence-VL ट्रैफ़िक स्रोत

Florence-VL विकल्प

Florence-VL — दृश्य भाषा मॉडल एन्हांस्मेंट टूल, जनरेटिव दृश्य एन्कोडर और गहन चौड़ाई फ्यूजन तकनीक को जोड़ता है।

प्रोग्रामिंग

•दृश्य भाषा मॉडल•बहु-विधा अधिगम

VLM-R1 — VLM-R1 एक स्थिर और बहुउद्देशीय दृष्टिगत भाषा मॉडल है जो दृश्य समझ कार्यों पर केंद्रित है।

•दृश्य भाषा मॉडल•सुदृढीकरण अधिगम

VisualCloze — दृश्य संदर्भ अधिगम के माध्यम से एक सामान्य छवि निर्माण ढाँचा।

उत्पादकता

•छवि निर्माण•दृश्य अधिगम

R1-Omni — R1-Omni एक प्रबलित अधिगम के साथ संयुक्त पूर्ण-मोडल भावना पहचान मॉडल है, जो बहु-मोडल भावना पहचान की व्याख्यात्मकता को बेहतर बनाने पर केंद्रित है।

प्रोग्रामिंग

•बहु-मोडल•भावना पहचान

आया विज़न 8B — 80 करोड़ पैरामीटर वाला बहुभाषी दृश्य भाषा मॉडल, जो OCR, छवि विवरण, दृश्य तर्क आदि कार्यों का समर्थन करता है।

•बहुभाषी•दृश्य भाषा मॉडल

SigLIP2 — SigLIP2 गूगल द्वारा विकसित एक बहुभाषी दृश्य भाषा एन्कोडर है, जो शून्य-शॉट छवि वर्गीकरण के लिए उपयोग किया जाता है।

•बहुभाषी•शून्य-शॉट वर्गीकरण

R1-V

R1-V — कम लागत पर दृश्य भाषा मॉडल की सामान्यीकरण क्षमता को मजबूत करना, केवल 3 डॉलर से कम में।

प्रोग्रामिंग

•सुदृढीकरण अधिगम•दृश्य भाषा मॉडल

वेब के लिए ओल्लामा ओसीआर — एक शक्तिशाली ओसीआर पैकेज जो अत्याधुनिक दृश्य भाषा मॉडल का उपयोग करके छवियों से टेक्स्ट निकालता है।

•ओसीआर•छवि पहचान

मूनड्रीम AI — यह एक ओपन-सोर्स दृश्य भाषा मॉडल है जो कई उपकरणों पर चल सकता है।

•कृत्रिम बुद्धिमत्ता•ओपन-सोर्स

CogAgent-9B-20241220

CogAgent-9B-20241220 — CogAgent-9B-20241220 एक दृश्य भाषा मॉडल आधारित GUI एजेंट मॉडल है।

प्रोग्रामिंग

•दृश्य भाषा मॉडल•GUI एजेंट

विजन-पार्स — दृश्य भाषा मॉडल का उपयोग करके PDF को Markdown में परिवर्तित करता है।

उत्पादकता

•PDF पार्सिंग•Markdown रूपांतरण

CogAgent — खुले स्रोत वाला एंड-टू-एंड दृश्य भाषा मॉडल (VLM) आधारित GUI एजेंट

प्रोग्रामिंग

•दृश्य भाषा मॉडल•GUI एजेंट

DeepSeek-VL2-टाइनी

DeepSeek-VL2-टाइनी — उन्नत बड़ा मिश्रित विशेषज्ञ दृश्य भाषा मॉडल

•दृश्य भाषा मॉडल•मिश्रित विशेषज्ञ

POINTS-Yi-1.5-9B-Chat — दृश्य भाषा मॉडल की नवीनतम प्रगति, WeChat AI की नई तकनीक को एकीकृत करता है

उत्पादकता

•दृश्य भाषा मॉडल•WeChat AI

POINTS-Qwen-2-5-7B-Chat — दृश्य भाषा मॉडल की नवीनतम प्रगति

उत्पादकता

•दृश्य भाषा मॉडल•मल्टीमॉडल

POINTS-1-5-Qwen-2-5-7B-Chat — अग्रणी दृश्य भाषा मॉडल, द्विभाषी और उच्च-गुणवत्ता नियंत्रण का समर्थन करता है, मुफ़्त।

उत्पादकता

•दृश्य भाषा मॉडल•द्विभाषी समर्थन

DeepSeek-VL2 — एक उन्नत बहु-विधा समझ मॉडल जो दृश्य और भाषा क्षमताओं को एकीकृत करता है।

•दृश्य भाषा मॉडल•बहु-विधा समझ

ओपनजीवीएलब इंटर्नवीएल

ओपनजीवीएलब इंटर्नवीएल — एक एआई दृश्य भाषा मॉडल जो चित्र विश्लेषण और विवरण सेवाएँ प्रदान करता है।

चैटिंग

•एआई•चित्र पहचान

mwp_ReFT — गहन सुदृढीकरण अधिगम पर आधारित मॉडल माइक्रोट्यूनिंग ढाँचा

प्रोग्रामिंग

•प्राकृतिक भाषा संसाधन•गहन अधिगम

Qwen2-VL-7B — Qwen2-VL-7B एक नवीनतम दृश्य भाषा मॉडल है जो बहु-मोडल समझ और पाठ निर्माण का समर्थन करता है।

•दृश्य भाषा मॉडल•बहु-मोडल

Qwen2-VL-2B — अत्याधुनिक दृश्य भाषा मॉडल, बहु-मोडल समझ और पाठ निर्माण का समर्थन करता है।

•दृश्य भाषा मॉडल•बहु-मोडल

PaliGemma 2

PaliGemma 2 — PaliGemma 2 एक शक्तिशाली दृश्य भाषा मॉडल है, जिसे आसानी से अनुकूलित किया जा सकता है।

उत्पादकता

•दृश्य भाषा मॉडल•कृत्रिम बुद्धिमत्ता

SmolVLM — उच्च दक्षता वाला खुला स्रोत दृश्य भाषा मॉडल

•दृश्य भाषा मॉडल•बहु-मॉडल AI

ओमनीकंट्रोल — FLUX.1 के लिए न्यूनतम और बहुउपयोगी नियंत्रक

•छवि निर्माण•गहन अधिगम

LLaVA-o1 — दृश्य भाषा मॉडल जो चरणबद्ध तर्क कर सकता है

उत्पादकता

•दृश्य भाषा मॉडल•चरणबद्ध तर्क

एक्विला-वीएल-2बी-ललावा-क्वेन — यह एक दृश्य भाषा मॉडल है जो बुद्धिमान प्रसंस्करण के लिए छवियों और पाठ जानकारी को जोड़ता है।

•दृश्य भाषा मॉडल•बहु-मोडल

प्रॉम्प्टफिक्स — मानवीय निर्देशों के अनुसार तस्वीरों को सुधारने और संपादित करने का एक ढाँचा

•छवि प्रसंस्करण•डिफ्यूज़न मॉडल

ऑम्नीपार्सर

ऑम्नीपार्सर — शुद्ध दृश्य-आधारित ग्राफ़िकल यूज़र इंटरफ़ेस मध्यस्थता विश्लेषक

उत्पादकता

•दृश्य भाषा मॉडल•उपयोगकर्ता इंटरफ़ेस विश्लेषण

VisRAG — दृश्य भाषा मॉडल पर आधारित पुनर्प्राप्ति-वर्धित जनरेटिव मॉडल

•दृश्य भाषा मॉडल•पुनर्प्राप्ति-वर्धित जनरेशन

F5-TTS — गहन अधिगम पर आधारित उच्च-गुणवत्ता वाला पाठ-से-वाणी संश्लेषण मॉडल

उत्पादकता

•पाठ-से-वाणी•गहन अधिगम