स्टार-अटेंशन

उच्च-कुशल लंबी श्रृंखला वाले बड़े भाषा मॉडल अनुमान तकनीक

सामान्य उत्पादप्रोग्रामिंगNVIDIAबड़े भाषा मॉडल

स्टार-अटेंशन NVIDIA द्वारा प्रस्तावित एक नया ब्लॉक-विरल ध्यान तंत्र है, जिसका उद्देश्य ट्रांसफॉर्मर-आधारित बड़े भाषा मॉडल (LLM) की लंबी श्रृंखलाओं पर अनुमान दक्षता में सुधार करना है। यह तकनीक दो चरणों के संचालन के माध्यम से अनुमान गति में उल्लेखनीय वृद्धि करती है, साथ ही 95-100% सटीकता बनाए रखती है। यह अधिकांश ट्रांसफॉर्मर-आधारित LLM के साथ संगत है, और इसे सीधे उपयोग करने के लिए अतिरिक्त प्रशिक्षण या ठीक-ट्यूनिंग की आवश्यकता नहीं है, और इसे फ्लैश अटेंशन और KV कैशे संपीड़न तकनीक जैसे अन्य अनुकूलन विधियों के साथ जोड़ा जा सकता है, जिससे प्रदर्शन में और वृद्धि होती है।

Best AI Websites & Tools

स्टार-अटेंशन

स्टार-अटेंशन नवीनतम ट्रैफ़िक स्थिति

स्टार-अटेंशन विज़िट प्रवृत्ति

स्टार-अटेंशन विज़िट भौगोलिक वितरण

स्टार-अटेंशन ट्रैफ़िक स्रोत

स्टार-अटेंशन विकल्प

स्टार-अटेंशन — उच्च-कुशल लंबी श्रृंखला वाले बड़े भाषा मॉडल अनुमान तकनीक

FlashAttention — तेज़ और मेमोरी-कुशल सटीक ध्यान तंत्र

LLM पारदर्शिता उपकरण — ट्रांसफॉर्मर भाषा मॉडल के आंतरिक कार्य तंत्र का विश्लेषण करता है

BiTA — बड़े भाषा मॉडल के लिए द्विदिशीय समायोजन

AoT — एटम ऑफ़ थॉट्स (AoT) बड़े भाषा मॉडल अनुमान प्रदर्शन को बेहतर बनाने के लिए एक ढांचा है।

ART — वेरिएबल मल्टी-लेयर पारदर्शी इमेज जेनरेशन के लिए एक एनोनिमस एरिया ट्रांसफॉर्मर तकनीक।

FlexHeadFA — तेज़ और मेमोरी-कुशल सटीक ध्यान तंत्र

Qwen2.5-1M — 100 लाख टोकन संदर्भ के साथ एक ओपन-सोर्स Qwen मॉडल, जो लंबी श्रृंखला प्रसंस्करण कार्यों के लिए उपयुक्त है।

Janus-Pro-1B — Janus-Pro-1B एक एकीकृत बहु-मोडल समझ और पीढ़ी वाला स्व-पुनरावर्ती ढाँचा है।

ViTPose — ट्रांसफॉर्मर पर आधारित ViTPose मॉडल का संग्रह

FlashInfer — FlashInfer एक उच्च-प्रदर्शन वाला GPU कर्नेल लाइब्रेरी है जो बड़े भाषा मॉडल सेवाओं के लिए डिज़ाइन किया गया है।

Sonus-1 — Sonus-1: बड़े भाषा मॉडल (LLMs) के नए युग का आगाज़

आधुनिकBERT — आधुनिकBERT एक नई पीढ़ी का एन्कोडर मॉडल है, जिसका प्रदर्शन बेहद शानदार है।

EXAONE-3.5-7.8B-Instruct — LG AI Research द्वारा विकसित बहुभाषी जेनेरेटिव मॉडल

EXAONE-3.5-2.4B-Instruct — LG AI Research द्वारा विकसित एक द्विभाषी पाठ निर्माण मॉडल

फास्टवीडियो — ओपन सोर्स फ्रेमवर्क, बड़े वीडियो डिफ्यूज़न मॉडल को तेज करता है

InternVL2_5-4B — बहुविधा विशाल भाषा मॉडल, जो दृश्य और भाषा समझ को जोड़ता है।

Sana_600M_512px — उच्च दक्षता, उच्च रिज़ॉल्यूशन वाला टेक्स्ट-टू-इमेज जेनरेशन फ़्रेमवर्क

Sana_600M_1024px — उच्च रिज़ॉल्यूशन, उच्च दक्षता वाला टेक्स्ट-टू-इमेज जेनरेटिव फ़्रेमवर्क

Sana_1600M_1024px_बहुभाषी — उच्च रिज़ॉल्यूशन, बहुभाषी समर्थन वाला टेक्स्ट-टू-इमेज जेनरेटिव मॉडल

Sana_1600M_512px_बहुभाषी — उच्च रिज़ॉल्यूशन, बहुभाषी टेक्स्ट-टू-इमेज जेनरेशन मॉडल

Sana_1600M_1024px — उच्च रिज़ॉल्यूशन, उच्च दक्षता वाला टेक्स्ट-टू-इमेज जेनरेशन फ़्रेमवर्क

Sana_1600M_512px — उच्च रिज़ॉल्यूशन, उच्च दक्षता वाला टेक्स्ट-टू-इमेज जेनरेशन फ़्रेमवर्क

Sana-1.6B — उच्च-रिज़ॉल्यूशन छवि संश्लेषण के लिए रैखिक प्रसार ट्रांसफॉर्मर

OLMo 2 13B — उच्च-प्रदर्शन अंग्रेजी शैक्षणिक आधार भाषा मॉडल