ReDrafter
NVIDIA GPU पर LLM अनुमान को तेज करने वाली एक नई तकनीक
सामान्य उत्पादउत्पादकताNVIDIA GPULLM अनुमान
ReDrafter एक नया अनुमानित डिकोडिंग तरीका है जो RNN ड्राफ्ट मॉडल और गतिशील ट्री अटेंशन मैकेनिज्म को मिलाकर NVIDIA GPU पर बड़े भाषा मॉडल (LLM) की अनुमान गति को काफी बढ़ाता है। यह तकनीक LLM के टोकन निर्माण को तेज करके उपयोगकर्ताओं द्वारा अनुभव किए जाने वाले विलंब को कम करती है, साथ ही GPU के उपयोग और ऊर्जा खपत को भी कम करती है। ReDrafter को Apple मशीन लर्निंग रिसर्च टीम द्वारा विकसित किया गया है और NVIDIA के साथ मिलकर इसे NVIDIA TensorRT-LLM अनुमान त्वरण ढाँचे में एकीकृत किया गया है, जिससे NVIDIA GPU का उपयोग करने वाले मशीन लर्निंग डेवलपर्स को तेज टोकन निर्माण क्षमता मिलती है।
ReDrafter नवीनतम ट्रैफ़िक स्थिति
मासिक कुल विज़िट
197433
बाउंस दर
73.71%
प्रति विज़िट औसत पृष्ठ
2.1
औसत विज़िट अवधि
00:00:47