Qwen1.5-32B
ट्रांसफॉर्मर पर आधारित पूर्व-प्रशिक्षित भाषा मॉडल श्रृंखला
सामान्य उत्पादउत्पादकतापूर्व-प्रशिक्षित मॉडलट्रांसफॉर्मर
Qwen1.5 ट्रांसफॉर्मर आर्किटेक्चर पर आधारित एक डिकोडर भाषा मॉडल श्रृंखला है, जिसमें विभिन्न आकार के मॉडल शामिल हैं। इसमें SwiGLU सक्रियण, ध्यान QKV पूर्वाग्रह, समूह क्वेरी ध्यान आदि विशेषताएँ हैं। यह कई प्राकृतिक भाषाओं और कोड का समर्थन करता है। SFT, RLHF आदि जैसे बाद के प्रशिक्षण की अनुशंसा की जाती है। मूल्य मुफ़्त है।
Qwen1.5-32B नवीनतम ट्रैफ़िक स्थिति
मासिक कुल विज़िट
29742941
बाउंस दर
44.20%
प्रति विज़िट औसत पृष्ठ
5.9
औसत विज़िट अवधि
00:04:44