Qwen1.5-110B, Qwen1.5 श्रृंखला का सबसे बड़ा मॉडल है, जिसमें 110 अरब पैरामीटर हैं, जो बहुभाषी समर्थन करता है, एक कुशल ट्रांसफॉर्मर डिकोडर आर्किटेक्चर का उपयोग करता है, और इसमें समूहीकृत क्वेरी ध्यान (GQA) शामिल है, जो मॉडल अनुमान में अधिक कुशल बनाता है। यह बुनियादी क्षमता मूल्यांकन में Meta-Llama3-70B के बराबर है, और चैट मूल्यांकन में उत्कृष्ट प्रदर्शन करता है, जिसमें MT-Bench और AlpacaEval 2.0 शामिल हैं। इस मॉडल के जारी होने से मॉडल पैमाने के विस्तार में भारी क्षमता का प्रदर्शन होता है, और यह भविष्य में डेटा और मॉडल पैमाने के विस्तार से बड़ा प्रदर्शन सुधार प्राप्त करने का संकेत देता है।