मोबाइलLLM मोबाइल उपकरणों के लिए अनुकूलित एक छोटा भाषा मॉडल है, जो मोबाइल परिनियोजन की व्यावहारिकता के लिए एक अरब से कम पैरामीटर वाले उच्च-गुणवत्ता वाले LLMs को डिज़ाइन करने पर केंद्रित है। पारंपरिक धारणा के विपरीत, यह शोध छोटे LLMs में मॉडल आर्किटेक्चर के महत्व पर ज़ोर देता है। गहरे और पतले आर्किटेक्चर का उपयोग करके, एम्बेडिंग शेयरिंग और समूहित क्वेरी ध्यान तंत्र के साथ संयोजन में, मोबाइलLLM ने सटीकता में उल्लेखनीय सुधार प्राप्त किया है, और एक ब्लॉक-स्तरीय वज़न साझाकरण विधि प्रस्तावित की है जो मॉडल के आकार को बढ़ाए बिना विलंबता ओवरहेड को कम करती है। इसके अलावा, मोबाइलLLM मॉडल परिवार ने चैट बेंचमार्क परीक्षणों में पिछले छोटे मॉडल की तुलना में उल्लेखनीय सुधार दिखाया है, और API कॉल कार्यों में LLaMA-v2 7B की शुद्धता के करीब है, जो सामान्य उपकरण उपयोग के मामलों में छोटे मॉडल की क्षमता को उजागर करता है।