EXAONE-3.5-32B-Instruct-AWQ ist ein von LG AI Research entwickeltes, anweisungen optimiertes, zweisprachiges (Englisch und Koreanisch) Generierungsmodell mit einer Parameteranzahl von 2,4B bis 32B. Diese Modelle unterstützen die Verarbeitung langer Kontexte mit bis zu 32.000 Token und zeigen bei realen Anwendungsfällen und dem Verständnis langer Kontexte Spitzenergebnisse. Gleichzeitig bleiben sie im Vergleich zu kürzlich veröffentlichten Modellen ähnlicher Größe im allgemeinen Bereich wettbewerbsfähig. Durch die AWQ-Quantisierungstechnik wird eine Quantisierung des Gewichts auf 4-Bit-Gruppenebene erreicht, wodurch die Effizienz der Modellbereitstellung optimiert wird.