EXAONE-3.5-32B-Instruct-AWQ é uma série de modelos de geração de linguagem bilíngue (inglês e coreano) com ajuste de instruções, desenvolvidos pela LG AI Research, com parâmetros variando de 2,4B a 32B. Esses modelos suportam o processamento de contexto longo de até 32K tokens, apresentando desempenho de ponta em casos de uso do mundo real e compreensão de contexto longo, ao mesmo tempo em que mantêm a competitividade em domínios gerais em comparação com modelos de tamanho semelhante lançados recentemente. O modelo, através da técnica de quantização AWQ, alcançou a quantização de peso em nível de grupo de 4 bits, otimizando a eficiência de implantação do modelo.