O llama3-s é um experimento de pesquisa aberto e em andamento, com o objetivo de expandir modelos de linguagem grandes (LLMs) baseados em texto para incluir capacidade nativa de 'audição'. O projeto utiliza técnicas inspiradas no artigo Chameleon da Meta, focando na transferência de tokens, expandindo tokens de áudio para o vocabulário do LLM, com potencial expansão para vários tipos de entrada no futuro. Como um experimento científico de código aberto, o repositório de código e os conjuntos de dados são públicos.