Falcon Mamba es el primer modelo a gran escala de 7B parámetros, sin mecanismos de atención, publicado por el Instituto de Innovación Tecnológica de Abu Dhabi (TII). Este modelo no está limitado por el aumento de los costos computacionales y de almacenamiento derivados del incremento de la longitud de las secuencias al procesar secuencias largas, manteniendo un rendimiento comparable al de los modelos de vanguardia existentes.