El Instituto de Innovación Tecnológica de Abu Dhabi (TII) ha lanzado Falcon3, su nueva generación de modelos de IA de código abierto. Gracias a su entrenamiento con 14 billones de tokens y a un diseño de arquitectura optimizado, ha establecido un nuevo récord de rendimiento en hardware de consumo. Esta escala de entrenamiento es más del doble que la de su predecesor, Falcon2.

La serie Falcon3 incluye cuatro variantes: 1B, 3B, 7B y 10B, cada una disponible en una versión básica y una versión Instruct optimizada para conversaciones. Aunque se ofrecen versiones específicas en inglés, francés, español y portugués, todos los modelos pueden procesar la mayoría de los idiomas comunes.

En las evaluaciones de modelos de lenguaje de terceros de Hugging Face, Falcon3 superó a modelos de código abierto líderes como Llama-3.1-8B de Meta, Qwen2.5-7B, NeMo-12B de Mistral y Gemma2-9B de Google, demostrando una gran competitividad.

QQ20241220-093129.png

El rendimiento de Falcon3 en las pruebas de referencia supera a competidores de tamaño similar como Mistral, Alibaba, Meta y Google. | Imagen: Instituto de Innovación Tecnológica

TII destaca la facilidad de uso del modelo, asegurando su compatibilidad con API y bibliotecas estándar, y ofreciendo versiones cuantificadas optimizadas para configuraciones de hardware específicas. Además, el instituto ha lanzado un chatbot gratuito para pruebas y retroalimentación del usuario. El diseño de la interfaz se inspira en el éxito de ChatGPT, incluyendo funciones como carpetas de proyectos.

De cara al futuro, TII planea ampliar las capacidades de la serie Falcon3 a principios de 2025, lanzando un modelo multimodal que admita el procesamiento de imágenes, vídeo y audio. Actualmente, todos los modelos están disponibles para descarga gratuita en la plataforma Hugging Face bajo la licencia TII Falcon basada en Apache 2.0, que incluye directrices para el uso responsable de la IA.

QQ20241220-093143.png

Falcon Chat tiene una interfaz muy similar a la de ChatGPT e incluye funciones similares. | Imagen: Captura de pantalla de THE DECODER

Este lanzamiento marca otro avance importante en el campo de la IA de código abierto, especialmente en la mejora del rendimiento de la IA en hardware de consumo. Con la incorporación de capacidades multimodales, Falcon3 promete aportar más posibilidades de aplicaciones innovadoras a la comunidad de código abierto de IA en 2025.