LLaDA
LLaDA es un modelo de difusión de lenguaje a gran escala que cuenta con una potente capacidad de generación de lenguaje, comparable al rendimiento de LLaMA3 8B.
Producto ComúnProductividadGeneración de lenguajeMultilingüe
LLaDA es un nuevo tipo de modelo de difusión que genera texto mediante un proceso de difusión, a diferencia de los modelos autoregresivos tradicionales. Destaca en la escalabilidad de la generación de lenguaje, el seguimiento de instrucciones, el aprendizaje contextual, la capacidad de conversación y la capacidad de compresión. Este modelo fue desarrollado por investigadores de la Universidad del Pueblo Chino y Ant Group, tiene un tamaño de 8B y se entrenó completamente desde cero. Sus principales ventajas son la capacidad de generar texto de forma flexible mediante el proceso de difusión, la compatibilidad con varias tareas de lenguaje, como la resolución de problemas matemáticos, la generación de código, la traducción y las conversaciones de varias rondas, etc. La aparición de LLaDA proporciona una nueva dirección para el desarrollo de modelos de lenguaje, especialmente en términos de calidad y flexibilidad de generación.
LLaDA Situación del tráfico más reciente
Total de visitas mensuales
19552
Tasa de rebote
72.60%
Páginas promedio por visita
1.4
Duración promedio de la visita
00:01:39