Modelos de Concepto a Gran Escala
Modelado del lenguaje en el espacio de representación de oraciones
Producto ComúnProgramaciónProcesamiento del lenguaje naturalMultilingüe
Los Modelos de Concepto a Gran Escala (LCM, por sus siglas en inglés) son un modelo de lenguaje grande desarrollado por Facebook Research que opera en el espacio de representación de oraciones, utilizando el espacio de incrustación SONAR para soportar texto en hasta 200 idiomas y voz en 57 idiomas. LCM es un modelo de secuencia a secuencia utilizado para la predicción de oraciones autoregresiva, explorando diversos métodos, incluyendo regresión de error cuadrático medio y variantes generativas basadas en difusión. Estas exploraciones utilizaron un modelo de 1.6B parámetros y aproximadamente 1.3T de datos de entrenamiento. Las principales ventajas de LCM incluyen su capacidad de operar en representaciones semánticas de alto nivel y su capacidad para manejar datos multilingües. Además, la naturaleza de código abierto de LCM permite a investigadores y desarrolladores acceder y utilizar estos modelos, impulsando el desarrollo de la tecnología de procesamiento del lenguaje natural.
Modelos de Concepto a Gran Escala Situación del tráfico más reciente
Total de visitas mensuales
474564576
Tasa de rebote
36.20%
Páginas promedio por visita
6.1
Duración promedio de la visita
00:06:34