rStar

Mejora la capacidad de resolución de problemas de los modelos de lenguaje pequeños mediante el razonamiento de autojuego mutuo.

Producto ComúnProgramaciónAprendizaje automáticoProcesamiento del lenguaje natural
rStar es un método de razonamiento de autojuego mutuo que mejora significativamente la capacidad de razonamiento de los modelos de lenguaje pequeños (SLM) al descomponer el proceso de razonamiento en generación de soluciones y verificación mutua, sin necesidad de ajustes finos ni modelos más avanzados. rStar construye trayectorias de razonamiento de mayor calidad mediante la búsqueda de árbol de Montecarlo (MCTS) y la combinación de acciones de razonamiento humano, y verifica la precisión de estas trayectorias utilizando otro SLM de capacidad similar como discriminador. Este método se ha probado ampliamente en varios SLM, demostrando su eficacia en la resolución de diversos problemas de razonamiento.
Abrir sitio web

rStar Situación del tráfico más reciente

Total de visitas mensuales

474564576

Tasa de rebote

36.20%

Páginas promedio por visita

6.1

Duración promedio de la visita

00:06:34

rStar Tendencia de visitas

rStar Distribución geográfica de las visitas

rStar Fuentes de tráfico

rStar Alternativas