Steiner-32b-preview
Steiner est un modèle d'inférence entraîné sur des données synthétiques, conçu pour explorer plusieurs chemins d'inférence et s'auto-vérifier.
Produit OrdinaireProductivitéModèle d'inférenceApprentissage par renforcement
Steiner est une série de modèles d'inférence développée par Yichao 'Peak' Ji, axée sur l'entraînement sur des données synthétiques par apprentissage par renforcement, capable d'explorer plusieurs chemins et de s'auto-vérifier ou de revenir en arrière lors de l'inférence. L'objectif de ce modèle est de reproduire les capacités d'inférence d'OpenAI o1 et de vérifier la courbe d'extensibilité lors de l'inférence. Steiner-preview est un projet en cours, son objectif open source est de partager des connaissances et d'obtenir des retours d'utilisateurs réels. Bien que ce modèle ait démontré d'excellentes performances dans certains tests de référence, il n'a pas encore pleinement atteint les capacités d'extensibilité de l'inférence d'OpenAI o1, il est donc encore en phase de développement.
Steiner-32b-preview Dernière situation du trafic
Nombre total de visites mensuelles
29742941
Taux de rebond
44.20%
Nombre moyen de pages par visite
5.9
Durée moyenne de la visite
00:04:44