Light-R1

Light-R1 est un projet open source axé sur l'inférence à longues chaînes (Long COT), qui fournit une méthode d'entraînement complète, de zéro, via SFT, DPO et RL.

Produit OrdinaireProgrammationIntelligence artificielleInfèrence à longues chaînes

Ouvrir le site Web

Light-R1 est un projet open source développé par Qihoo360, visant à entraîner des modèles d'inférence à longues chaînes via l'ajustement supervisé par le biais de cours (SFT), l'optimisation des préférences directes (DPO) et l'apprentissage par renforcement (RL). Ce projet, grâce à des jeux de données dépollués et des méthodes d'entraînement efficaces, permet d'obtenir une capacité d'inférence à longues chaînes à partir de zéro. Ses principaux avantages incluent des données d'entraînement open source, une méthode d'entraînement peu coûteuse et des performances exceptionnelles dans le domaine du raisonnement mathématique. Le contexte du projet repose sur les besoins actuels en matière d'entraînement de modèles d'inférence à longues chaînes, visant à fournir une méthode d'entraînement transparente et reproductible. Le projet est actuellement open source et gratuit, et convient aux institutions de recherche et aux développeurs.

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

AI Models Finder

LLM Leaderboard

Model Providers

Compare LLMs

LLM Cost Calculator

LLM Arena

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

AI Brand Monitoring Tool

AI Search Visibility Checker

GEO Services​

AI Model Compatibility Checker

AI Deployment Calculator

Light-R1

Light-R1 Dernière situation du trafic

Light-R1 Tendance des visites

Light-R1 Distribution géographique des visites

Light-R1 Sources de trafic

Light-R1 Alternatives

Light-R1 — Light-R1 est un projet open source axé sur l'inférence à longues chaînes (Long COT), qui fournit une méthode d'entraînement complète, de zéro, via SFT, DPO et RL.

Tost AI — Service d'inférence de modèles IA open source et gratuit

OpenThinker-32B — OpenThinker-32B est un puissant modèle d'inférence open source, conçu pour améliorer les capacités d'inférence sur des données ouvertes.

Définition de l'IA Open Source — Définition de l'intelligence artificielle open source, promouvant l'ouverture et la collaboration dans le domaine de l'IA.

Pensées Ouvertes — Un projet communautaire axé sur la compilation des meilleurs ensembles de données d'inférence open source.

Qwen2.5-1M — Modèle Qwen open source prenant en charge un contexte de 1 million de jetons, adapté aux tâches de traitement de longues séquences.

Infobot — IA générant des chaînes d'informations sur n'importe quel sujet

Open-source DeepResearch — Outil de recherche approfondie open source visant à reproduire les fonctionnalités de Deep Research via un framework open source.

DeepSeek-R1-Lite-Aperçu — Libérez un potentiel d'inférence supérieur et améliorez les performances des tests de référence AIME et MATH.

Moondream AI — Modèle linguistique visuel open source, fonctionnant sur divers appareils.

Star-Attention — Technique d'inférence efficace pour les grands modèles de langage sur des séquences longues

Rakis — Réseau d'inférence IA décentralisé fonctionnant dans le navigateur

Sky-T1-32B-Preview — Modèle d'inférence dont les performances sont comparables à celles de o1-preview sur les benchmarks d'inférence et de programmation.

CoT-Igniting-Agent — Allumer l'intelligence linguistique : des chaînes de pensée aux agents linguistiques

gpt oss — Les modèles GPT-OSS-120B et GPT-OSS-20B d'OpenAI offrent une forte capacité d'inférence, des fonctionnalités conviviales pour les développeurs et sont sous licence Apache 2.0, permettant ainsi l'accès démocratisé à l'intelligence artificielle.

Cerebras Inference — Solution d'inférence IA en temps réel, leader mondial en vitesse.

Steiner-32b-preview — Steiner est un modèle d'inférence entraîné sur des données synthétiques, conçu pour explorer plusieurs chemins d'inférence et s'auto-vérifier.

DeepSeek-R1-Distill-Qwen-1.5B — DeepSeek-R1-Distill-Qwen-1.5B est un modèle linguistique open source performant pour l'inférence, adapté à diverses tâches de traitement du langage naturel.

Système d'inférence DeepSeek-V3/R1 — Le système d'inférence DeepSeek-V3/R1 est une architecture d'inférence distribuée haute performance, spécialement conçue pour l'optimisation des modèles IA à grande échelle.

DeepSeek-R1-Distill-Qwen-7B — DeepSeek-R1-Distill-Qwen-7B est un modèle d'inférence open source spécialisé dans les mathématiques, le code et les tâches de raisonnement.

Reka Flash 3 — Modèle d'inférence généraliste de 21 milliards de paramètres, adapté aux applications à faible latence.

DeepSeek-R1 — DeepSeek-R1 est un modèle d'inférence haute performance, prenant en charge plusieurs langues et tâches, adapté à la recherche et aux applications commerciales.

DeepSeek-R1-Distill-Llama-8B — DeepSeek-R1-Distill-Llama-8B est un modèle linguistique open source haute performance, adapté à la génération de texte et aux tâches d'inférence.

LLM Efficiente — Solution d'inférence LLM efficace sur GPU Intel

MNN — MNN est un moteur d'inférence léger et haute performance open source d'Alibaba, prenant en charge plusieurs formats de modèles courants.

Qwen2.5-Coder-14B-Instruct-AWQ — Grand modèle linguistique open source pour la génération et l'inférence de code

Outils de LLM Open Source — Collection d'outils de modèles linguistiques de grande envergure (LLM) open source

OpenAI o3 — Modèle d'inférence le plus puissant de nouvelle génération

Modèle de génération Stability AI — Stability AI est une bibliothèque de modèles de génération open source.

d-Matrix — Plateforme d'inférence IA hautes performances pour les centres de données

GEO Services