Actualités IA

Ne manquez aucun moment de l'innovation mondiale en IA

IA Quotidien

Tendances quotidiennes de l'industrie de l'IA en trois minutes

Chronologie de l'IA

Jalons de l'industrie de l'IA

Al hardware

liste tous les produits de matériel AI.

Guide de monétisation de l'IA

Derniers cas

Partage de cas de monétisation de l'IA

Collection d'images

Cas de monétisation de la création d'images par l'IA

Collection de vidéos

Cas de monétisation de la création de vidéos par l'IA

Collection audio

Cas de monétisation de la création audio par l'IA

Collection de contenu

Cas de monétisation de la rédaction de contenu par l'IA

Tutoriels IA

Derniers tutoriels

Partage gratuit des derniers tutoriels IA

Classements des produits IA

Classement des produits IA

Affiche le classement du nombre total de visites des sites web d'IA

Classement de la croissance du trafic IA

Suit les sites web d'IA à la croissance la plus rapide en termes de trafic

Classement de la baisse du trafic IA

Se concentre sur les sites web d'IA avec des baisses de trafic importantes

Classement hebdomadaire de l'IA

Affiche le classement hebdomadaire des visites des sites web d'IA

Classements des pays populaires

États-Unis

Sites web d'IA les plus populaires auprès des utilisateurs américains

Chine

Sites web d'IA les plus populaires auprès des utilisateurs chinois

Inde

Sites web d'IA les plus populaires auprès des utilisateurs indiens

Brésil

Sites web d'IA les plus populaires auprès des utilisateurs brésiliens

Classements des catégories populaires

Génération d'images

Classement du nombre total de visites des sites web de génération d'images par l'IA

Assistant personnel

Classement du nombre total de visites des sites web d'assistants personnels d'IA

Génération de personnages

Classement du nombre total de visites des sites web de génération de personnages par l'IA

Génération de vidéos

Classement du nombre total de visites des sites web de génération de vidéos par l'IA

Classements des données Open Source populaires

Classement des projets IA

Projets IA populaires sur GitHub par nombre total d'étoiles

Classement de la croissance des projets IA

Projets IA populaires sur GitHub par taux de croissance

Classement des développeurs IA

Classement des développeurs IA populaires sur GitHub

Classement des organisations IA

Classement des organisations IA populaires sur GitHub

Catégories Open Source populaires

Deepseek

Projets Open Source Deepseek populaires sur GitHub

TTS

Projets Open Source TTS populaires sur GitHub

LLM

Projets Open Source LLM populaires sur GitHub

ChatGPT

Projets Open Source ChatGPT populaires sur GitHub

Bibliothèque de projets Open Source IA

Aperçu

Aperçu des projets Open Source IA populaires sur GitHub

Bibliothèque de produits Navigation de l'outil

Décryptage de la face cachée de la Lune o1 : Long-CoT est la clé, la réflexion du modèle nécessite une "approche à long terme"

AIbase基地

Publié leActualités IA · 4 minutes de lecture · Feb 17, 2025

231

Flood Sung, chercheur chez Lune Obscure, a récemment publié un long article de plusieurs milliers de mots, dévoilant pour la première fois en détail les idées de développement du modèle k1.5, et effectuant une profonde réflexion sur les enseignements techniques apportés par le modèle o1 d'OpenAI.

Selon Flood Sung, l'importance de Long-CoT (Longue Chaîne de Pensée) a été prouvée il y a plus d'un an par Tim Zhouxin Yu, co-fondateur de Lune Obscure. En utilisant un petit modèle pour entraîner des calculs à plusieurs chiffres, et en transformant le processus de calcul granulaire en données de Longue Chaîne de Pensée pour un ajustement fin supervisé (SFT), des résultats significatifs peuvent être obtenus.

Cependant, en raison de contraintes de coût, Lune Obscure s'est concentrée jusqu'à présent sur l'optimisation de Long Context (entrée de texte long). Flood Sung explique que Long Context traite principalement l'entrée, et grâce aux techniques de pré-remplissage (Prefill) et Mooncake, il est possible de contrôler assez bien les coûts et la vitesse. En comparaison, Long-CoT se concentre sur la sortie, nécessitant des coûts plus élevés et des temps de traitement plus longs.

Mais le lancement d'OpenAI o1 a poussé l'équipe à reconsidérer les priorités en matière de direction technique. "Les performances sont primordiales", déclare Flood Sung, "les coûts et la vitesse s'amélioreront avec les progrès technologiques, l'essentiel est d'abord de réaliser une percée en termes de performances." Fort de cette conviction, Lune Obscure a commencé à promouvoir pleinement la recherche sur Long-CoT, afin de permettre au modèle d'atteindre une capacité de pensée libre plus proche de celle de l'homme.

La publication de cet article technique décryptant le modèle marque le début d'une démarche systématique de Lune Obscure pour se comparer au modèle o1 et mener des recherches concrètes dans ce domaine.

Article de plusieurs milliers de mots décryptant le processus de décryptage de o1 :https://mp.weixin.qq.com/s/sJmT-tM3A-mglZ1d4OI80A

Modèle k1.5 Modèle OpenAI o1 Long-CoT Entrée de texte long

Cet article provient d'AIbase Daily

Bienvenue dans la section [AI Quotidien] ! Voici votre guide pour explorer le monde de l'intelligence artificielle chaque jour. Chaque jour, nous vous présentons les points forts du domaine de l'IA, en mettant l'accent sur les développeurs, en vous aidant à comprendre les tendances technologiques et à découvrir des applications de produits IA innovantes.

—— Créé par le groupe AIbase Daily