OpenAI s'apprête à apporter d'importantes améliorations à ChatGPT. Le ChatGPT Pro, au prix de 200 dollars par mois, est officiellement disponible. Bien qu'il n'intègre pas encore de nouvelles fonctionnalités ou de nouveaux modèles, les utilisateurs pourront découvrir le nouveau modèle « Fraise » dans les deux prochaines semaines. Ce modèle d'IA très attendu offrira non seulement une puissance technique accrue à ChatGPT, mais attirera également l'attention du secteur par son approche unique du raisonnement.

image.png

La caractéristique principale du modèle « Fraise » réside dans sa capacité à imiter le processus de pensée humaine. Avant de fournir une réponse, il prend 10 à 20 secondes pour « réfléchir » et effectuer une recherche d'informations. Ce traitement innovant vise à améliorer l'efficacité de l'utilisation de la puissance de calcul de l'IA, afin de générer un contenu plus précis.

Cependant, il est important de noter que le modèle « Fraise » ne prend en charge que le traitement de texte dans sa version initiale, et ne possède pas les capacités de traitement d'images et audio de GPT-4.

image.png

En réalité, cette technique d'allongement du temps de raisonnement et d'ajustement adaptatif n'est pas une innovation d'OpenAI. Google DeepMind mène des recherches approfondies dans ce domaine depuis longtemps et a publié des articles à ce sujet. Les chercheurs ont constaté que la technique de « calcul au moment de l'inférence » permet d'améliorer considérablement les performances des grands modèles linguistiques, en dépassant les limites actuelles des modèles en termes de données d'entraînement et de ressources de calcul d'inférence.

La stratégie d'optimisation du modèle « Fraise » repose principalement sur deux approches. La première est basée sur un modèle de récompense de vérification intensif et orienté processus, qui exige que le modèle fournisse non seulement le résultat, mais aussi le processus de raisonnement logique, particulièrement utile pour les tâches complexes de mathématiques et de raisonnement logique.

La seconde stratégie consiste à ajuster dynamiquement les réponses suivantes en fonction du contenu généré précédemment, en optimisant continuellement la qualité de la sortie par le biais d'itérations multiples. La stratégie « calcul optimal » proposée par les chercheurs vise à sélectionner la méthode de calcul au moment de l'inférence la plus appropriée en fonction du contexte, améliorant ainsi considérablement l'efficacité du calcul.

Cependant, le modèle « Fraise » est confronté à certains défis. Bien qu'il excelle dans la réduction des erreurs et des hallucinations, le temps de réponse de 10 à 20 secondes peut affecter l'expérience utilisateur. Certains utilisateurs ont indiqué que la précision légèrement améliorée des réponses ne semble pas compenser le temps d'attente plus long.

De plus, les capacités avancées peuvent entraîner une consommation accrue de ressources de calcul, ce qui pourrait augmenter les coûts. Pour trouver un équilibre entre l'expérience utilisateur et la consommation de ressources, OpenAI pourrait limiter la fréquence d'envoi des messages et envisager de proposer des forfaits plus coûteux pour des vitesses de réponse plus rapides.