Reflection 70B : un modèle surpuissant surpassant GPT-4o et Claude 3.5 Sonnet !

Matt Shumer, PDG de la startup d'intelligence artificielle HyperWrite, a annoncé une étape importante : le lancement du modèle Reflection70B, basé sur le modèle open source Llama 3.1-70B Instruct de Meta. Ce nouveau modèle, non seulement excelle dans les benchmarks tiers, mais est également salué comme « le modèle d'IA open source le plus puissant au monde ».

Shumer a partagé cette nouvelle sur le réseau social X, présentant des graphiques montrant la supériorité de Reflection70B sur la série Meta Llama dans plusieurs tests, atteignant même des performances comparables aux meilleurs modèles commerciaux. L'annonce a entraîné une augmentation spectaculaire du trafic sur le site de démonstration de HyperWrite, l'équipe recherchant actuellement des ressources GPU supplémentaires pour répondre à la demande.

L'originalité de Reflection70B réside dans sa capacité d'autocorrection. Shumer souligne que les grands modèles linguistiques (LLM) existants peuvent commettre des erreurs, mais manquent souvent de la capacité de s'autocorriger. Reflection70B, quant à lui, examine et évalue la précision de son texte après sa génération, garantissant ainsi la fiabilité des réponses fournies aux utilisateurs.

Le modèle introduit plusieurs nouveaux symboles spéciaux permettant aux utilisateurs d'interagir avec lui de manière plus structurée. Pendant le processus d'inférence, le modèle affiche son raisonnement dans des balises spéciales, permettant une correction d'erreur en temps réel. Sur le site de démonstration, les utilisateurs peuvent poser des questions simples, comme « Combien de lettres 'r' contient le mot 'Strawberry' ? » ou « Quel est le plus grand nombre entre 9.11 et 9.9 ? ». Après un certain temps de traitement, Reflection70B fournit la bonne réponse.

Cette caractéristique rend Reflection70B particulièrement adapté aux tâches nécessitant une grande précision. En décomposant le processus d'inférence en plusieurs étapes clairement définies, il améliore l'exactitude des résultats. Désormais, Reflection70B est disponible en téléchargement sur la plateforme Hugging Face, et l'accès via API sera bientôt proposé par le fournisseur de services GPU Hyperbolic Labs.

Par ailleurs, HyperWrite travaille à l'intégration du modèle Reflection70B dans son principal outil d'écriture assistée par IA. Une version plus puissante, Reflection405B, devrait être lancée la semaine prochaine. Shumer a révélé que l'entreprise explore constamment de nouvelles façons d'appliquer cette technologie à ses produits.

Le succès de Reflection70B est également dû à la contribution de Glaive, une entreprise spécialisée dans la génération de jeux de données pour des cas d'utilisation spécifiques, accélérant considérablement l'entraînement du modèle. La plateforme de Glaive permet de générer rapidement des données synthétiques de haute qualité, aidant les entreprises à affiner leurs modèles rapidement et économiquement, résolvant ainsi un important goulot d'étranglement dans le développement de l'IA : la disponibilité de données de haute qualité et spécifiques à la tâche.

HyperWrite, une startup d'IA basée à Long Island, a été cofondée en 2020 par Shumer et Jason Kuperberg. Elle explore activement le domaine de l'IA depuis sa création. Initialement une extension Chrome, elle est devenue un assistant IA capable de gérer des tâches plus complexes, comptant 2 millions d'utilisateurs et ayant reçu le prix « 30Under30 » de Forbes.

Le dernier tour de financement de HyperWrite, annoncé en mars 2023, a permis de lever 2,8 millions de dollars auprès d'investisseurs tels que Madrona Venture Group. Ces fonds ont soutenu le lancement de nouvelles fonctionnalités basées sur l'IA, transformant le navigateur web en assistant virtuel capable d'effectuer diverses tâches, de la réservation de vols à la recherche de candidats sur LinkedIn.

Shumer souligne que la précision et la sécurité sont les priorités absolues de HyperWrite, notamment lors de l'exploration de tâches d'automatisation complexes. La plateforme est constamment surveillée et améliorée grâce aux retours utilisateurs afin de perfectionner son outil d'assistant personnel. Cette approche prudente, à l'image du raisonnement structuré et de la réflexion intégrés à Reflection70B, témoigne de l'engagement de Shumer envers la précision et la responsabilité.

Adresse de téléchargement du modèle : https://huggingface.co/mattshumer/Reflection-Llama-3.1-70B

Actualités IA

Reflection 70B : un modèle surpuissant surpassant GPT-4o et Claude 3.5 Sonnet !

AIbase基地