Etched AI révolutionne l'inférence Transformer

La start-up américaine Etched AI a réussi à intégrer directement l'architecture Transformer dans une puce, créant ainsi le serveur le plus puissant au monde spécialement conçu pour l'inférence Transformer. Cette technologie permet d'exécuter des modèles à des milliards de paramètres, surpassant largement Nvidia.

Ce serveur offre de nombreuses fonctionnalités, notamment :

  • Un agent vocal en temps réel
  • Des capacités améliorées de codage et de recherche arborescente
  • Une fonction de décodage par multidiffusion spéculative

Il est équipé de 144 Go de mémoire HBM3E. Cette avancée technologique révolutionnaire ouvrira de nouvelles perspectives pour les applications basées sur l'architecture Transformer.