Alors que les grands modèles d'IA se succèdent à un rythme effréné, Anthropic, une start-up en intelligence artificielle très prometteuse, prépare discrètement une mise à jour majeure : donner à son chatbot Claude la capacité de « parler ». Mike Krieger, le directeur produit d'Anthropic, a récemment révélé au Financial Times que la société explorait activement de nouvelles expériences utilisateur permettant aux utilisateurs d'interagir directement par la voix avec le puissant modèle d'IA Claude.
Krieger souligne que, parallèlement à l'élargissement des applications de Claude, notamment sur les ordinateurs de bureau, l'interaction vocale devrait devenir une interface utilisateur plus naturelle et efficace. « Nous étudions attentivement l'évolution de Claude sur les ordinateurs de bureau… Si à l'avenir il doit servir à manipuler un ordinateur, l'interaction vocale sera probablement un choix plus intuitif. » Il a également révélé qu'Anthropic avait déjà lancé des travaux de recherche et développement sur la fonctionnalité vocale et avait déjà développé plusieurs prototypes. « La voix est un mode d'interaction très prometteur, et nous explorons activement comment l'intégrer de manière transparente à nos produits. »
Pour accélérer le déploiement de la fonctionnalité vocale de Claude, Anthropic a entamé des discussions actives avec des investisseurs et partenaires importants tels qu'Amazon, ainsi qu'avec ElevenLabs, une start-up spécialisée dans l'IA vocale. Bien qu'aucun accord de partenariat définitif n'ait encore été conclu, ces initiatives annoncent sans aucun doute une percée majeure pour Claude dans le domaine de l'interaction vocale.
Krieger a également précisé qu'Anthropic avait communiqué avec « de nombreux partenaires potentiels » dans l'espoir de s'appuyer sur des forces externes pour proposer plus rapidement aux utilisateurs une expérience d'interaction vocale de haute qualité. On peut prévoir que, dans un avenir proche, l'interaction avec les chatbots IA ne se limitera plus à de froids échanges textuels, et qu'une ère d'échanges vocaux plus humains est sur le point d'arriver.