Ces derniers temps, les discussions sur un éventuel déclin du marché des ordinateurs et des smartphones se multiplient. Récemment, Micron, fabricant de puces mémoire, a revu à la baisse ses prévisions de revenus pour les prochains trimestres en raison de ventes inférieures aux attentes pour les ordinateurs IA et les smartphones, suscitant des inquiétudes et laissant certains penser que «l'IA est en train de mourir». Cependant, en réalité, l'IA ne montre aucun signe de déclin, comme le démontre clairement la performance de Nvidia.
Source : Image générée par IA, fournisseur de services d'autorisation d'images Midjourney
Actuellement, de nombreux ordinateurs portables et smartphones se présentant comme dotés d'une fonctionnalité IA n'ont pas la puissance de traitement suffisante. Même les PC de jeu les plus performants ont du mal à exécuter localement des programmes IA complexes comme ChatGPT, car ces applications nécessitent d'énormes quantités de données et de capacités de calcul impossibles à gérer sur un ordinateur personnel. Bien que des applications alternatives existent, leurs performances et leur vitesse de réponse sont bien inférieures à celles de la plupart des programmes IA fonctionnant sur des serveurs.
Dans l'écosystème de l'IA, les entreprises et les outils les plus performants sont déjà bien établis. Par exemple, les utilisateurs disposant d'une carte graphique Nvidia RTX surpassent généralement de nombreuses CPU modernes équipées de NPU en termes de performances IA. La comparaison entre une RTX4080 et un ordinateur portable équipé d'un Intel Core Ultra9185H montre une différence de performances allant de 700 % à 800 % pour les charges de travail IA. Cela souligne le rôle crucial des serveurs dans la fourniture de performances IA.
Google a étendu son modèle d'IA Gemini à la plupart des appareils Android et prévoit de l'intégrer aux enceintes Nest. Bien que ces appareils existent depuis quatre ans, ils témoignent de l'applicabilité étendue de la technologie IA. Par le passé, les performances des cartes graphiques étaient considérées comme devant atteindre des milliards de milliards d'opérations par seconde (PFLOPs) pour permettre une véritable expérience de réalité virtuelle, un seuil que les cartes graphiques actuelles n'ont pas encore atteint, ce qui reflète les défis persistants du développement de l'IA locale.
Dans le développement des fabricants de GPU, la programmation IA repose généralement sur le calcul parallèle, domaine dans lequel les GPU excellent. Par conséquent, la conception future des GPU nécessitera du temps, et il faudra probablement attendre la sortie de la série RTX60 pour observer une amélioration significative des performances IA. Cette génération de cartes graphiques pourrait permettre l'exécution de grands modèles linguistiques (LLM) locaux.
Points clés :
🌟 La technologie IA n'est pas en voie de disparition, les performances du marché sont affectées par des malentendus.
💻 De nombreux appareils se présentant comme dotés d'IA dépendent des serveurs pour leurs performances et ont du mal à réaliser des calculs complexes localement.
🚀 Les progrès technologiques futurs des GPU pourraient stimuler le développement de modèles IA locaux.