Des GPU pour PC taillés pour exécuter des modèles GenAI

Alors que les derniers modèles de GenAI deviennent plus légers et sont capables de fonctionner sur les ordinateurs de bureau, les fabricants de puces ajoutent davantage de fonctions d’IA aux GPU de bureau.
Lors du salon Computex 2025 de Taipei, les principaux fournisseurs de GPU, Nvidia, Intel et AMD, ont fourni plus de détails sur leurs GPU de bureau capables d’exécuter localement des modèles d’IA générative. Le premier a annoncé que son DGX Spark desktop (anciennement Project DIGITS), un petit boîtier qui se pose sur le bureau, sera livré en juillet par les principaux fabricants de PC, notamment Dell, HP, Acer, Asus et Lenovo. Le système comprend le dernier GPU Blackwell et apporte des performances de 1 pétaflops. « Le boitier apporte un cloud d’IA sur le bureau, toujours allumé et prêt à l’emploi », a déclaré Jensen Huang, CEO de Nvidia, lors d’une présentation.
Alors que Spark cible exclusivement l’IA, Intel et AMD ont annoncé des GPU combinant IA et graphisme. Généralement, l‘IA nécessite des circuits spéciaux sur les GPU capables d’effectuer des multiplications matricielles. Le GPU Radeon 9700 AI Pro d’AMD, disponible en juillet, possède 128 accélérateurs et peut exécuter un modèle de raisonnement R1 DeepSeek avec jusqu’à 32 milliards de paramètres. Les ordinateurs de bureau configurés avec quatre GPU Radeon 9700 peuvent exécuter le modèle Large Instruct de Mistral avec 123 milliards de paramètres. Quant à l‘Arc Pro B50 annoncé par Intel, c’est un GPU économique – il est vendu 299 $ – destiné principalement au graphisme sur stations de travail, mais il dispose également de 128 moteurs spécialisés dans l’IA. Le GPU peut exécuter DeepSeek R1 avec jusqu’à 14 milliards de paramètres. Il ne dispose pas de la mémoire nécessaire pour faire tourner un modèle comportant 32 milliards de paramètres ou plus, selon un diaporama fourni par Intel. L’Arc Pro B50 affiche 16 Go de mémoire, soit la moitié de la Radeon 9700 AI Pro d’AMD. Le GPU d’Intel consomme 70 watts, contre 300 pour celui d’AMD.
Les stations de travail taillées pour l’IA en point de mire
Selon Jack Gold, analyste principal chez J. Gold Associates, le développement de l’IA s’oriente vers l’informatique personnelle et s’éloigne des ressources cloud coûteuses en temps partagé. « Il se peut que les résultats soient encore exécutés dans le cloud au moment de la production, mais le développement s’oriente de plus en plus vers les PC, en particulier parce que ces outils de développement alimentés par l’IA sont utilisés pour développer des programmes d’IA », a avancé M. Gold. Les fournisseurs de puces considèrent également les stations de travail pour l’IA, principalement vendues pour le graphisme et les jeux, comme un prochain marché important de ventes de PC haut de gamme. « Les GPU discrets dans les ordinateurs de bureau et les ordinateurs portables constituent un bon marché, mais le potentiel des PC d’IA est probablement beaucoup plus important en termes de quantité. Ils offrent une opportunité d’expansion intéressante aux fournisseurs du marché des PC », a estimé M. Gold. « Les ordinateurs portables d’IA, tels que les PC Copilot+ basés sur Windows, sont équipés d’unités de traitement neuronal, davantage destinées à la consommation d’IA qu’au développement », a fait remarquer M. Gold.
« L’IA devient de plus en plus une charge de travail secondaire dans les stations de travail, en particulier si elles utilisent des GPU Nvidia », a constaté Anshel Sag, analyste principal chez Moor Strategy and Insights. « De nombreuses entreprises ne veulent pas nécessairement envoyer leurs charges de travail dans le cloud. Mais elles ne veulent pas non plus construire des superordinateurs pour exécuter des modèles d’inférence », a-t-il relevé. « Les modèles GenAI deviennent aussi plus légers et plus efficaces pour fonctionner localement, ce qui permet d’exécuter efficacement des modèles de raisonnement sur des stations de travail », a fait valoir M. Sag. « DeepSeek a été l’un des catalyseurs de cette évolution », a-t-il ajouté. Développé par l’entreprise chinoise éponyme, DeepSeek a été largement adopté par les entreprises d’intelligence artificielle et les fournisseurs de services cloud aux États-Unis. Lors de la keynote du Computex, le CEO de Nvidia, M. Huang, a reconnu le rôle de DeepSeek dans l’accessibilité de l’IA. « DeepSeek R1 est véritablement un cadeau pour l’industrie mondiale de l’IA… R1 a eu un impact réel sur la façon dont les gens pensent à l’IA, à l’inférence et au raisonnement », a déclaré M. Huang.