L'empire (du Milieu) contre-attaque

Alors que les États-Unis souhaitent encore renforcer les restrictions sur les exports de GPU dédiés à l’IA en direction de la Chine, les géants locaux de l’informatique avancent à marche forcée. Huawei se prépare ainsi à livrer les premiers échantillons de sa dernière puce en date, l’Ascend 910D, censée rivaliser avec le H100 de NVIDIA. Baidu, lui, vient fièrement de mettre en service un nouveau cluster de 30 000 GPU produits par Kunlun, sa filiale dédiée aux semi-conducteurs.
Les sanctions américaines entraveront-elles la course à l’IA engagée par les startups et les géants de l’informatique chinois ? Bien que Pékin et les entreprises concernées restent relativement discrètes quant à leurs projets, les informations qui parviennent de Chine montrent que les spécialistes du secteur redoublent d’efforts en la matière.
Le géant des télécoms Huawei se prépare par exemple à recevoir des échantillons de sa dernière puce dédiée à l’IA, l’Ascend 910D. Attendus pour le mois de mai, ils devraient permettre aux premiers clients de valider les qualités de la puce et ses performances réelles, avant le passage à une production de masse.
Huawei accélère la cadence
L’objectif affiché serait, selon le Wall Street Journal, de rivaliser avec les performances de la H100 de NVIDIA. Cette dernière, qui date pour mémoire de 2022 (architecture Hopper), n’est pas la puce la plus performante du catalogue de l’entreprise américaine, mais c’est elle qui équipe la plupart des grandes infrastructures dédiées à l’IA. Elle fait encore, de ce fait, figure de standard sur le marché.
En parallèle, Huawei s’efforce de monter en cadence sur les générations précédentes de ses accélérateurs dédiés à l’IA, les puces Ascend 910B et 910C, pour répondre à la demande d’acteurs locaux tels que Bytedance. La demande serait de l’ordre de 800 000 puces sur l’année en cours, estime le Wall Street Journal, citant des sources locales.

La tendance ne devrait pas s’inverser. Jensen Huang, patron de NVIDIA, a bien réussi à négocier une pause lors d’un dîner à un million de dollars avec Donald Trump, mais les États-Unis projettent toujours de subordonner l’export des puces H20, réservées par NVIDIA au marché chinois, à l’obtention préalable d’une autorisation.
Or, si ces puces H20 affichent des performances moins importantes que les modèles plus haut de gamme développés par NVIDIA, elles constituent encore aujourd’hui le socle de bon nombre des développements IA locaux, à commencer par le célèbre modèle DeepSeek. Les entreprises chinoises n’ont d’ailleurs pas attendu les derniers dénouements des négociations entreprises par NVIDIA avec l’administration Trump : depuis le début de l’année, elles importent massivement des H20, avec un volume de commandes de l’ordre de 16 milliards de dollars sur les trois premiers mois de l’année.
Un approvisionnement freiné par les restrictions internationales
L’objectif affiché est clair : stocker un maximum de composants pendant qu’il est encore temps, en attendant que la production nationale permette de pallier les restrictions états-uniennes. Et tous les moyens sont bons pour soutenir cette dernière, dans la mesure où la Chine ne dispose pas, pour l’instant, de capacités industrielles comparables à celles de TSMC (production des GPU) ou SK Hynix (numéro un mondial de la mémoire HBM utilisée dans les composants dédiés à l’IA).
Pour produire ses Ascend 910B et 910C, Huawei est par exemple accusé d’être allé s’approvisionner en puces chez TSMC en passant par un intermédiaire. L’affaire pourrait valoir à TSMC une amende record aux États-Unis, de l’ordre du milliard de dollars.
Elle a été soulevée par Lennart Heim, un analyste américain, chercheur au RAND, qui suit de près les développements chinois en matière d’IA. D’après ce dernier, Huawei aurait réussi à commander la production de quelque 3 millions de puces auprès de TSMC, et ce sont ces puces qui rentreraient dans l’assemblage des Ascend 910C.
Les analyses techniques menées par Lennart Heim montrent bien que l’Ascend 910C accuse un retard par rapport aux solutions signées NVIDIA. La puce, qui consiste, en simplifiant, en un assemblage de deux modules 910B, parviendrait selon lui à sortir environ 800 TFLOPS en FP16, avec une bande passante mémoire de l’ordre de 3,2 To/s.
Les performances brutes, la construction de la puce et l’interconnexion entre les deux dies semblent très en deçà de ce que propose le H100 – et donc les modèles ultérieurs basés sur l’architecture Blackwell, mais 3 millions d’exemplaires d’une puce moyenne valent mieux que rien. D’autant que si la puce est considérée comme décevante pour l’entraînement, elle se prêterait tout de même assez bien à l’inférence, d’après les évaluations conduites par DeepSeek.
Samsung en embuscade
S’ils échappent aux acteurs américains, les appétits chinois suscitent la convoitise d’autres spécialistes des semi-conducteurs, à commencer par Samsung. Le géant sud-coréen a été détrôné par son compatriote SK Hynix sur le marché de la mémoire vive, dans la mesure où ce dernier équipe tous les grands noms du secteur, à commencer par NVIDIA ou AMD. Mais SK Hynix n’a pas les capacités de production nécessaires pour, en plus, répondre aux commandes venues de Chine. Cela pourrait laisser à Samsung un boulevard.
Outre la HBM utilisée par Huawei dans ses puces Ascend, Samsung équiperait également le géant de la recherche en ligne Baidu. Ce dernier travaille également à la conception de ses propres puces dédiées à l’IA via sa filiale spécialisée, Kunlun. L’entreprise s’est targuée en fin de semaine dernière d’avoir franchi une étape symbolique. À l’occasion de la présentation de ses derniers grands modèles de langage, Baidu a en effet annoncé avoir finalisé les préparatifs d’un nouveau cluster dédié à l’entraînement, composé de 30 000 puces P800 produites par Kunlun.
L’entreprise ne communique plus publiquement dans les conférences dédiées aux semi-conducteurs depuis 2020, mais Baidu assure que son cluster est idéal pour entraîner et faire tourner de très grands modèles de langage.

L’enjeu, pour les acteurs chinois, consiste maintenant à renforcer les capacités industrielles du pays, pour ne plus dépendre de fondeurs tiers comme TSMC, Samsung et consorts. Ren Zhengfei, le discret fondateur de Huawei, s’en serait d’ailleurs ému en février dernier auprès du président Xi Jinping, comme l’ont rapporté les médias chinois proches du pouvoir, mentionnés par Reuters.
Un objectif d’autosuffisance à 70 % d’ici 2028 ?
Sur ce volet, la Chine accuserait toujours un retard très significatif, pénalisée notamment par les restrictions mises en place sur l’approvisionnement en machines ASML pour la gravure des dies. Un long rapport du CSIS (Center for Strategic and International Studies, cercle de réflexion basé à Washington) consacré à la menace que représente DeepSeek pour les acteurs américains de l’IA, livre quelques éléments chiffrés.
SMIC, le principal fondeur chinois, dispose de capacités de gravure en 7 nm depuis 2021 (utilisées pour produire le processeur du Mate 60 de Huawei). L’entreprise aurait par ailleurs constitué des stocks de machines de lithographie DUV pour augmenter ses capacités de production, mais elle aurait du mal à compléter son approvisionnement sur tous les autres appareils associés, utilisés par exemple pour la métrologie ou le contrôle. La route vers des technologies de gravure plus ambitieuses (5 nm et inférieures) serait par ailleurs barrée par les restrictions mises en place sur les machines de lithographie EUV. Faute d’alternative chinoise suffisamment avancée, le fondeur serait donc limité dans ses velléités de développement.
La donne pourrait cependant changer, notamment parce que des centaines d’entreprises et de startups chinoises s’activent dans le sillage de Huawei, Baidu, SMIC et consorts. Ren Zhengfei aurait ainsi évoqué un objectif d’autosuffisance à hauteur de 70 % en matière de semi-conducteurs à horizon 2028.