Tout ce qui brille n'est pas or

Coup de tonnerre sur le marché de l’intelligence artificielle : la startup chinoise DeepSeek aurait développé, avec un investissement de départ dérisoire, un modèle dont les performances égalent, voire dépassent, celles des ténors américains du secteur. Cerise sur le gâteau : son modèle, DeepSeek-R1, est publié en open source. L’annonce a provoqué un véritable séisme à Wall Street, où toutes les valeurs liées à l’IA ont dévissé lundi. Elle soulève aussi tout un lot d’interrogations, de rumeurs et d’accusations, alors même que les États-Unis viennent d’annoncer un plan à 500 milliards de dollars en faveur de l’IA…
Les boursicoteurs connaissent l’adage : « les arbres ne montent pas jusqu’au ciel ». À Wall Street, la journée de lundi a pris la forme d’une séance d’élagage pour les valeurs américaines les plus emblématiques de la course à l’intelligence artificielle. NVIDIA, leader incontesté du secteur, a reculé de 16,9 % sur la journée, soit l’équivalent de 600 milliards de dollars de valorisation perdus en seulement quelques heures. Même topo chez Broadcom, avec 17,4 % effacés en une seule séance.
Une IA aussi douée que gpt-4o entraînée pour une somme dérisoire
Au départ de cette dégringolade historique, se trouve une startup chinoise, DeepSeek, fondée en 2023 et globalement inconnue jusqu’au week-end dernier.
La société sort du bois le 20 janvier dernier, avec une annonce formulée sur les réseaux sociaux : elle affirme avoir mis au point plusieurs modèles d’IA, nourris à l’apprentissage par renforcement et doués, pour certains, de capacités de raisonnement, avec des performances qui seraient supérieures à celles des derniers modèles en date d’OpenAI. Pour appuyer ses dires, elle partage un article de présentation technique (PDF), et publie DeepSeek-V3, son grand modèle de langage (LLM) sur GitHub, dont nous analyserons plus en détail le fonctionnement et les promesses dans un article dédié.
Des modèles open source, il y en a déjà beaucoup, chez les grands noms états-uniens de l’IA comme chez des acteurs plus modestes. Mais DeepSeek attire rapidement l’attention, d’abord, parce que la startup évoque des tarifs défiant toute concurrence : DeepSeek-R1, son modèle capable de raisonnement, est accessible à partir de 0,14 dollar par million de tokens en entrée, et 2,19 dollars par million de tokens en sortie.