China’s AI Shock? What DeepSeek Disrupts (and Doesn’t)

Le choc de l'IA de la Chine? Ce que Deepseek perturbe (et ne le fait pas)

En décembre 2024, la société d'IA basée à Hangzhou Deepseek a publié son modèle V3, déclenchant une tempête de débat. Le résultat a été surnommé «Shock de l'IA de la Chine».

Les performances comparables de Deepseek-V3 à ses homologues américains telles que GPT-4 et Claude 3 à des coûts inférieurs jettent un doute sur la domination américaine sur les capacités de l'IA, sous-enduites par la politique de contrôle des exportations actuelle des États-Unis ciblant les puces avancées. Il a également remis en question le paradigme de l'industrie enracinée, qui priorise les investissements matériels lourds dans la puissance informatique. Pour faire écho aux remarques du président américain Donald Trump, l'émergence de Deepseek représente non seulement « Un réveil » pour l'industrie technologique mais aussi un moment critique pour les États-Unis et ses alliés pour réévaluer leurs stratégies de politique technologique.

Qu'est-ce que Deepseek semble avoir perturbé? La rentabilité revendiquée par Deepseek pour son modèle V3 est frappant: son coût de formation total n'est que de 5,576 millions de dollars, soit 5,5% du coût du GPT-4, qui s'élève à 100 millions de dollars. La formation a été terminée Utilisation de 2 048 GPU Nvidiaréaliser l'efficacité des ressources huit fois supérieure aux entreprises américaines, qui nécessitent 16 000 GPU. Cela a été accompli en utilisant les GPU H800 moins avancés au lieu du H100 supérieur, mais Deepseek a livré des performances comparables.

Le modèle à faible coût de Deepseek remet donc en question la sagesse conventionnelle selon laquelle la sophistication des grands modèles équivaut à une accumulation massive de puissance de calcul. Ce développement rompt potentiellement la dépendance des puces d'IA américaines au milieu des embargos semi-conducteurs, soulevant ainsi des questions sur les politiques traditionnelles centrées sur le contrôle de la puissance de calcul haut de gamme.

Coûts peu clairs

Cependant, plusieurs aspects de discussion entourant le modèle Deepseek-V3 nécessitent une clarification supplémentaire. Le modèle V3 est à égalité avec GPT-4, tandis que le modèle R1, publié plus tard en janvier 2025, correspond au modèle avancé O1 d'Openai. Le coût signalé de 5,576 millions de dollars concerne spécifiquement la profondeur-V3, et non le modèle R1. Ce chiffre n'inclut pas les coûts de formation totaux, car il exclut les dépenses liées au développement d'architecture, aux données et aux recherches antérieures.

Le modèle V3 a été formé à l'aide d'ensembles de données générés par une version interne du modèle R1 avant sa version officielle. Cette approche visait à tirer parti de la haute précision des données de raisonnement générées par R1combinant avec la clarté et la concision des données régulièrement formatées. Mais la documentation de ces coûts associés n'est pas divulguée, en particulier en ce qui concerne la façon dont les dépenses de développement des données et de l'architecture de R1 sont intégrées aux coûts globaux de la V3.

Innovation incrémentielle, pas perturbation

Du point de vue de la concurrence technologique, les progrès de Deepseek dans les technologies de base de LLM comme l'attention latente multi-tête (MLA) et le mélange d'Experts (MOE) démontrent des améliorations d'efficacité. Mais ces progrès ne devraient pas causer une préoccupation excessive chez les décideurs, car ces technologies ne sont pas des secrets étroitement gardés.

Cela dit, il y a une véritable innovation derrière l'excitation actuelle entourant les réalisations de Deepseek. La technologie MLA améliore les mécanismes d'attention traditionnels en utilisant une compression de bas rang des matrices de clés et de valeur. Cela réduit considérablement la taille du cache de valeur clé (KV), résultant en une diminution de 6,3 fois de l'utilisation de la mémoire par rapport aux structures d'attention multi-tête standard (MHA)réduisant ainsi les coûts de formation et d'inférence. Deepseek semble également être la première entreprise à déployer avec succès un modèle MOE clairsemé à grande échelle, présentant leur capacité à stimuler l'efficacité du modèle et à réduire les coûts de communication grâce à des techniques d'équilibrage expertes.

Bien que ces développements soient inhabituels, ils peuvent simplement représenter des améliorations itératives dans le domaine de l'IA plutôt qu'un saut perturbateur qui pourrait déplacer l'équilibre global de la puissance technologique.

En effet, ni le modèle Deepseek-V3 ni le modèle R1 ne représente le summum de la technologie de pointe. Leur avantage découle de la livraison des performances comparables à leurs homologues américains mais à des coûts nettement inférieurs. À cet égard, il est naturel de remettre en question l'efficacité de l'approche de développement apparemment extravagante adoptée par l'industrie technologique américaine pour assimiler le pouvoir informatique pur à la sophistication des modèles d'IA.

Pourtant, ce type d'innovation rentable n'est souvent pas l'objet de ceux de la prévention technologique, équipés de ressources avancées abondantes. L'itération initiale de toute innovation entraîne généralement des dépenses élevées. Cependant, à mesure que les innovations de réduction des coûts émergent, elles entraînent des dépenses, permettant aux retardataires, en particulier dans des régions comme la Chine, d'adopter rapidement ces progrès et de rattraper les dirigeants à un coût réduit.

Limites des sanctions des puces américaines

L'approche de Deepseek, présentant l'avantage de latecomer grâce à une réduction des coûts de formation, a déclenché un débat sur le besoin réel d'une puissance de calcul étendue dans les modèles d'IA. Les critiques se demandent si la Chine doit vraiment dépendre des puces avancées américainescontestant la politique haut de gamme centrée sur l'informatique qui guide le schéma actuel de contrôle des exportations de semi-conducteurs de Washington. Si la parité des performances peut être réalisée avec des puces de niveau inférieur, la prime pour les puces de niveau supérieur pourrait être injustifiée.

Cela pourrait cependant être un malentendu, car les puces de niveau supérieur offrent généralement une plus grande efficacité. En termes économiques, ce ne serait pas pratique Pour toutes les sociétés chinoises comme Deepseek pour éviter d'utiliser des puces plus avancées si elles étaient accessibles.

En outre, la réduction des coûts de formation réduit potentiellement les frais d'utilisation indique une diminution des obstacles financiers à l'adoption des services d'IA. L'industrie mondiale de l'IA est susceptible de voir une augmentation, plutôt qu'une diminution, de la demande de pouvoir informatique, car la concurrence entre les services s'intensifie. Pour que la Chine puisse suivre la course de l'IA, il faudra un approvisionnement continu de puces haut de gamme plus sophistiquées.

À ces égards, la loi d'échelle est toujours vraie. Deepseek vient de démontrer que des résultats comparables peuvent être obtenus avec moins d'investissement en capital – en termes mathématiques au moins. Sur le plan matériel, cela se traduit par des performances plus efficaces avec moins de ressources, ce qui est bénéfique pour l'industrie globale de l'IA. Et si la perturbation de la rentabilité de Deepseek s'avère réalisable, il n'y a aucune raison pour que les entreprises d'IA américaines ne puissent pas s'adapter et suivre le rythme.

Exporter la course aux prix de l'IA de la Chine

Que cela devrait donc vraiment se préoccuper des États-Unis et de ses alliés? La question clé est: que se passe-t-il si les services d'IA chinois peuvent fournir des performances comparables à leurs homologues américains à des prix inférieurs? Deepseek illustre un scénario de développement que les décideurs doivent surveiller de près – la Chine lance une guerre mondiale des prix dans les services d'IA, une bataille qui a déjà été en cours au niveau national.

Les coûts de formation réels des modèles Deepseek-V3 et R1 restent flous. Et le public sait très peu s'ils réalisent une telle efficacité en utilisant uniquement des GPU H800 de niveau inférieur. Le caractère pratique de ces affirmations n'a pas encore été déterminé. Mais il est crucial ici de ne pas confondre le coût avec le prix. Les dépenses exactes de Deepseek sont incertaines, et ce n'est pas clair Si l'entreprise a utilisé des modèles américains pour former les siens de manière à violer les conditions de service. Une chose que nous savons avec certitude est que Deepseek offre ses services d'IA à des prix exceptionnellement bas.

Par exemple, Deepseek-R1 charge juste 0,14 $ par million de jetons d'entrée (lors de l'utilisation de données en cache) et 2,19 $ par million de jetons de sortie. En revanche, le modèle O1 d'Openai coûte 1,25 $ par million de jetons d'entrée en cache et 10,00 $ par million de jetons de production. Cela signifie que Deepseek-R1 est presque neuf fois moins cher pour les jetons d'entrée et environ quatre fois et demi moins cher pour les jetons de sortie par rapport à l'O1 d'OpenAI.

Les prix compétitifs de Deepseek, en un sens, peuvent être considérés comme une projection internationale de la guerre des prix du service d'IA intérieure de la Chine en 2024. Par exemple, Alibaba a réduit le prix de son QWEN-long de 97% jen mai l'année dernière et a encore diminué le coût de son modèle de langage visuel, Qwen-vlde 85% en décembre. Cependant, contrairement à Deepseek, de nombreuses sociétés d'IA chinois ont baissé leurs prix parce que leurs modèles manquent de compétitivité, ce qui rend difficile le rival des homologues américains. Même avec ces baisses de prix, attirer des clients de haute qualité reste un défi. En revanche, Deepseek offre des performances comparables aux produits concurrents, ce qui rend ses prix vraiment attrayants.

Pour les alliés démocratiques, la montée des services d'IA chinois qui est à la fois abordables et très efficaces soulève deux principales préoccupations stratégiques, en particulier à la lumière des récentes initiatives de l'IA souverain. Premièrement, il existe des risques de sécurité nationale, en particulier liés à la confidentialité des données et à manipulation potentielle des résultats. Deuxièmement, les prix agressifs de la Chine dans les services d'IA constituent une menace pour le développement des industries de l'IA dans d'autres pays, ressemblant aux pratiques de décharge précédemment vues avec panneaux solaires et véhicules électriques en Europe et en Amérique.

Si ce scénario se déroule, il faut reconnaître que l'avantage des prix de l'IA de la Chine est peu probable uniquement par des coûts de formation réduits, que d'autres entreprises pourraient bientôt adopter. L'attention devrait également être accordée aux mécanismes non commerciaux, tels que les subventions gouvernementales, qui pourraient fournir à la Chine un avantage concurrentiel à l'avenir.

A lire également