China’s DeepSeek Is America’s AI Sputnik Moment 

La profondeur de la Chine est le moment de Spoutnik AI de l'Amérique

Il y a un dicton commun dans les cercles technologiques: les États-Unis sont bons en innovation, passant de zéro à un, tandis que la Chine est bonne dans les applications commerciales, c'est-à-dire passer de un à 100. Pendant un certain temps, il semblait que la même chose tiendrait vrai Pour l'intelligence artificielle (IA), où les modèles de frontière et la recherche les plus pointus ont été créés par des startups américaines comme Openai, qui auraient deux à trois ans d'avance sur leurs homologues chinois. Pourtant, la sortie rapide de deux nouveaux modèles de la société chinoise Deepseek – le V3 en décembre et R1 ce mois-ci – bouleverse cette hypothèse profondément enracinée, provoquant une déroute historique dans les actions technologiques américaines.

Le modèle de raisonnement R1 de Deepseek correspond (et bat parfois) O1 de l'O1 de la gamme de mathématiques, de code et de raisonnement – et à 2% du prix de ce dernier. Un modèle d'IA chinois est désormais aussi bon que les principaux modèles d'IA américains, en utilisant seulement une infime fraction des ressources GPU disponibles.

C'est remarquable et un Gamechanger pour la course mondiale sur les armements de l'IA. Premièrement, cela signifie que le jeu n'est plus réservé aux joueurs à poche profonds avec des stocks de chips (comme les États-Unis et la Chine). C'était également un avantage américain clé, autrefois considéré comme un fossé critique dans le maintien de l'écart de capacité entre les modèles américains et chinois. Deepseek a montré que les innovations algorithmiques peuvent surmonter les lois de mise à l'échelle. Face à des puces limitées en raison des contrôles d'exportation américains, la société chinoise a utilisé des techniques d'optimisation logicielle innovantes, allant des architectures de mélange clairsemées à la quantification, ce qui leur a permis d'atteindre une rentabilité sans précédent tout en surpassant les modèles concurrents.

Comme le fondateur de Deepseek, Liang Wenfeng, qui est chercheur en IA en formation, a déclaré dans un entretien L'année dernière, «Face aux technologies perturbatrices, les douves créées par la source fermée sont temporaires. Même l'approche à source fermée d'Openai ne peut pas empêcher les autres de rattraper leur retard. »

La capacité de Deepseek à rattraper les modèles frontières en quelques mois montre qu'aucun laboratoire, fermé ou open source, ne peut maintenir un véritable avantage technologique durable. Nous sommes entrés dans une ère de compétition d'IA où le rythme de l'innovation devient probablement beaucoup plus frénétique que nous ne le pensons tous, et où plus de petits joueurs et puissances intermédiaires entrera dans la mêlée, en utilisant les stratégies de formation commun par Deepseek.

Deuxièmement, la Chine devient le leader mondial de l'IA open source. Deepseek n'est qu'une des nombreuses sociétés d'IA chinoises qui sont toutes entièrement ouvertes de leurs modèles – permettant aux développeurs du monde entier d'utiliser, de reproduire et de modifier les poids et les méthodes de leur modèle. Le grand géant de la technologie chinois, Alibaba, a fait de Qwen, son modèle phare de la Fondation AI, Open Source. Il y a donc de nouvelles startups AI comme Minimax, qui a également lancé en janvier une série de modèles open source (à la fois fondamentaux et multimodaux, c'est-à-dire capables de gérer plusieurs types de supports).

Des tests de référence compétitifs ont montré que les performances de ces modèles open source chinoises sont à égalité avec les meilleurs modèles occidentaux à source fermée. Sur l'étreinte Face, une plate-forme américaine qui héberge un référentiel d'outils et de données open source, les LLM chinois sont régulièrement parmi les plus téléchargés. Non seulement cela amène plus de développeurs mondiaux dans leur écosystème, mais cela induit également plus d'innovation.

Considérez un LLM comme un système d'exploitation – comme iOS d'Apple et Android de Google – où les utilisateurs peuvent développer de nouvelles applications en plus. Garder les meilleurs modèles des États-Unis fermera la source fermée que la Chine est mieux prête à étendre son influence technologique dans les pays en lice pour l'accès aux offres de pointe à faible coût. Ces sociétés d'IA chinois sont également ironiquement démocratisant l'accès à l'IA et maintiennent la mission originale d'Openai en vie: faire avancer l'IA au profit de l'humanité. Les pays en dehors des superpuissances d'IA ou des centres technologiques bien établis ont désormais une chance de déverrouiller une vague d'innovation en utilisant des méthodes de formation abordables.

Trois, les contrôles d'exportation américains n'ont plus de maintenance sur les progrès de l'IA. Des entreprises chinoises comme Deepseek ont ​​démontré la capacité d'effectuer des progrès importants en IA en formant leurs modèles sur les NVIDIA H800 conformes aux exportations – une version dégradée des puces d'IA plus avancées utilisées par la plupart des entreprises américaines – et en tirant parti des techniques logicielles sophistiquées. Une grande partie des tactiques de «point d'impression» des États-Unis se sont jusqu'à présent concentrées sur le matériel, mais le paysage rapide des innovations algorithmiques signifie que Washington peut avoir besoin d'explorer d'autres voies de contrôle technologique. Comme beaucoup l'ont souligné, la nécessité est vraiment la mère de l'invention. Incapable de compter sur les dernières puces, Deepseek et d'autres ont été obligés de faire plus avec moins et avec l'ingéniosité au lieu de la force brute.

Il n'y a pas de sous-estimation de cette étape. Alors que beaucoup avaient déjà compté la Chine sur la course de l'IA en raison du barrage des contrôles d'exportation américains paralysants, Deepseek montre que la Chine est de retour et pourrait être en tête. Si les efforts occidentaux pour entraver ou handicaper les progrès de l'IA de la Chine sont susceptibles d'être vains, alors la vraie race ne fait que commencer: l'ingénierie maigre et créative sera ce qui gagne le jeu; Pas des contrôles financiers et des exportations financières.

A lire également