Maison >  Nouvelles >  Modèles à faible coût de Deepseek AI soupçonnés d'utiliser les données Openai, étincelle l'ironie en ligne

Modèles à faible coût de Deepseek AI soupçonnés d'utiliser les données Openai, étincelle l'ironie en ligne

Authore: AlexanderMise à jour:Mar 26,2025

L'émergence de Deepseek IA, un modèle développé par le chinois, a suscité une controverse et une préoccupation importantes au sein de l'industrie de la technologie américaine. Le modèle R1 de Deepseek, présenté comme une alternative rentable aux offres de l'IA occidentale comme Chatgpt, a conduit à une baisse spectaculaire de 600 milliards de dollars de la valeur marchande de Nvidia, les actions de la société chantant de 16,86% - ce qui fait la plus grande perte dans l'histoire de Wall Street. D'autres géants de la technologie tels que Microsoft, Meta Plateformes et la société mère de Google Alphabet ont également connu des baisses allant de 2,1% à 4,2%, tandis que le fabricant de serveurs AI Dell Technologies a connu une baisse de 8,7%.

L'affirmation de Deepseek selon laquelle son modèle, construit sur la source ouverte Deepseek-V3, nécessite beaucoup moins de puissance de calcul et a été formé pour seulement 6 millions de dollars, a haussé les sourcils et a conduit à des spéculations sur ses sources de données. Openai et Microsoft étudient maintenant si Deepseek a utilisé l'API d'Openai pour incorporer les modèles d'IA d'Openai dans SIENS, une pratique connue sous le nom de distillation. Cette technique consiste à former des modèles plus petits en extraitant des données de plus grandes et plus avancées, ce qui viole les conditions d'utilisation d'OpenAI.

OpenAI a exprimé ses inquiétudes quant à la protection de sa propriété intellectuelle, déclarant qu'elle s'engage dans des contre-mesures pour protéger ses modèles et travailler en étroite collaboration avec le gouvernement américain pour empêcher l'utilisation non autorisée par les concurrents et les adversaires. Le tsar de l'IA du président Donald Trump, David Sacks, a souligné le problème, suggérant que les entreprises américaines de l'IA à la tête prendront des mesures pour empêcher de telles pratiques de distillation dans les prochains mois.

L'ironie de la situation d'Openai n'est pas passée inaperçue, étant donné sa propre histoire d'utilisation du matériel protégé par le droit d'auteur pour former le chatppt. En janvier 2024, Openai a reconnu la nécessité d'utiliser du matériel protégé par le droit d'auteur pour former des modèles de langues importants, faisant valoir que l'exclusion de ces données entraverait le développement de systèmes d'IA qui répondent aux besoins modernes. Cette position a alimenté les débats en cours sur l'éthique et la légalité de l'utilisation du matériel protégé par le droit d'auteur dans la formation de l'IA, avec des poursuites de haut niveau du New York Times et d'un groupe de 17 auteurs, dont George RR Martin, ce qui remet en question la pratique.

Alors que l'industrie est aux prises avec ces problèmes, la montée en puissance de Deepseek sert de réveil pour le secteur technologique américain, ce qui a suscité une réévaluation des pratiques de développement de l'IA et des stratégies de protection de la propriété intellectuelle.

Deepseek est accusé d'utiliser le modèle d'Openai pour former son concurrent en utilisant la distillation. Crédit d'image: Andrey Rudakov / Bloomberg via Getty Images.