Lar >  Notícias >  Modelos de baixo custo da AI Deepseek suspeitados para usar dados OpenAi, Sparks Irony Online

Modelos de baixo custo da AI Deepseek suspeitados para usar dados OpenAi, Sparks Irony Online

Authore: AlexanderAtualizar:Mar 26,2025

O surgimento da AI Deepseek, um modelo de desenvolvimento chinês, provocou controvérsias e preocupações significativas no setor de tecnologia dos EUA. O modelo R1 da Deepseek, apresentado como uma alternativa econômica às ofertas ocidentais de IA como o ChatGPT, levou a uma queda dramática de US $ 600 bilhões no valor de mercado da NVIDIA, com as ações da empresa em 16,86%-marcando a maior perda na história de Wall Street. Outros gigantes da tecnologia, como Microsoft, Meta plataformas e empresa controladora do Google, também sofreram declínios que variavam de 2,1% a 4,2%, enquanto a Dell Technologies, fabricante do servidor de IA, viram uma queda de 8,7%.

A alegação da Deepseek de que seu modelo, construído no Deepseek-V3 de código aberto, requer significativamente menos poder de computação e foi treinado por apenas US $ 6 milhões, levantou as sobrancelhas e levou a especulações sobre suas fontes de dados. O Openai e a Microsoft estão agora investigando se o DeepSeek usou a API do OpenAI para incorporar os modelos de IA da OpenAI, uma prática conhecida como destilação. Essa técnica envolve o treinamento de modelos menores, extraindo dados de outros maiores e mais avançados, o que viola os termos de serviço da OpenAI.

A Openai expressou preocupações sobre a proteção de sua propriedade intelectual, afirmando que se envolve em contramedidas para proteger seus modelos e trabalha em estreita colaboração com o governo dos EUA para impedir o uso não autorizado por concorrentes e adversários. O czar da AI do presidente Donald Trump, David Sacks, destacou a questão, sugerindo que as empresas de IA lideradas tomarão medidas para evitar essas práticas de destilação nos próximos meses.

A ironia da situação de Openai não passou despercebida, dada sua própria história de usar material protegido por direitos autorais para treinar o chatgpt. Em janeiro de 2024, o OpenAI reconheceu a necessidade de usar materiais protegidos por direitos autorais para treinar grandes modelos de idiomas, argumentando que excluir esses dados dificultaria o desenvolvimento de sistemas de IA que atendem às necessidades modernas. Essa postura alimentou debates em andamento sobre a ética e a legalidade do uso de materiais protegidos por direitos autorais no treinamento de IA, com ações de alto nível do New York Times e um grupo de 17 autores, incluindo George RR Martin, desafiando a prática.

À medida que a indústria enfrenta essas questões, a ascensão da Deepseek serve como um alerta para o setor de tecnologia dos EUA, provocando uma reavaliação das práticas de desenvolvimento de IA e estratégias de proteção de propriedade intelectual.

A Deepseek é acusada de usar o modelo do OpenAI para treinar seu concorrente usando a destilação. Crédito da imagem: Andrey Rudakov/Bloomberg via Getty Images.