Các mô hình chi phí thấp của Deepseek AI nghi ngờ sử dụng dữ liệu OpenAI, Sparks trớ trêu trực tuyến

Sự xuất hiện của Deepseek AI, một mô hình do Trung Quốc phát triển, đã gây ra những tranh cãi và mối quan tâm đáng kể trong ngành công nghệ Hoa Kỳ. Mô hình R1 của Deepseek, được quảng cáo là một sự thay thế hiệu quả về chi phí cho các dịch vụ AI của phương Tây như TATGPT, đã dẫn đến mức giảm đáng kể trị giá 600 tỷ đô la của NVIDIA, với cổ phiếu của công ty giảm mạnh 16,86%đánh dấu sự mất mát lớn nhất trong lịch sử Phố Wall. Các gã khổng lồ công nghệ khác như Microsoft, nền tảng Meta và bảng chữ cái mẹ của Google cũng trải qua sự sụt giảm từ 2,1% đến 4,2%, trong khi nhà sản xuất máy chủ AI Dell Technologies giảm 8,7%.

Deepseek tuyên bố rằng mô hình của nó, được xây dựng trên Deepseek-V3 nguồn mở, đòi hỏi sức mạnh tính toán ít hơn đáng kể và được đào tạo chỉ với 6 triệu đô la, đã làm tăng lông mày và dẫn đến suy đoán về các nguồn dữ liệu của nó. Openai và Microsoft hiện đang điều tra xem liệu Deepseek đã sử dụng API của Openai để kết hợp các mô hình AI của Openai vào riêng của mình, một thực tế được gọi là chưng cất. Kỹ thuật này liên quan đến việc đào tạo các mô hình nhỏ hơn bằng cách trích xuất dữ liệu từ các mô hình lớn hơn, tiên tiến hơn, vi phạm các điều khoản dịch vụ của Openai.

Openai đã bày tỏ lo ngại về việc bảo vệ tài sản trí tuệ của mình, nói rằng họ tham gia vào các biện pháp đối phó để bảo vệ các mô hình của mình và làm việc chặt chẽ với chính phủ Hoa Kỳ để ngăn chặn việc sử dụng trái phép bởi các đối thủ cạnh tranh và đối thủ. AI của Tổng thống Donald Trump, David Sacks, nhấn mạnh vấn đề này, cho thấy rằng các công ty AI dẫn đầu chúng tôi sẽ thực hiện các bước để ngăn chặn các hoạt động chưng cất như vậy trong những tháng tới.

Sự trớ trêu của tình huống của Openai đã không được chú ý, do lịch sử sử dụng tài liệu có bản quyền để đào tạo Chats. Vào tháng 1 năm 2024, Openai thừa nhận sự cần thiết của việc sử dụng các tài liệu có bản quyền để đào tạo các mô hình ngôn ngữ lớn, lập luận rằng việc loại trừ dữ liệu đó sẽ cản trở sự phát triển của các hệ thống AI đáp ứng nhu cầu hiện đại. Lập trường này đã thúc đẩy các cuộc tranh luận liên tục về đạo đức và tính hợp pháp của việc sử dụng các tài liệu có bản quyền trong đào tạo AI, với các vụ kiện cao cấp từ New York Times và một nhóm gồm 17 tác giả, bao gồm George RR Martin, thách thức thực tiễn.

Khi ngành công nghiệp vật lộn với những vấn đề này, sự gia tăng của Deepseek đóng vai trò là một lời cảnh tỉnh cho lĩnh vực công nghệ Hoa Kỳ, thúc đẩy việc đánh giá lại các hoạt động phát triển AI và chiến lược bảo vệ sở hữu trí tuệ.

Deepseek bị buộc tội sử dụng mô hình của Openai để đào tạo đối thủ cạnh tranh bằng cách chưng cất. Tín dụng hình ảnh: Andrey Rudakov/Bloomberg qua Getty Images.