>  소식 >  DeepSeek의 AI 혁신: 16억 달러 투자로 이어지는 기술 혁신

DeepSeek의 AI 혁신: 16억 달러 투자로 이어지는 기술 혁신

Authore: Jacob업데이트:Sep 08,2025

하지만 여전히 경쟁사들에 비해 비용 효율적입니다.

딥씨크(DeepSeek)의 최신 챗봇은 이렇게 당당하게 자신을 소개했습니다:

안녕하세요! 저는 여러분의 질문에 놀랄 만한 통찰력으로 답할 수 있도록 만들어진 AI입니다.

딥씨크의 AI는 업계에서 강력한 경쟁자로 떠올랐으며, 엔비디아(NVIDIA)의 주가 하락에도 영향을 미쳤습니다.

딥씨크 테스트이미지 출처: ensigame.com

이 모델의 강점은 독특한 아키텍처와 최신 기술을 접목한 훈련 방법에 있습니다:

멀티 토큰 예측(MTP): 단어를 하나씩 예측하는 대신 문장의 일부분을 분석해 여러 단어를 동시에 예측하여 정확도와 속도를 향상시킵니다.
전문가 혼합(MoE): 여러 신경망을 활용해 데이터를 처리하며, 훈련 효율과 성능을 높입니다. 딥씨크 V3는 256개의 네트워크를 보유하며, 토큰 처리 작업마다 8개를 활성화합니다.
멀티 헤드 잠재 주의(MLA): 문장에서 중요한 요소를 집중적으로 찾아내며, 핵심 세부 사항을 반복적으로 분석해 놓치는 부분을 최소화하고 데이터의 미묘한 차이까지 포착합니다.

중국 스타트업 딥씨크는 강력한 딥씨크 V3 모델을 소규모 예산인 600만 달러로 개발했으며, GPU 2048개만 사용했다고 주장했습니다.

딥씨크 V3이미지 출처: ensigame.com

하지만 SemiAnalysis의 분석에 따르면, 딥씨크는 약 5만 개의 엔비디아 호퍼(Hopper) GPU를 보유하고 있습니다. 이 중에는 1만 개의 H800, 1만 개의 고성능 H100, 그리고 추가적인 H20 유닛이 포함됩니다. 이 인프라는 여러 데이터센터에 분산되어 AI 훈련, 연구, 금융 모델링 등에 활용되고 있습니다.

회사는 서버 투자에서만 약 16억 달러를 지출했으며, 운영 비용은 9억 4400만 달러에 달합니다.

중국 헤지펀드 하이플라이어(High-Flyer)의 자회사인 딥씨크는 2023년 분사되어 AI에 집중하고 있습니다. 대부분의 스타트업과 달리 클라우드 컴퓨팅에 의존하지 않고, 자체 데이터센터를 운영해 모델 최적화와 빠른 혁신을 이끌어내고 있습니다. 이러한 독립적 구조는 유연성과 신속한 의사 결정이 가능하게 합니다.

딥씨크이미지 출처: ensigame.com

또한, 딥씨크는 중국 최고 대학 출신 연구원들을 유치하며, 일부 연구자의 연봉은 130만 달러를 넘습니다.

딥씨크 V3의 훈련 비용이 600만 달러에 불과하다고 주장되지만, 이는 사전 훈련 단계의 GPU 사용 비용만 포함한 것으로, 연구, 정제, 데이터 처리 및 인프라 비용은 제외됩니다.

창립 이후 딥씨크는 AI 개발에만 5억 달러 이상을 투자했습니다. 비교적 단순한 구조 덕분에 대형 경쟁사들보다 빠르고 효과적으로 혁신을 이룰 수 있었습니다.

딥씨크이미지 출처: ensigame.com

딥씨크의 성장은 자금력 있는 독립 AI 기업이 대형 업체들과 경쟁할 수 있음을 보여줍니다. 전문가들은 이 회사의 성공이 막대한 투자, 기술적 발전, 우수한 인재 덕분이라고 지적하지만, "저렴한" AI 모델이라는 주장은 과장된 면이 있다고 평가합니다.

그럼에도 딥씨크의 비용은 경쟁사들보다 확실히 낮습니다. 예를 들어, 딥씨크의 R1 모델은 훈련 비용이 500만 달러였던 반면, ChatGPT4o는 1억 달러가 소요됐습니다.