그동안 AI 챗봇용 대형언어모델(LLM) 개발은 빅테크들이 주도해 왔고, 대량의 첨단 칩이활용되면서 비용도 천문학적으로 들어갔다.
하지만딥시크는 이번 개발에 불과 80억원 정도만 썼다.
적은 컴퓨팅 파워로 효율적으로 학습할 수 있는 실험적 기법을 적용한 덕이라고 한다.
미국의 중국에 대한 첨단 칩 수출.
질문 따라 맞춤 데이터활용 딥시크는 자신의 학습 데이터를 여러 전문 영역으로 구분해 나눠 두고, 질문이 들어오면 해당 특정 영역만 활성화해 답한다.
이른바 ‘전문가 혼합(MoE·Mixture of Experts)’ 모델이다.
예컨대 회사에서 특정 과제가 주어졌을 때 모든 직원을 일에 투입하는 대신 해당 분야에.
구축에활용했다는 의혹을 받고 있다.
개인정보 규제가 점점 까다로워지는 미국·유럽·한국 등에선 상상하기 어려운 일이다.
딥시크뿐 아니라 다른 기업들도 고성능 AI 모델을 선보이고 있다.
중국 IT대기업 알리바바는 지난 29일 새로운 AI 모델 ‘Qwen(큐원) 2.
5 맥스’를 출시하며 “오픈AI의 GPT-4o(포오).
딥시크가 저비용으로 AI를 개발하는 데활용한 ‘오픈소스’도 미 정부의 새로운 제재 대상이 될 수 있다는 관측이 나온다.
오픈소스는 소프트웨어 개발에 필요한 소스 코드를 전 세계 누구나 가져다가 사용할 수 있도록 무료로 공개하는 것이다.
딥시크는 전 세계 개발자들이 미리 짜놓은 프로그램 코드를.
벤치마크 성능은 우수해도 실제 대중 서비스할 땐활용성 면에서 문제가 생기는 경우도 있어서다.
딥시크의 강점인 ‘가성비’ 역시 부풀려졌을 수 있다.
국내 IT 업계 한 관계자는 “딥시크가 공개한 ‘저비용’은 1회 학습 비용으로 운영 비용 등 누적 투자 비용까지 고려한다면 아주 저렴하다고 볼.
딥시크AI 모델을 개발한 인력은 해외 유학 없이 중국 안에서 훈련받은 국내파 엔지니어들이라고 한다.
중국이 배출하는 AI 전문 인력은 전 세계의 47%를 차지해 미국(18%)을 압도하고 있다.
중국은 양과 질 모두 세계 최고급인 인재 풀을활용해 미국의 AI 주도권을 넘볼 수준까지 올라왔다.
딥시크는 엔비디아의 최신 고성능 칩(H100)이 아니라 저성능 반도체를활용한 ‘가성비’ AI 모델이다.
미국 주도의 고비용 AI 만리장성 전략 구축이 여의치 않을 수 있음을 보여준다.
연초부터 전개되는 세계 주요 국가의 각축전이 예사롭지 않다.
미국의 질주와 이에 편승해 반도체 권토중래를 노리는 일본.
딥시크는 2023년까지 수입이 허용된 H100의 저사양 모델 H800만을활용했다.
하드웨어의 한계를 소프트웨어 기술로 극복했다는 게 회사 측 설명이다.
미국의 수출 규제가 신기술 개발을 촉진한 중국식 궁즉통(窮則通)의 사례다.
AI 가속기 시장의 독점 사업자인 엔비디아는 코너에 몰렸다.
이를활용한 금융 상품 개발 가능성이 함께 논의될 것으로 보인다.
암호화폐 시장에서도 텍사스의 정책 변화를 주목하고 있으며, 연방 정부 차원의 비트코인 준비금 논의에도 영향을 미칠 가능성이 높다.
명절 연휴를 마치고 오는 31일 개장하는 국내 증시는 중국 인공지능(AI) 스타트업딥시크(DeepSeek).
이를 증명이나 하듯 1월28일 저렴한 개발 비용으로 미국의 ‘챗GPT’ 성능에 준하는 ‘딥시크(DeepSeek)’를 개발했다고 발표했다.
이것 또한 우리가 미국과의 협상에서활용할 수 있는 가장 큰 카드이기도 하다.
무엇보다도 트럼프 행정부의 최대 과업인 ‘대중국 억제 정책’에서.