비밀번호를 입력해주세요.

로그인을 하시면
다양한 서비스를
제공받으실 수 있습니다.

“GPT 넘었다” 딥시크 선언…AI 판 뒤흔든 신기술 공개

  • 허훈 기자
  • 입력 2026.05.02 05:37
  • 댓글 0
  • 글자크기설정

1000041114.jpg
생성 이미지

[인터내셔널포커스]중국 인공지능 기업 DeepSeek이 멀티모달 추론 기술을 공개하며 차세대 AI 경쟁에서 기술 우위를 주장했다.


딥시크는 1일 깃허브를 통해 ‘Thinking with Visual Primitives(시각 원어로 사고하기)’라는 제목의 기술 보고서와 함께 멀티모달 추론 모델을 발표했다. 회사 측은 일부 성능 지표에서 GPT-5.4 등 주요 모델을 앞섰다고 설명했다.


보고서는 기존 멀티모달 대형 모델의 구조적 한계로 ‘지시 격차(Reference Gap)’를 지목했다. 이는 모델이 이미지를 인식하는 데는 성공하지만, 자연어 추론 과정에서 특정 대상을 정확히 지칭하지 못하는 문제를 의미한다. 예를 들어 “중앙 근처의 큰 빨간 물체”와 같은 표현은 복잡한 장면에서 대상 식별이 모호해져 주의 분산과 오판으로 이어질 수 있다는 분석이다. 연구진은 “보는 것과 무엇을 보고 있는지 명확히 설명하는 것은 다른 문제”라고 밝혔다.


이번 모델은 시각 객체의 좌표와 경계 정보를 추론 과정에 직접 포함시키는 방식을 채택했다. 모델은 특정 객체를 언급할 때마다 해당 위치 좌표를 동시에 출력하며, 좌표를 추론의 기준점으로 활용한다. 이는 좌표를 사후적으로 붙이는 기존 방식과 달리, 추론 단계에서 모호성을 줄이기 위한 구조다.


아키텍처 측면에서도 효율성을 크게 높였다. 756×756 이미지 기준으로 생성된 2916개 시각 토큰을 324개로 압축한 뒤, 추가적인 희소 어텐션 기법을 통해 최종적으로 81개 수준까지 줄였다. 이는 동일 조건에서 수백~천 개 이상의 토큰을 사용하는 기존 모델 대비 연산 효율을 크게 개선한 수치로 제시됐다.


학습 과정에서는 약 10만 개의 객체 탐지 데이터셋 중 3만여 개를 선별해 4000만 건 이상의 학습 샘플을 구축했다. 객체 개수 인식, 공간 추론, 미로 탐색, 경로 추적 등 다양한 시각 추론 과제를 포함했으며, 경계 박스와 좌표를 각각 학습한 뒤 강화학습과 온라인 증류 과정을 통해 단일 모델로 통합했다.


성능 평가에서는 주요 벤치마크에서 비교 결과를 제시했다. 객체 개수 인식 정확도는 89.2%로 보고됐으며, 미로 탐색과 경로 추적 등 공간 추론 과제에서도 기존 모델 대비 높은 점수를 기록했다는 설명이다. 특히 복잡한 구조를 이해하는 토폴로지 기반 추론 영역에서 성능 차이가 나타났다고 밝혔다.


다만 연구진은 현재 모델의 한계도 함께 언급했다. 특정 트리거 문구가 있어야 시각 원어 기반 추론이 활성화되며, 미세한 장면에서는 좌표 정밀도가 제한적일 수 있다. 또한 다양한 환경 간 일반화 성능 역시 추가 개선이 필요하다고 밝혔다.


이번 발표는 멀티모달 AI가 단순 인식 단계를 넘어, 시각 정보와 언어 추론을 결합하는 방향으로 발전하고 있음을 보여주는 사례로 평가된다.

ⓒ 인터내셔널포커스 & dspdaily.com 무단전재-재배포금지

BEST 뉴스

추천뉴스

  • “좋든 싫든 중국은 인정해야”… 트럼프, 중국 제조업 성과 파격 재평가
  • 중국은 통과, 미국은 차단… 호르무즈의 새로운 룰
  • “이미 벌어진 격차… QS 순위서 더 또렷해진 한·중 대학 경쟁”
  • 해외 화교 중국 귀환, 쉬워졌나…비자·정착 절차 총정리
  • 다문화 사회 20년… 지방의회엔 왜 이주여성이 없나
  • 트럼프 연일 한국 지목… 호르무즈 앞 진퇴양난
  • 트럼프 압박에도 유럽 집단 거부… “호르무즈, 미국이 시작한 전쟁”
  • 이란 “우크라이나 전역, 합법적 타격 대상”… 전선 밖으로 번지는 중동 전쟁 그림자
  • 이란 “호르무즈는 열려 있다… 美·동맹국 선박만 차단”
  • 주한 중국대사 “CHINA OUT, 한국 이익에 맞는지 생각해봐야”

포토뉴스

more +

해당 기사 메일 보내기

“GPT 넘었다” 딥시크 선언…AI 판 뒤흔든 신기술 공개

보내는 분 이메일

받는 분 이메일