[인터내셔널포커스]중국 인공지능 기업 DeepSeek이 멀티모달 추론 기술을 공개하며 차세대 AI 경쟁에서 기술 우위를 주장했다.
딥시크는 1일 깃허브를 통해 ‘Thinking with Visual Primitives(시각 원어로 사고하기)’라는 제목의 기술 보고서와 함께 멀티모달 추론 모델을 발표했다. 회사 측은 일부 성능 지표에서 GPT-5.4 등 주요 모델을 앞섰다고 설명했다.
보고서는 기존 멀티모달 대형 모델의 구조적 한계로 ‘지시 격차(Reference Gap)’를 지목했다. 이는 모델이 이미지를 인식하는 데는 성공하지만, 자연어 추론 과정에서 특정 대상을 정확히 지칭하지 못하는 문제를 의미한다. 예를 들어 “중앙 근처의 큰 빨간 물체”와 같은 표현은 복잡한 장면에서 대상 식별이 모호해져 주의 분산과 오판으로 이어질 수 있다는 분석이다. 연구진은 “보는 것과 무엇을 보고 있는지 명확히 설명하는 것은 다른 문제”라고 밝혔다.
이번 모델은 시각 객체의 좌표와 경계 정보를 추론 과정에 직접 포함시키는 방식을 채택했다. 모델은 특정 객체를 언급할 때마다 해당 위치 좌표를 동시에 출력하며, 좌표를 추론의 기준점으로 활용한다. 이는 좌표를 사후적으로 붙이는 기존 방식과 달리, 추론 단계에서 모호성을 줄이기 위한 구조다.
아키텍처 측면에서도 효율성을 크게 높였다. 756×756 이미지 기준으로 생성된 2916개 시각 토큰을 324개로 압축한 뒤, 추가적인 희소 어텐션 기법을 통해 최종적으로 81개 수준까지 줄였다. 이는 동일 조건에서 수백~천 개 이상의 토큰을 사용하는 기존 모델 대비 연산 효율을 크게 개선한 수치로 제시됐다.
학습 과정에서는 약 10만 개의 객체 탐지 데이터셋 중 3만여 개를 선별해 4000만 건 이상의 학습 샘플을 구축했다. 객체 개수 인식, 공간 추론, 미로 탐색, 경로 추적 등 다양한 시각 추론 과제를 포함했으며, 경계 박스와 좌표를 각각 학습한 뒤 강화학습과 온라인 증류 과정을 통해 단일 모델로 통합했다.
성능 평가에서는 주요 벤치마크에서 비교 결과를 제시했다. 객체 개수 인식 정확도는 89.2%로 보고됐으며, 미로 탐색과 경로 추적 등 공간 추론 과제에서도 기존 모델 대비 높은 점수를 기록했다는 설명이다. 특히 복잡한 구조를 이해하는 토폴로지 기반 추론 영역에서 성능 차이가 나타났다고 밝혔다.
다만 연구진은 현재 모델의 한계도 함께 언급했다. 특정 트리거 문구가 있어야 시각 원어 기반 추론이 활성화되며, 미세한 장면에서는 좌표 정밀도가 제한적일 수 있다. 또한 다양한 환경 간 일반화 성능 역시 추가 개선이 필요하다고 밝혔다.
이번 발표는 멀티모달 AI가 단순 인식 단계를 넘어, 시각 정보와 언어 추론을 결합하는 방향으로 발전하고 있음을 보여주는 사례로 평가된다.
BEST 뉴스
-
中 광물 자원 현황 공개…희토류 등 14종 매장량·17종 생산량 세계 1위
생성 이미지 [인터내셔널포커스]중국이 자국 광물 자원 현황을 공개했다. 희토류 등 주요 전략 광물에서 매장량과 생산량 모두 세계 1위를 기록한 것으로 나타났다. 중국 자연자원부는 4월 29일 공식 발표를 통해 최신 광물 자원 통계를 공개했다. 발표에 따르면 희... -
트럼프 “중국 방문 매우 흥미로운 일정 될 것”…5월 방중 계획 유지
▲도널드 트럼프 미국 대통령이 2026년 5월 2일 미국 플로리다주 웨스트팜비치 국제공항에서 마이애미행 전용기 에어포스원에 탑승하기 전 언론에 발언하고 있다. (로이터/라이센스계약) [인터내셔널포커스] 도널드 트럼프 미국 대통령이 5월 중국 방문 계획을 유지하겠다는 ... -
英 법원 “삼성, ZTE에 3.92억달러 지급해야”…특허 분쟁 1심 결론
생성 이미지 [인터내셔널포커스]영국 고등법원이 글로벌 통신 특허 분쟁과 관련해 삼성전자에 중흥통신(ZTE) 측에 약 3억9200만 달러의 라이선스 비용을 지급하라고 1심 판결했다. 영국 법원 판단에 따르면 이번 금액은 양측이 제시한 요구 수준의 중간값이다. 중흥... -
중국, ‘억 톤급 유전 13곳·대형 가스전 26곳’ 신규 발견…에너지 자립 기반 강화
생성 이미지 [인터내셔널포커스]중국이 대규모 유전·가스전을 잇따라 발견하며 에너지 자원 확보 능력을 한층 끌어올리고 있다. 육상은 물론 심해·초심도까지 탐사 범위를 확장하면서 자원 자립 기반 강화에 속도가 붙는 모습이다. 중국 자연자원부는 4월 29일 발표를 통해 “신규 광물 ... -
中 전략비축유 13.97억 배럴…공급망·비축 ‘이중 구조’로 리스크 관리
생성 이미지 [인터내셔널포커스] 중국의 전략 석유 비축 규모가 주요 국가 가운데 최대 수준으로 집계됐다. 공급망 다변화와 비축 확대를 병행하는 구조가 에너지 안보 대응 방식으로 주목된다. 미국 에너지정보청(EIA)에 따르면 2025년 12월 기준 중국의 전략 비축... -
“中, 韓 배터리 ‘기술 우위론’ 반박…시장 점유율 경쟁 부각”
[인터내셔널포커스]중국 배터리 업계와 현지 매체들이 한국 일부 언론의 ‘초고니켈 배터리 기술 우위론’에 반박하며 글로벌 시장 점유율과 생산능력 경쟁을 강조하고 나섰다. 기술 경쟁을 넘어 공급망과 양산 체계, 가격 경쟁력이 글로벌 배터리 시장 판도를 좌우하고 있다는 주장이다. 최근 중국 산업·기술 분야 매...
NEWS TOP 5
실시간뉴스
-
中 충칭 음독 노인 사건 파장…“응급 대응 지연 여부 조사”
-
파독 광부·간호사 28명, 반세기 만의 고국 방문 나선다
-
트럼프, 13~15일 중국 국빈방문…미중 정상회담서 무역·AI·이란 문제 논의 전망
-
“음료·음식 기억이 수사 열쇠”…홍콩 재벌 손녀 납치 사건 전말 공개
-
“관광비자로 몰래 촬영”…태국서 중국 숏폼 제작진 8명 체포
-
“중장비 없는 붉은광장…러시아 전승절 열병식 이례적 축소”
-
“인도네시아, 바탐섬 국제 사기조직 소탕…외국인 수백명 무더기 검거
-
“푸틴 전승절 열병식 D-1…러시아, 각국에 키이우 철수 촉구”
-
중국산 휴머노이드 로봇, 美 국내선 좌석 구매해 탑승…배터리 규정 초과로 1시간 지연
-
“사슴 만졌다가 진드기 감염”…스페인 발레리나, 1년째 거동 불가





