AI가 언어를 생성하는 시대는 이미 지났다. 다음 전선은 물리 세계다 — 로봇이 물건을 집고, 자율주행차가 도로를 달리고, 게임 환경이 플레이어 행동에 즉각 반응하려면, AI는 문장이 아니라 세계가 어떻게 작동하는지를 이해해야 한다12. 이 간극을 메우는 기술이 월드모델이고, 그 월드모델을 실시간으로 구동하는 추론 인프라를 처음부터 끝까지 수직통합한 회사가 디카트(Decart)다. 거기에 엔비디아·세쿼이아 캐피탈·벤치마크·래디컬 벤처스가 $3억 달러(약 3,900억원)를 넣었다1.
왜 월드모델이었나 — LLM이 말할 때 세계는 멈춰 있었다
월드모델은 언어모델과 근본적으로 다른 문제를 푼다. GPT 계열 LLM은 방대한 텍스트 데이터에서 패턴을 학습해 다음 토큰을 예측한다. 뛰어난 언어 생성 능력이지만, 물리 세계의 작동 원리를 이해하는 것과는 전혀 다른 문제다. 자율주행이 도로 위 물체의 궤적을 밀리초 단위로 예측하고, 로봇이 물체의 무게와 마찰계수를 실시간으로 감지해 그립을 조정하고, 게임 AI가 플레이어의 행동에 즉각 반응하려면, AI는 공간·물리·시간의 구조를 이해하고 환경을 시뮬레이션할 수 있어야 한다2. 언어모델이 아무리 발전해도 이 문제는 해결되지 않는다.
그런데 병목이 있었다. 월드모델을 연구하는 곳은 여럿 있었지만, 그것을 실시간으로 구동할 인프라를 직접 쌓은 곳은 없었다. 기존 추론 시스템은 초당 200토큰 수준에 머물렀다1. 텍스트 생성에는 충분하지만, 물리 환경의 실시간 시뮬레이션에는 치명적으로 느린 속도다. 자율주행 차량이 0.1초 안에 판단하고, 로봇이 실시간으로 환경을 재계산하고, 게임이 프레임 단위로 세계를 업데이트하려면, 추론 속도가 전혀 다른 차원이어야 한다. 고성능 GPU 클러스터를 풀가동해도 지연이 줄지 않으면, 인프라 투자가 제품화로 이어지지 않는다. 연구와 제품 사이의 진짜 간극은 모델이 아니라 인프라에 있었다.
디카트는 이 간극을 정면으로 공략했다. 2023년 설립된 이 회사는 하드웨어 최적화, 모델 설계, 컴파일러, 추론 엔진, 제품화까지 수직통합한 풀스택 시스템을 구축했다1. 각 레이어가 분리된 기존 구조와 달리, 컴파일러가 모델 구조를 알고, 추론 엔진이 하드웨어 특성을 알고, 제품 요구사항이 인프라 설계에 처음부터 반영된다. 이 공동 설계가 추론 플랫폼 DOS 2.0을 가능하게 했다. DOS 2.0은 에이전틱 추론에서 초당 1,600토큰 이상을 처리한다 — 업계 평균 200토큰 대비 8배 빠른 속도다1.
비용 구조도 달라졌다. 동급 하드웨어에서 비용 효율을 100배 이상 끌어올렸다고 회사는 밝혔다1. 속도와 비용을 동시에 해결한 이 구조는, 실시간 월드모델이 연구소 밖으로 나와 실제 제품이 될 수 있다는 것을 처음으로 보여준 사례다. 이것이 2023년 설립 후 3년이 채 되지 않아 누적 조달액 $4억5천만 달러를 넘긴 배경이다1.
전통 추론 인프라 vs 디카트 — 다섯 가지 축
기존 추론 인프라와 디카트의 접근법이 갈리는 다섯 가지 축이다.
| 영역 | 기존 추론 인프라 | 디카트 |
|---|---|---|
| 추론 속도 | 초당 ~200토큰 (업계 평균) | 초당 1,600토큰 이상 (DOS 2.0)1 |
| 비용 효율 | 하드웨어 원가 구조 그대로 | 동급 하드웨어 대비 100배 이상 개선1 |
| 스택 구조 | 모델·컴파일러·인프라 개별 개발 | 하드웨어~제품화 수직통합1 |
| 하드웨어 최적화 | 범용 GPU 클러스터 일반 배포 | 컴파일러·추론 엔진 맞춤 공동 설계1 |
| 클라우드 연계 | 클라우드 범용 배포 환경 | AWS Trainium3 최초 실시간 월드모델 배포1 |
디카트의 해자: 수직통합이 만드는 세 개의 장벽
- 풀스택 수직통합이 만드는 진입장벽 하드웨어 최적화, 모델 설계, 컴파일러, 추론 엔진, 제품화가 한 스택 안에서 함께 설계된다. 각 레이어가 서로의 특성을 알기 때문에 시스템 전체의 공동 최적화가 가능하다. 외부 범용 GPU 클러스터나 타사 컴파일러에 의존하는 회사는 이 구조를 단기간에 복제할 수 없다. 수직통합의 진짜 경쟁력은 어느 한 레이어의 성능이 아니라, 레이어 간 공동 설계가 만드는 반복 속도와 시스템 수준 최적화에 있다1.
- DOS 2.0이 열어놓은 제품화의 문 에이전틱 추론 환경에서 초당 1,600토큰을 처리한다는 것은, 월드모델을 게임·로봇틱스·자율주행 같은 실시간 영역으로 끌어내릴 수 있다는 의미다. 속도가 제품화의 임계치를 넘으면 시장은 인프라 제공자에게 종속된다. 클라우드 인프라가 결국 몇 개의 플랫폼 위에서 수렴한 것처럼, 에이전틱 AI 추론 시장도 표준 인프라 위에서 수렴할 가능성이 있다. DOS 2.0이 그 임계치를 넘었는지가 이번 투자의 핵심 가정이다1.
- 전략적 파트너십이 만드는 에코시스템 엔비디아와 AWS Trainium3가 파트너십 명단에 있다. 디카트는 AWS Trainium3에 실시간 월드모델을 최초로 배포한 기업 중 하나다1. 엔비디아는 하드웨어 활용 최적화 관점에서, AWS는 자체 AI 칩 Trainium3의 에코시스템 확장 관점에서 디카트와 방향이 일치한다. 이런 파트너십은 단순 계약 이상의 의미를 가진다 — 하드웨어 로드맵 수준에서 협력하는 구조가 형성된다는 신호다. 어도비 벤처스와 토요타 벤처스의 참여도 버티컬 확장의 방향을 시사한다1.
The Bet — 왜 이 VC들이 이 베팅을 샀나
래디컬 벤처스가 이 베팅을 산 논리는 두 층이다. 첫째, 월드모델은 LLM 이후 AI의 핵심 경쟁지다. 자율주행·로봇틱스·게임·에이전틱 AI가 동시에 실시간 환경 이해를 요구하기 시작했고, 이 수요는 한꺼번에 터지고 있다2. 둘째, 모델만으로는 부족하다. 실시간성을 보장하는 인프라 없이는 어떤 월드모델도 제품화될 수 없고, 디카트는 그 인프라를 처음부터 직접 쌓았다. 엔비디아는 자사 하드웨어의 활용 최적화를 극대화할 파트너를, 세쿼이아와 벤치마크는 AI 인프라 레이어의 플랫폼 플레이를 베팅한 것이다. 어도비·토요타의 참여는 콘텐츠 생성과 모빌리티라는 두 버티컬에서 월드모델의 수요가 이미 구체화되고 있음을 시사한다. 누적 조달액 $4억5천만 달러를 이미 넘긴 회사에게 Series B $3억이 붙었다는 것은, 다음 출구가 IPO 또는 대형 전략적 인수합병임을 전제하는 스케일링 자금으로 읽힌다1.
다음 12개월에 지켜볼 지표 3개
- DOS 2.0 엔터프라이즈 계약 건수 플랫폼 가설의 첫 번째 검증은 실제 상용 고객이 얼마나 붙는지다. 추론 플랫폼은 네트워크 효과보다 고객 락인이 중요하다 — 한 번 워크로드를 올리면 마이그레이션 비용이 높아진다. 2026년 내 대형 파트너십 발표나 레퍼런스 고객 공개가 나오는지를 주시해야 한다1.
- AWS Trainium3 협력 배포 규모 Trainium3 최초 배포 지위가 실질적인 워크로드로 이어지는지가 관건이다. 처리 토큰 수·비용 절감 사례가 외부에서 공개되면, 회사가 발표한 8배·100배 수치의 독립적 검증이 된다. AWS의 공식 케이스스터디 등록 여부도 주요 지표가 된다1.
- 수익화 버티컬의 첫 등장 로봇틱스·게임·자율주행 중 어느 버티컬에서 처음으로 반복 매출이 나오는지가 비즈니스 모델의 방향을 결정한다. 어도비·토요타의 투자 참여를 고려하면 콘텐츠 제작과 모빌리티가 유력 후보다. 첫 수익화 버티컬은 회사의 향후 2~3년 레이블을 만들고, 다음 라운드의 밸류에이션 논거가 된다12.
다음은 그 인프라가 어떤 버티컬에서 처음으로 돈이 되는지다.


