로봇이 배우는 방식은 오래된 딜레마에 묶여 있다. 실제 도로·창고·공장에서 엣지 케이스 데이터를 모으는 건 느리고, 사고 위험이 따른다1. 기존 시뮬레이터(CARLA, Isaac Sim)는 수작업으로 구축한 고정 환경에 의존해 원하는 세계를 즉시·무한히 만들 수 없었다1. 마인크래프트에서 출발한 이스라엘 AI 스타트업 데카르트(Decart)가 자연어 프롬프트 하나로 시뮬레이션 환경을 즉석에서 생성하는 인터랙티브 월드모델 Oasis 3를 API로 공개했고, 거기에 NVIDIA·도요타 벤처스·래디컬 벤처스·세쿼이아 등이 3억 달러(약 3,900억원)을 넣었다1.
왜 '로봇 훈련 인프라'였나 — 데이터 병목이 피지컬 AI 전체를 막고 있었다
자율주행과 로봇 분야에서 AI 모델의 성능을 결정하는 최대 변수는 데이터의 품질과 다양성이다. 문제는 실제 환경에서 희귀한 상황을 수집하는 일이 구조적으로 어렵다는 데 있다. 극단적 날씨, 갑작스러운 장애물, 드문 교통 패턴 같은 엣지 케이스를 현실에서 반복 재현하려면 수개월의 주행 테스트와 막대한 비용이 필요하고, 최악의 경우 사고로 이어진다1.
기존 시뮬레이터가 이 공백을 메웠지만, 방식이 달랐다. 엔지니어가 3D 자산을 하나하나 배치하고 환경을 수작업으로 설계해야 한다. 필요한 시나리오가 수백 가지라면 환경 제작 공수도 그만큼 늘어났다. 원하는 장면을 즉시·무한히 생성하는 것이 불가능한 구조였다1.
데카르트는 이 문제를 월드모델 방식으로 해결했다. Oasis 3는 자연어 프롬프트를 입력받아 물리적으로 일관된 시뮬레이션 환경을 즉시 생성한다. '비 오는 항구 창고에서 지게차가 사람을 피하는 상황'을 텍스트로 입력하면 그 장면이 22FPS 실시간으로 렌더링되고, 엔드투엔드 레이턴시는 200ms 미만이다1. 로봇·자율주행 팀은 환경 제작 없이 데이터 생성 파이프라인만 돌릴 수 있다.
이 기술은 마인크래프트에서 검증됐다. 데카르트의 초기 제품은 게임 화면을 실시간으로 생성하는 인터랙티브 월드모델이었다. 마인크래프트에서 쌓은 실시간 생성 기술이 피지컬 AI 훈련 인프라로 전용된 것이 Oasis 3의 출발점이다1.
전통 시뮬레이터와 Oasis 3는 어디서 갈리나
| 영역 | 전통 시뮬레이터 (CARLA·Isaac Sim) | 데카르트 Oasis 3 |
|---|---|---|
| 환경 생성 | 엔지니어 수작업, 3D 자산 개별 배치 | 자연어 프롬프트 → 즉시 생성1 |
| 엣지 케이스 | 사전 설계된 시나리오만 가능 | 텍스트 입력으로 무한 변형1 |
| 렌더링 속도 | 고사양 GPU, 장시간 렌더링 | 22FPS 실시간, 200ms 미만1 |
| 카메라 지원 | 제한적 카메라 구성 | 멀티뷰 카메라 기능 기본 지원1 |
| 클라우드 연동 | 온프레미스 또는 별도 구축 필요 | AWS Trainium3 연동 API 제공1 |
세 단계로 읽는 데카르트의 궤적
- 마인크래프트로 기술 가설 증명 데카르트의 첫 제품은 게임 세계를 실시간으로 생성하는 인터랙티브 월드모델이었다. 마인크래프트 화면을 AI가 직접 렌더링하는 데모는 실시간 인터랙티브 생성이 가능하다는 사실을 업계에 각인시켰고, 통제된 환경에서 핵심 기술 가설을 검증하는 계기가 됐다1. 게임이라는 규칙이 명확한 세계가 증명의 무대였다.
- 피지컬 AI로 전환, Oasis 3 API 출시 2026년 5월 데카르트는 동일한 실시간 생성 기술을 로봇·자율주행 훈련 인프라에 적용한 Oasis 3를 API로 공개했다. 자연어 프롬프트로 물리적으로 일관된 시뮬레이션 환경을 즉시 생성하고, 엔드투엔드 레이턴시 200ms 미만·22FPS 실시간을 달성했다1. 로봇 팀이 시뮬레이터 제작 공수 없이 데이터 파이프라인을 운용할 수 있게 됐다.
- AWS 파트너십 + Series B로 스케일 선언 아마존 AWS와의 전략적 파트너십을 통해 자사 Lucy 모델을 AWS Trainium3 칩에서 구동하는 클라우드 인프라를 확보했다1. 동시에 NVIDIA·세쿼이아·래디컬 벤처스·도요타 벤처스·어도비 벤처스·이베이 벤처스·벤치마크 등에서 3억 달러(약 3,900억원)를 조달해 기업가치 40억 달러를 확인받았다1. 훈련 인프라 사업의 규모화에 필요한 자본과 칩 공급망을 동시에 확보한 움직임이다.
왜 NVIDIA와 세쿼이아가 같은 테이블에 앉았나 — The Bet
이번 라운드의 투자자 구성은 단순한 자금 지원이 아니다. NVIDIA는 GPU 훈련 인프라의 수요가 피지컬 AI로 확대될 것에 베팅하고 있고, 도요타 벤처스는 자율주행 훈련 데이터의 병목을 월드모델로 해결하려는 전략적 필요가 있다1. 세쿼이아·래디컬 벤처스는 생성 AI 인프라 레이어 중 '시뮬레이션 데이터 생성'이 다음 지배적 카테고리가 될 것이라는 판단을 공유하고, 어도비·이베이 벤처스는 월드모델이 로봇 너머 다양한 산업 시뮬레이션으로 확장될 것을 본다. 전략 투자자 아홉 곳이 같은 회사에 동시에 들어왔다는 것은, 월드모델 기반 훈련 인프라가 로봇·자율주행 AI 스택에서 필수 레이어로 자리잡을 것이라는 시장 합의에 가깝다. 기업가치 40억 달러(약 5.2조원)는 현재 매출보다 이 레이어를 선점한 자의 미래 포지션에 대한 가격이다1.
다음 12개월에 지켜볼 지표 3개
- Oasis 3 프로덕션 파이프라인 도입 기업 수 로봇·자율주행 팀이 기존 시뮬레이터에서 Oasis 3로 실제 훈련 파이프라인을 전환하는지가 시장 침투율의 직접 신호다. 파일럿이 아닌 프로덕션 편입 레퍼런스 수와 반복 구독 계약 비율이 핵심 지표다1.
- AWS Trainium3 연동 실측 벤치마크 공개 아마존 파트너십이 선언을 넘어 실질적인 훈련 비용 절감으로 이어지는지가 확인돼야 한다. Lucy 모델의 Trainium3 구동 성능과 단위 비용 벤치마크가 공개될 경우, 인프라 레이어 경쟁력의 독립 검증이 된다1.
- Series C 타이밍과 밸류에이션 재평가 현재 기업가치 40억 달러는 기술 가설 단계의 가격이다. 12개월 내 대형 고객 레퍼런스와 반복 매출 지표가 공개되면, 다음 라운드 밸류에이션이 이 베팅의 현실화 여부를 검증하는 시험대가 될 것이다1.
NVIDIA와 세쿼이아가 같은 테이블에 앉은 이 베팅의 다음 장면은, Oasis 3가 얼마나 빨리 필수 레이어가 되느냐다.


