AI 서비스가 폭발적으로 성장하면서, 학습된 모델을 실시간으로 돌리는 추론(inference) 단계가 새로운 병목으로 떠올랐다. 업계 분석가들은 2023년 전체 AI 컴퓨팅의 3분의 1에 불과했던 추론 워크로드가 올해 말에는 3분의 2를 차지할 것으로 본다14. 모달랩스는 바로 그 병목을 인프라 레이어에서 정면으로 뚫은 회사다. 거기에 제너럴카탈리스트 주도로 3억5500만 달러가 붙었다1.

Python-first GPU 런타임서브세컨드 콜드스타트샌드박스로 수평 확장ARR $300M · 기업가치 $4.65B
$355M시리즈 C · 제너럴카탈리스트 주도, 레드포인트·멘로·베인·액셀 공동1
ARR $300M9개월 만에 5배 성장1
$4.65B기업가치 · 3개월 전 대비 86% 상승1

왜 '추론 인프라'였나 — 학습 이후의 진짜 병목을 먼저 봤다

AI 시장의 중력이 바뀌고 있다. 대형 언어 모델을 훈련시키는 학습 단계는 수백억 달러 규모의 데이터센터 투자로 이미 과포화 상태다. 반면 학습이 끝난 모델을 사용자 요청에 실시간으로 응답시키는 추론(inference) 단계는 이제 막 폭발하기 시작했다. 업계 분석가들은 2023년 전체 AI 컴퓨팅의 3분의 1에 불과했던 추론 워크로드가 올해 말에는 3분의 2를 차지할 것으로 본다14. 아무리 똑똑한 AI 모델도 사용자 요청에 빠르게 답하지 못하면 쓸모가 없다.

추론 인프라는 학습 인프라와 전혀 다른 요구사항을 갖는다. 학습은 수백 시간을 돌려도 되지만, 추론은 밀리초 단위로 응답해야 한다. 기존 클라우드 제공사들이 학습 워크로드에 최적화된 방식—예약 인스턴스, 고정 과금, 수동 스케일링—으로 시장을 장악한 사이, 추론의 고유한 요구사항은 구조적으로 소외됐다. 콜드스타트가 수십 초 걸리는 플랫폼에서는 실시간 AI 서비스를 제대로 만들 수 없다.

모달랩스는 이 틈새를 정확히 겨냥했다. Python 코드 몇 줄로 GPU 함수를 선언하면, 나머지 인프라 관리는 모달이 맡는다. Kubernetes 설정도, DevOps 팀도 필요 없다. 서브세컨드 콜드스타트, 1,000개 이상 GPU를 즉시 오토스케일링, 최대 128개 B200 GPU3,200 Gbps InfiniBand를 연결하는 멀티노드 클러스터까지 지원한다1. SOC2와 HIPAA 인증을 기본으로 제공해 헬스케어·금융 영역으로도 확장이 가능하다1.

결과는 수치로 나타났다. AI 고객 지원 플랫폼 데카곤(Decagon)은 모달 도입 후 지연시간이 65% 감소했다1. AI 음악 서비스 Suno는 모달 기반으로 서비스 출시 일정을 4개월 단축했다1. 모달랩스는 단순한 GPU 렌털이 아니라, AI 제품팀의 실행 속도를 직접 높이는 가속 레이어가 됐다.

기존 클라우드 대비 모달랩스가 바꾼 것

영역기존 GPU 클라우드모달랩스
접근성·셋업예약 신청, 수동 환경 구성, 긴 대기Python 코드 몇 줄로 즉시 실행
콜드스타트수십 초~수 분서브세컨드(1초 미만) 콜드스타트1
스케일링수동 설정, 예측 기반 사전 프로비저닝1,000+ GPU 즉시 자동 스케일링1
보안·컴플라이언스추가 구성 필요, 인증은 고객 책임SOC2·HIPAA 기본 제공1
개발 생산성DevOps 팀 필요, 인프라 코드 별도 관리인프라 추상화, AI 제품팀 단독 운용 가능

ARR $300M에 도달하기까지 — 세 개의 성장 레이어

  1. 개발자 경험을 진입점으로 모달랩스가 처음부터 노린 것은 ML 엔지니어와 AI 스타트업이었다. 복잡한 쿠버네티스 설정 없이 Python 함수 하나로 GPU 워크로드를 실행하는 경험은, 개발자들이 직접 써보고 팀에 전도하는 구조를 만들었다. 개발자가 먼저 쓰고, 팀이 따라오고, 기업 계약으로 전환된다. 바텀업 PLG(Product-Led Growth) 모델이 ARR 성장의 출발점이었다.
  2. 샌드박스 제품으로 새 시장 열기 추론을 넘어 코드 샌드박스 영역까지 확장한 것이 매출 구조를 바꿨다. 샌드박스 제품이 전체 매출의 3분의 1 이상을 차지하고 있다1. AI 에이전트가 코드를 실행하거나 격리된 환경에서 작업하는 수요가 폭발하는 시점에, 모달은 이미 그 인프라를 갖추고 있었다. 추론 인프라 기업이 아니라 AI 런타임 기업으로 포지셔닝이 확장된 셈이다.
  3. 엔터프라이즈 인증으로 대형 고객 락인 SOC2와 HIPAA 인증은 단순한 체크박스가 아니다1. 헬스케어, 금융, 법률 등 규제 산업의 AI 프로젝트는 인증 없이는 클라우드 선택지에 오르지도 못한다. 모달이 이 인증을 갖춘 순간, 잠재 고객 풀이 스타트업에서 대기업으로 확장됐다. ARR 9개월 5배 성장의 후반부를 이끈 것은 이 대형 고객 전환이었을 가능성이 크다.
"Python 함수 하나로 GPU 워크로드를 실행한다. 인프라는 우리가 책임진다."— 모달랩스 공식 포지셔닝5

The Bet — 제너럴카탈리스트는 무엇을 산 것인가

The Bet

제너럴카탈리스트가 주도하고 레드포인트, 멘로, 베인, 액셀이 합류한 이 라운드의 핵심 논리는 하나다. 추론 인프라는 AI 시대의 새로운 미들웨어가 된다14. AWS·GCP·Azure가 범용 컴퓨팅 레이어를 장악한 것처럼, 모달은 AI 추론 워크로드에 특화된 실행 레이어를 장악할 수 있다는 베팅이다.

밸류에이션 궤적이 이 논리를 뒷받침한다. 불과 3개월 전 25억 달러였던 기업가치가 46억5000만 달러로 86% 뛰었는데도1 5개 VC가 동시에 들어온 것은, 성장 속도가 밸류에이션을 이미 정당화하고 있다는 공통 판단이다. ARR $300M을 9개월 만에 5배 성장시킨 회사에게, 지금 가격은 비싼 게 아닐 수 있다1.

샌드박스 제품이 전체 매출의 3분의 1을 넘어선 것도 중요한 신호다1. AI 에이전트 시장이 열리면서 격리된 코드 실행 환경 수요가 폭발하고 있다. 모달은 추론 인프라에서 AI 에이전트 런타임으로 자연스럽게 확장될 수 있는 위치에 있다. 경쟁자들이 추론만 볼 때, 모달의 TAM은 이미 더 넓어졌다4.

다음 12개월에 지켜볼 지표 3개

  1. ARR $500M 도달 속도 현재 ARR $300M에서 9개월 5배 성장 궤적을 유지한다면 12개월 내 $500M 돌파가 계산에 들어온다1. 이 속도가 유지되느냐, 아니면 대형 계약 확보에 시간이 걸리면서 둔화되느냐가 다음 라운드 또는 IPO 타이밍을 결정한다. 투자자들이 가장 예민하게 볼 지표다.
  2. 샌드박스 매출 비중 추이 샌드박스 제품이 이미 전체 매출의 3분의 1 이상이다1. 이 비중이 절반을 향해 가느냐에 따라 모달이 '추론 인프라 회사'로 남을지 'AI 런타임 플랫폼'으로 재정의될지가 결정된다. 시장에서 받는 밸류에이션 멀티플도 이 포지셔닝에 달려 있다. 추론 특화 인프라와 범용 AI 런타임은 받는 멀티플이 다르다.
  3. 멀티노드 대형 고객 레퍼런스 최대 128개 B200 GPU와 3,200 Gbps InfiniBand를 연결하는 멀티노드 지원1은 대형 모델 파인튜닝과 대규모 배치 추론이 가능하다는 뜻이다. 이 스펙을 실제로 쓰는 엔터프라이즈 고객 레퍼런스가 몇 개나 나오느냐가, 모달이 스타트업 플랫폼에서 대기업 핵심 인프라로 격상되는 신호가 될 것이다.
결국 모달랩스는 AI가 실제로 돌아가는 순간—추론—을 판다.
ARR $300M은 시작이고, 다음은 AI 런타임 표준이 누구 것이 되느냐의 싸움이다.