AI 모델의 추론(Inference)은 학습만큼 비싸졌고, 그만큼 전략적 자산이 됐다. 오픈AI·구글·앤트로픽 같은 최전선 연구소들은 수년에 걸쳐 세계 최고 수준의 추론 인프라를 자체 구축해 쓰지만, 그 역량도 인력도 시간도 없는 수천 개의 AI 기업이 뒤에 남아 있다1. 그 구조적 공백에 오픈소스로 꽂혀 구글·마이크로소프트·xAI의 프로덕션 환경까지 파고든 AI 추론 엔진이 있다. UC버클리 스카이 컴퓨팅 랩(Sky Computing Lab) 출신 팀이 개발한 SGLang이다. 이 팀이 래딕스아크(RadixArk)라는 이름으로 공식 출범하며 시드 라운드 1억 달러(약 1,300억 원)를 유치했고1, 포스트머니 기업가치 4억 달러에 엔비디아·AMD·미디어텍 반도체 3사가 전략적 투자자로 이름을 올렸다1.

UC버클리 랩 오픈소스구글·MS·xAI 프로덕션 채택래딕스아크 공식 설립시드 1억 달러
$1억시드 라운드 · 엑셀 리드, 스파크 캐피털 공동 · 포스트머니 $4억
3사엔비디아·AMD·미디어텍 — 반도체 전략적 투자자 동시 참여
SGLang구글·MS·xAI 프로덕션 환경 채택 오픈소스 AI 추론 엔진

왜 SGLang이었나 — 추론 인프라의 공용어를 먼저 쓴 팀

AI 인프라 스택에서 추론(Inference) 레이어는 오랫동안 각 기업이 개별적으로 해결해야 할 문제로 남아 있었다. 클라우드 벤더가 제공하는 GPU 인스턴스를 빌려 쓰는 것과, 그 위에서 대형 언어 모델을 초당 수천 건의 요청에 낮은 지연으로 응답시키는 것은 전혀 다른 엔지니어링 문제다. 오픈AI·구글·앤트로픽은 내부 전담 팀이 이 문제를 해결하지만1, 그 역량을 갖추지 못한 대부분의 AI 기업은 비효율적인 추론 스택 위에서 서비스를 운영한다. 추론 비용이 AI 서비스 총비용에서 차지하는 비중이 커지는 지금, 이 격차는 경쟁력의 차이로 직결된다.

SGLang은 그 격차를 좁히기 위해 등장한 오픈소스 AI 추론 엔진이다. UC버클리 스카이 컴퓨팅 랩에서 시작된 이 프로젝트는 학술적 기원에 머물지 않았다. 구글·마이크로소프트·xAI 등이 프로덕션 환경에서 실제로 SGLang을 채택하며 기술력을 검증했다1. 최전선 AI 연구소들의 실제 서비스 스택에 오픈소스 엔진이 투입된다는 것은, 단순한 실험 도구를 넘어 업계 표준 후보로 인정받았다는 신호다. 오픈소스 AI 프로젝트가 논문과 GitHub 저장소 단계에 머무는 경우가 대부분인 생태계에서, SGLang의 프로덕션 채택 이력은 이례적으로 강한 기술 검증이다.

래딕스아크의 공식 출범 자체도 흥미롭다. 엑셀 주도 라운드에서 포스트머니 4억 달러 기업가치를 인정받았다는 사실은 올해 초부터 알려졌지만, 투자 규모와 투자사 구성은 이번 공식 발표 전까지 공개되지 않았었다1. 이번 공개로 드러난 명단에서 결정적인 것은 반도체 진영이다. 엔비디아 벤처스(NVentures)·AMD·미디어텍(MediaTek)이라는 경쟁 관계의 반도체 기업 3사가 같은 회사에 함께 베팅했다는 것은1, 래딕스아크가 어느 하드웨어 위에서도 작동해야 한다는 전제를 양측이 수용했다는 의미다.

래딕스아크는 SGLang 외에도 대규모 MoE(Mixture of Experts) 모델을 위한 강화학습(RL) 프레임워크인 마일스(Miles)를 공동 보유하고 있다1. MoE 구조는 최근 대형 언어 모델들이 파라미터를 선택적으로 활성화해 계산 효율을 높이는 방식으로 광범위하게 채택하는 아키텍처다. 이 구조는 추론 최적화가 Dense 모델보다 훨씬 복잡해 전용 프레임워크가 필요한 영역이다. SGLang이 추론 엔진 레이어를 담당하고 마일스가 MoE 특화 RL 프레임워크를 담당하는 구성으로, 래딕스아크는 AI 추론 효율화의 두 핵심 축을 한 팀에서 보유하게 됐다.

빅테크 자체 인프라 vs 래딕스아크

영역기존 방식 (자체 구축)래딕스아크
추론 인프라 구축전담 엔지니어팀 수년 개발SGLang 오픈소스 + 관리형 서비스 즉시 활용
하드웨어 지원단일 GPU 벤더 의존엔비디아·AMD·미디어텍 다중 하드웨어 파트너십
대규모 MoE 추론자체 RL 프레임워크 별도 구현마일스(Miles) 프레임워크 내장 지원
기술 검증내부 테스트 의존구글·MS·xAI 프로덕션 실 채택으로 검증
상업 모델고정 엔지니어링 비용 내재화오픈소스 + SaaS 이중 수익 구조

어떻게 수익화하나 — 오픈소스와 관리형 서비스의 이중 전략

  1. 오픈소스로 업계 표준 선점 SGLang은 이미 구글·MS·xAI의 프로덕션에 깔려 있다1. 오픈소스는 마케팅이자 기술 검증이자 채용 파이프라인이다. 기여자가 늘수록 엔진은 개선되고, 채택 기업이 늘수록 사실상 표준(de facto standard) 지위는 굳어진다. 래딕스아크가 상업화 이후에도 오픈소스를 유지하는 이유는, 오픈소스 커뮤니티 자체가 어떤 영업 조직도 대체할 수 없는 해자(moat)이기 때문이다.
  2. 관리형 인프라 서비스로 전환 오픈소스를 직접 운용할 역량이 없는 AI 기업을 위해 관리형(managed) 인프라 서비스를 제공한다1. GPU 클러스터에서 SGLang을 구성·튜닝·유지보수하는 복잡성을 SaaS 형태로 추상화하는 것이 핵심 수익원이다. 오픈소스를 무료로 풀면서 엔터프라이즈 관리형 서비스로 수익화하는 구조는 오픈소스 상업화의 검증된 경로를 따른다.
  3. 반도체 파트너십으로 하드웨어 레이어 잠금 엔비디아·AMD·미디어텍의 전략적 참여는 재무 투자를 넘어선다1. 각사의 최신 칩에 SGLang을 최적화하고, 새로운 하드웨어가 출시될 때마다 래딕스아크가 가장 먼저 지원 가능한 구조가 만들어진다. 하드웨어 중립적 추론 레이어는 클라우드 인프라와 AI 애플리케이션 사이에서 플랫폼적 포지션을 겨냥한다.
"최전선 AI 연구소들은 자체 추론 인프라를 만든다. 그 역량이 없는 나머지 기업들을 위해, 래딕스아크가 존재한다."— 래딕스아크 공식 포지셔닝 요약

The Bet — 왜 엑셀과 반도체 3사가 이 베팅을 샀나

The Bet

엑셀과 스파크 캐피털이 시드 단계에 1억 달러를 투입한 것은 기술 리스크를 감수한 베팅이 아니다1. SGLang은 이미 구글·MS·xAI의 프로덕션에서 실증됐고, 팀은 UC버클리 스카이 컴퓨팅 랩이라는 학계 권위를 등에 업었다. 이 베팅의 핵심 논리는 시장 타이밍이다. AI 추론 비용이 급격히 상승하는 지금, 이미 프로덕션에서 채택된 오픈소스 추론 엔진을 관리형 서비스로 상업화하는 윈도우가 열렸다고 본 것이다. 엔비디아·AMD·미디어텍이 동시에 전략적 투자자로 참여한 것은1, 이 판단에 반도체 생태계 전체가 동의한다는 신호다. 경쟁사 칩 위에서도 돌아가야 한다는 전제로 같은 회사에 투자한 반도체 기업들은, 래딕스아크가 하드웨어 중립적일수록 각자에게도 이롭다는 계산을 한 것이다. 특정 하드웨어 벤더에 종속되지 않는 범용 추론 레이어는, 클라우드 시대의 미들웨어처럼 생태계 전체를 가로지르는 포지션을 겨냥한다.

다음 12개월에 지켜볼 지표 3개

  1. 관리형 서비스 첫 상업 매출 공개 오픈소스 채택에서 유료 관리형 서비스로의 전환율이 상업 모델이 실제로 작동하는지를 가늠하는 첫 번째 지표다. 구글·MS·xAI 같은 기존 채택사들이 유료 서비스 고객으로 전환되는지, 아니면 자체 운영을 유지하는지도 관건이다. 엔터프라이즈 계약 건수와 첫 ARR 공개 여부가 다음 라운드 밸류에이션의 기준점이 될 것이다.
  2. AMD·미디어텍 하드웨어 최적화 벤치마크 공개 엔비디아 GPU가 아닌 AMD·미디어텍 칩에서의 SGLang 성능 벤치마크가 공개된다면, 하드웨어 중립성 주장을 수치로 검증할 수 있다. 반도체 3사 동시 참여의 실질적 가치가 이 데이터로 판단된다. 수치가 나오지 않는다면 전략적 투자의 의미가 단순 재무 투자 이상으로 발전했는지 의문이 제기될 수 있다.
  3. 오픈소스 생태계 기여자 수·신규 채택 기업 확대 SGLang의 신규 컨트리뷰터 수와 프로덕션 채택 기업 공개 사례가 관리형 서비스 파이프라인의 선행 지표다. 기존 채택사인 구글·MS·xAI 외의 새로운 프로덕션 레퍼런스 공개 여부가 관건이다. 오픈소스 생태계 성장이 둔화하면 상업 모델의 미래 파이프라인도 함께 흔들린다.
결국 래딕스아크는 AI 추론이라는 인프라의 바닥을 짜는 회사다.
그 바닥이 어느 칩 위에서도 돌아가는 날, 이 회사의 포지션이 확정된다.