알파제로(AlphaZero)는 인간의 기보를 단 한 수도 학습하지 않고 세계 최강 바둑 기사를 꺾었다. 가능했던 이유는 하나다. 인간을 모방하는 대신, 규칙이 주어진 환경 안에서 수백만 번 경험을 쌓아 원리를 스스로 발견했기 때문이다. 그 시스템을 설계한 구글 딥마인드(DeepMind) 강화학습팀 수장 데이비드 실버(David Silver)가 이번엔 그 원리를 바둑판 너머 모든 도메인으로 확장하겠다는 회사를 세웠다. 창업 5개월 만에, 거기에 유럽 역사상 최대 시드 라운드 11억 달러(약 1조4,300억원)이 붙었다1.

알파제로 원리도메인 일반화인간 데이터 없는 자기 발견슈퍼러너 AI 플랫폼
11억 달러시드 라운드 · 유럽 역사상 최대 · 세쿼이아·라이트스피드 공동 주도1
51억 달러창업 5개월차 인정 기업가치1
7곳동시 참여 투자자 · 엔비디아·구글·영국 정부 포함1

왜 '인간 데이터 없이'였나 — LLM 패러다임의 천장을 겨냥한 논거

현재 대형언어모델(LLM) 경쟁의 본질은 두 자원 싸움이다. 얼마나 많은 컴퓨팅을 쓰느냐, 얼마나 많은 인간 생성 데이터를 확보하느냐. 오픈AI·구글·앤스로픽이 벌이는 스케일링 전쟁의 구조다. 그런데 이 구조에는 구조적 상한이 존재한다. 인터넷에 존재하는 텍스트 총량은 유한하고, 그 텍스트에는 인간의 오류와 편향이 내재화돼 있다. 모델이 아무리 커져도 학습 데이터의 천장을 뚫을 수는 없다.

알파제로는 이 문제를 정반대 방식으로 해결한 유일한 선례다. 기보 데이터 없이, 바둑 규칙만 주어진 채 자기 대국을 반복하며 원리를 발견했다. 지식의 상한이 인간 데이터 총량이 아니라, AI가 탐색할 수 있는 경험 공간으로 바뀐 것이다. 실버가 이 원리를 과학·의료·수학·공학 같은 실세계 도메인으로 확장할 수 있다고 주장하는 것이, 이네이퍼블 인텔리전스의 창업 논거다1.

이 주장이 성립하기 위한 전제는 명확하다. 각 도메인에서 알파제로의 '바둑판'에 해당하는 환경과, '승·패'에 해당하는 보상 신호를 설계할 수 있어야 한다. 바둑은 규칙이 수학적으로 명확하고 결과 판정이 즉각적이어서 강화학습이 통했다. 신약 개발이나 기초과학 발견에서 그에 상응하는 환경을 구성할 수 있는지가, 이 회사가 증명해야 할 가장 어려운 질문이다. 현재 공개된 제품도 연구 결과도 없다. 그 공백을 7개 기관이 11억 달러로 채웠다1.

회사 이름 '이네이퍼블(Ineffable)'은 '말로 표현할 수 없는'이라는 뜻이다. 인간의 언어로 아직 기술된 적 없는 지식, 즉 미발견 원리를 AI가 스스로 끌어내겠다는 포지셔닝이 이름에 담겨 있다. 이 작명 자체가 현재 LLM 패러다임 — 인간이 말한 것을 학습하는 모델 — 과의 선명한 대조를 의도한다.

알파제로 방식 vs 현재 LLM 방식 — 다섯 가지 분기점

두 접근법의 차이는 단순한 기술 선택이 아니라 '무엇이 AI의 지식 상한을 결정하는가'에 대한 근본적 관점 차이다. 아래 다섯 항목이 그 분기를 압축한다.

비교 영역현재 LLM (GPT·Gemini 등)이네이퍼블 인텔리전스 지향
학습 소스인간이 생성한 텍스트·레이블 데이터환경 탐색과 자기 강화학습1
지식의 상한학습 데이터 총량에 종속경험 공간에 따라 이론상 무한 확장1
오류·편향 구조인간 편향과 오류 내재화원리에서 출발, 인간 편향 비의존
핵심 비용데이터 수집·라벨링·인간 피드백도메인별 환경·보상 신호 설계
상용 검증 현황다수 상용 제품·수십억 달러 매출벤치마크 2026년 말 공개 예정1

왜 7곳이 동시에 베팅했나 — 구조적 이유 세 가지

  1. 창업자가 가설을 이미 한 번 증명했다 데이비드 실버는 알파고에서 알파제로로 이어지는 강화학습 혁신을 이끈 구글 딥마인드 연구자다1. 알파제로는 인간 지식을 흡수하지 않고 인간을 초월한 최초의 AI 시스템이다. 투자자 입장에서 이 이력은 단순한 학문적 성과가 아니다. '같은 원리로 더 큰 판을 만들 수 있다'는 실증이자 창업자 리스크를 낮추는 가장 강력한 근거다. AI 역사에서 알파제로 수준의 패러다임 전환을 직접 설계한 창업자는 손에 꼽힌다. 세쿼이아와 라이트스피드가 이 이력 하나에 공동 주도를 결정한 것은, 아이디어가 아니라 사람에게 베팅했다는 뜻이다.
  2. 경쟁자가 아직 없는 포지션이다 현재 AI 경쟁은 LLM 스케일링과 데이터 확보 싸움으로 수렴한다. 이네이퍼블은 그 경쟁에서 아예 빠져나와 다른 층위에서 싸우겠다고 선언했다1. 세쿼이아·라이트스피드가 공동 주도하고 인덱스 벤처스까지 동시에 들어온 것은, 이 포지션이 단독으로 선점될 수 있다는 판단을 반영한다. 이 판이 실현된다면 현재의 LLM 경쟁과는 완전히 다른 시장이 열린다. 그리고 그 시장은, 먼저 환경 설계 역량을 축적한 쪽이 선점할 가능성이 높다.
  3. 국가 자본과 빅테크가 같은 라운드에 있다 영국 정부(UK Sovereign AI Fund)와 구글, 엔비디아가 동시에 시드에 참여한 구조는 이례적이다1. 국가 AI 주권 경쟁이 이 회사에 지정학적 의미를 부여했고, 엔비디아와 구글은 이 방향이 자신들의 인프라·플랫폼과 보완 관계에 있다는 계산을 했다는 뜻이다. DST 글로벌까지 포함해 이해관계가 전혀 다른 7개 기관이 같은 타이밍에 움직인 것 자체가 시장 신호다1.
"인간 지식을 모방하는 대신, 스스로 경험을 통해 지식을 발견하는 AI를 만든다." — 이네이퍼블 인텔리전스 공식 포지셔닝1

The Bet — 이 베팅이 맞으려면

The Bet

세쿼이아·라이트스피드·엔비디아·구글·영국 정부가 동시에 유럽 최대 시드를 넣은 것은 하나의 가설에 대한 집단적 동의다. 알파제로가 바둑에서 증명한 원리 — 올바른 환경과 보상 신호만 있으면 인간 데이터 없이도 인간을 초월하는 지식이 발생한다 — 가 과학·의료·공학 같은 실세계 도메인에서도 재현 가능하다는 것1. 이 베팅이 맞으면, 현재 LLM 패러다임의 데이터 상한 문제는 구조적으로 해소되고 AI의 다음 챕터가 열린다. 틀리는 조건도 명확하다. 2026년 말 공개될 첫 벤치마크가 현존 모델 대비 유의미한 차이를 내지 못하거나, 특정 도메인에서의 환경 설계 가능성을 납득시키지 못하는 경우다. 11억 달러는 그 증명에 걸린 런웨이다1.

다음 12개월에 지켜볼 지표 3개

  1. 2026년 말 첫 벤치마크의 내용과 도메인 이네이퍼블이 외부에 공개한 유일한 타임라인이다1. 어떤 도메인에서 어떤 기준선을 넘었는지가 이 회사의 기술 실체를 처음으로 드러내는 순간이 된다. 단순 성능 수치보다 'AI가 어떤 종류의 발견을 했는지'가 더 결정적인 신호다. 이 결과가 이후 후속 라운드의 조건과 기업가치 51억 달러의 정당성을 검증한다.
  2. 첫 적용 도메인 공개 과학·의료·수학·공학 중 어느 영역을 먼저 타깃으로 삼는지가 시장 기회와 경쟁 구도를 가늠하는 단서다. 도메인 선택은 곧 어디서 '환경 설계 문제'를 가장 먼저 풀었는지를 의미하며, 이후 정부·빅테크 파트너십의 구체적 형태를 결정한다.
  3. 후속 라운드 또는 API 접근 시그널 현재 공개된 매출·제품·수익 구조는 없다1. 11억 달러의 런웨이가 어느 타임라인에서 상용화 경로와 연결되는지를 시장이 주목할 것이다. 연구 기관·정부와의 협력 계약 발표나 제한적 API 접근 공개 여부가 다음 신호가 된다.
결국 이네이퍼블은 '더 나은 LLM'이 아니라 '다음 패러다임'을 판다.
2026년 말, 첫 벤치마크가 그 주장을 검증하거나 철회시킬 것이다.