AI 스타트업 환경의 도전과 향후 AI 연구실의 수평적 에이전트가 가져올 변화, 그리고 창업가의 다양한 선택지를 다룹니다.
이전 챕터 요약은 14:28 여기에서 들을 수 있습니다.
3장에서 언급했듯이, 앞으로 몇 년간 AI 애플리케이션 시장은 스타트업에게 매우 힘든 환경이 될 것이라 생각합니다. 현재 이 회사들의 매출 성장세는 매우 인상적이지만, 이런 기울기는 연말까지 긍정적일 것입니다. 그러나 2027년쯤이면 모델 성능이 너무 강력해져 AI 연구실의 수평적(범용) 솔루션이 시장을 장악할 것입니다. 창업자 시각에선 다소 낙담되는 이야기일 수 있겠죠. 1, 2장에는 "그러면 그냥 포기해야 한다는 말인가요?"라는 댓글을 많이 받았는데, 저는 전혀 그런 뜻이 아닙니다. 세상에는 여전히 수많은 문제들이 있으며, AI 앱만이 할 수 있는 일이 아닙니다.
그림 1: 당신이 마법사임을 보여주는 일러스트
창업자는 마법사와도 같아서, 아무것도 없어 보이는 곳에서 가치를 창조해냅니다. 회사를 시작하려면 새롭고 독창적인 생각이 필요합니다. PG(폴 그레이엄)는 이렇게 말했습니다.
“옳기만 해서는 충분하지 않습니다. 당신의 아이디어는 옳으면서 새로워야 합니다. (…) 모두가 동의하는 일에 스타트업을 시작하고 싶지는 않을 겁니다.”
하지만 많은 창업자가 주위 동료들의 눈부신 매출 성장에 현혹된 것 같습니다. 위 인용은 PG의 에세이 '스스로 생각하는 법'에서 따온 것인데, 모두가 똑같은 일을 하는 세상에서 스스로 생각하기란 쉽지 않습니다. 아래에 저의 시도를 적어봅니다. 부디 이 아이디어들이 나쁘게 들리길 바랍니다.
저는 AI 앱 레이어를 지배할 수평적 에이전트는 AI 연구실에서 만들어질 것이라 봅니다. 모델 성능이 극단적으로 차이나 하나만 남을 수도 있겠지만, Anthropic, OpenAI, GDM, xAI 간 치열한 경쟁이 계속될 가능성이 더 커 보입니다. 이런 경쟁은 결국 소비자에게 가격 하락 등 단기적으로 유리합니다. 비록 초기엔 AI 연구실이 금전적 가치를 많이 가져가지 못하더라도, 이들은 결국 매우 강력한 권력을 가지게 됩니다. 그렇기 때문에 창업자는 본인의 스타트업이 이 연구실들과 어떤 관계를 맺을지 고민하는 게 맞다고 생각합니다.
2장에서 설명했듯, LLM API를 활용해 AI vertical(특화 분야)에 도전할 수는 있지만, 꼭 필요한 리소스를 독점적으로 갖고 있을 때만 가능합니다. AI vertical을 꼭 하고 싶다면, 그런 리소스를 찾는 데 어마어마한 노력을 기울여야 합니다.
만약 수평적 에이전트가 미래라면, 직접 만들어보는 건 어떨까요? 세 가지 접근법을 생각해 봅니다.
시장 선점(First to Market)
AI 연구실들은 모델이 충분히 신뢰할 만하고 최소한의 엔지니어링 노력으로 수평적 에이전트를 만들 수 있을 때 vertical workflow와 본격 경쟁을 시작할 겁니다. 엔지니어링을 더해 더 이른 모델을 시장에 먼저 내놓으며 연구실보다 먼저 선점할 수도 있다고 생각할 수 있습니다. 하지만 그마저도 불확실합니다. Leopold Aschenbrenner는, 이는 차기 모델 개발보다 더 오래 걸릴 수도 있다고 합니다:
“Schlep(고생)이 unhobbling(해방)보다 오래 걸릴 수 있다. 즉, 원격 노동자를 대량 자동화할 때쯤이면 중간 모델은 아직 완전히 활용되지도, 통합되지도 않았을 수 있다.”
누가 먼저 출시하더라도, 이 우위가 오래가진 않을 겁니다.
에이전트 API 래퍼(Agent API Wrapper)
제 룸메이트가 한 번 이렇게 물었습니다. "UI 잘 만드는 사람은 세상에 없는 거야?" 이미 모델 API가 공개되어 있는데 왜 더 나은 ChatGPT가 안 나오냐는 거죠. 여기엔 두 가지 문제가 있습니다. 1) API 비용 문제로 마진이 지속 불가능하고, 2) 연구실은 최고의 모델(예: ChatGPT의 검색, 웹 탐색 등) API는 공개하지 않습니다.
지금 누구도 GPT API로 ChatGPT와 직접 경쟁하지 않고 있고, 이 패턴은 수평적 에이전트에서도 반복될 것으로 봅니다.
오픈소스 모델(Open-Source Models)
오픈 소스 모델이 또 다른 길이 될 수 있습니다. Perplexity처럼 수평 제품에서 연구실과 경쟁하는 사례도 보입니다. 하지만 오픈소스 모델은 간단한 테스트에선 성능이 좋지만, 복잡한 에이전트 작업에서는 약합니다. 예컨대 Llama-3.1-405b는 MLE-bench(그림 2)에서 프론티어 모델보다 많이 뒤처집니다. 저희 Andon Labs에서 여러 벤치마크를 돌려 본 결과와도 일치합니다.
그림 2: MLE-bench에서 여러 모델 성능 비교
이 글을 쓰고 한 달이 지나 Deepseek V3, R1이 출시되어 인상적인 결과를 보여줍니다. 하지만 o3도 그랬고, Anthropic은 더 좋은 버전이 있다고도 소문납니다. 오픈소스 모델이 프론티어 모델에 근접하는 사례는 계속 나올 테지만, 이를 뛰어넘진 힘들 것 같습니다. 그래도 수평적 시장에서는 충분히 경쟁력 있을 수도 있습니다. 다만 추론 비용은 여전히 높을 점을 유의해야 합니다.
AI 연구실이 정말 이렇게 강력해진다면, 이들에게 벤더로 납품하는 입장은 매우 좋습니다. 연구실들은 엄청난 컴퓨팅 및 전력이 필요할 것입니다. Leo의 분석이 맞다면 생각보다 더 많이 필요할 수 있습니다(그림 3). 이런 기회는 산업적 전문성을 요구하는데, 현재 AI 애플리케이션 레이어 창업자에게는 익숙하지 않을 수 있습니다. 하지만 기억하세요, 당신은 마법사입니다.
연구실은 또 써드파티로부터 데이터를 사들입니다. Scale AI는 이것이 좋은 비즈니스임을 증명했습니다. 다만 AI 연구실이 '셀프 플레이(self play)'를 성공시킬지가 관건입니다. AlphaZero처럼 외부 데이터 없이 훈련된 모델이 미래의 성배로 여겨지고 있으니까요. 셀프 플레이가 안 된다면, 다양한 사후 훈련 데이터셋을 이어붙여야 하므로 데이터 판매가 유망할 것입니다.
그림 3: Situational Awareness에서 추측한 미국 발전량과 AI 수요 비교. 발전량은 완만한 반면, AI 수요는 기하급수적으로 증가해 2030년엔 전체 발전량을 넘어설 수 있습니다. 최대 훈련 클러스터가 상당량을 차지할 것으로 보임.
AI 연구실과의 마지막 관계는 생태계 기여자(Ecosystem Contributor)가 되는 것입니다. 이것은 수평적 에이전트에 도움을 주는 도구를 만들되, 에이전트 자체에서는 분리되어야 합니다. 3장에서 설명했듯, 기존 소프트웨어는 에이전트가 효율적으로 상호작용해야 하므로 계속 필요합니다. 에이전트가 직접 필요한 소프트웨어를 쓸 수 있지만, 추론 비용 때문에 실질적이지 않을 수 있습니다. 하지만 생태계 플레이어는 핵심이 아니라 부품 역할에 머무를 위험도 있습니다. 이건 수평 에이전트의 추론 비용이 얼마나 높은지에 따라 달렸다고 생각합니다. 만약 비용이 낮아진다면, 에이전트가 필요할 때마다 직접 소프트웨어를 작성하는 쪽을 더 선호할 것입니다.
타임라인(수평 에이전트가 지배적으로 되는 시점)은 매우 중요합니다. 만약 10년이 걸린다면 vertical workflow를 만드는 게 꽤 좋은 전략입니다. 그사이 회사를 크게 키울 시간은 충분합니다.
10년은 현 상황에선 너무 길 수도 있지만, 4년 정도라면 어떨까요? 4년은 대형 회사를 만들기엔 짧지만, 반복 실험을 하기에는 충분합니다. AI 애플리케이션에서 시작해서 벤더나 생태계 플레이어로 전환하는 것도 좋은 전략입니다.
처음 보면 YC가 실수하는 것처럼 보입니다. 그들은 곧 사라질 분야에 대부분 투자하는 것 같습니다. 하지만 저는 벤처캐피탈을 잘 모르니 자신 있게 말하진 못하겠습니다. 그냥 저의 혼란을 털어놓는 것이니 아시는 분은 알려주세요.
YC는 스스로 의견이 크게 있지 않다고 주장합니다. 가장 똑똑한 사람에게 투자하면 그들이 최고의 아이디어를 가져올 것이라 믿지요. 꽤 좋은 전략입니다. 수백 명의 창업자가 14명의 파트너보다 미래를 훨씬 더 잘 예측할 수 있으니깐요.
배치에서 주간 목표 설정은 매우 중요합니다. 다 같이 그룹을 지어 목표를 정하는 것은 동기 부여에 좋지만, 아이디어 다양성이 충분하지 않다면 단기적 사고에 빠질 수 있습니다. 빠른 성과(예: 다음 주 5천 MRR 달성)에 집중한다면 vertical 영역이 좋아 보이지만, 그게 장기적으로 지속 가능한 사업 방식은 아니라 생각합니다. 하지만 현재 배치에 있다면 저도 vertical에 손이 갈 것 같습니다. 게다가 요즘 YC 팟캐스트 "The light cone" 에피소드마다 AI vertical을 밀어주는 분위기입니다.
저는 YC의 비의견 전략이 다양한 창업자 덕에 잘 작동한다고 봤는데, 어쩌면 제가 뭔가 놓치고 있을지도 모르겠네요.
이 포스트로 이어진 논의를 해준 Axel Backlund에게 감사드립니다.