AI 생성 코드의 품질 문제로 ‘바이브 코딩 클린업’이라는 새로운 서비스 카테고리가 부상하고 있다. 시장 동향과 수요, 실패 원인, 비즈니스 기회, 엔지니어링에 미치는 영향, 그리고 Donado Labs의 접근을 다룬다.
테크 업계에서 조용히 새로운 서비스 카테고리가 떠오르고 있다: 바이브 코딩 클린업. ‘AI가 저지른 엉망진창을 수습한다’는 LinkedIn 농담에서 출발한 것이 이제 진짜 비즈니스 기회가 됐다. 아무도 인정하고 싶지 않은 냉혹한 현실은 이것이다: 대부분의 AI 생성 코드는 프로덕션 준비가 되어 있지 않다, 그리고 기업들은 기술 부채가 통제 불능으로 치닫기 전에 이를 바로잡을 전문가를 다급히 채용하고 있다.
Andrej Karpathy가 2025년 초 ‘vibe coding’을 처음 언급했을 때, 그는 개발자들의 새로운 업무 방식을 정확히 포착했다. 이제 개발자들은 직접 코드를 쓰기보다 AI와 대화하며 전체 함수를 생성한다. 자연어 프로그래밍을 통해 10배의 생산성 향상을 약속하는 접근법이다. GitHub에 따르면 현재 개발자의 92%가 AI 코딩 도구를 사용하며, Copilot만으로도 매달 수십억 라인의 코드가 생성되고 있다.
하지만 컨퍼런스에서는 아무도 말하지 않는 문제가 있다. GitClear가 1억 5천만 라인의 코드를 분석한 결과, AI 보조는 코드 churn(변동)을 41% 증가시키는 것으로 나타났다. 즉, 2주 안에 되돌려지거나 다시 작성되는 코드가 늘어난다는 뜻이다. 스탠퍼드 연구진은 AI 어시스턴트를 사용하는 개발자가 실제로는 훨씬 덜 안전한 코드를 작성하면서도 더 안전하다고 믿는 경향이 있음을 확인했다. 이 도구들은 나쁜 관행을 증폭시킨다: 입력 검증 부재, 구식 의존성, 그리고 시니어 엔지니어를 울게 만드는 아키텍처 결정들.
404 Media의 취재에 따르면 개발자들이 AI 생성 코드를 고치는 일로 커리어 자체를 구축하고 있다. Hamid Siddiqi는 동시에 15~20개의 클린업 프로젝트를 관리하며, 그가 ‘AI 스파게티’라고 부르는 것—일관성 없는 인터페이스, 중복 함수, 말이 되지 않는 비즈니스 로직—를 풀어내는 일에 프리미엄 요금을 청구한다. 소프트웨어 컨설팅 업체 Ulam Labs는 이제 ‘Vibe Coding 클린업’을 핵심 서비스로 홍보한다.
수요가 너무 높아 VibeCodeFixers.com 같은 전용 마켓플레이스까지 등장했다. 몇 주 만에 300명의 전문가가 가입했고 수십 건의 프로젝트가 매칭됐다. 창업자 Swatantra Sohni는 전형적인 고객을 이렇게 묘사한다. “OpenAI 크레딧 5,000달러를 다 태웠고, 반쯤만 작동하는 프로토타입에 정서적으로 집착하고 있으며, 어제라도 프로덕션에 넣어야 한다는 급박함이 있다.” TechCrunch는 현재 Y Combinator 배치의 25%가 코드베이스의 95%가량이 AI 생성 코드라고 보도하며, 실리콘밸리 전반에서 이 트렌드의 엄청난 규모를 부각했다.
근본 문제는 AI가 나쁜 코드를 쓴다는 데 있지 않다. 시스템 맥락을 이해하지 못한 채 국지적으로 최적화된 코드를 쓴다는 데 있다. Stack Overflow의 분석에 따르면 AI는 작고 고립된 작업에서는 뛰어나지만 아키텍처적 의사결정에서는 실패한다. 프롬프트 하나마다 기술 부채가 생긴다: 일관되지 않은 패턴, 중복된 로직, 자동 스캐너가 놓치는 보안 구멍들.
조지타운 대학 연구는 AI 생성 코드의 최소 48%가 보안 취약점을 포함한다고 보여준다. 도구는 비밀을 코드에 유출하고, 사용 중단된 라이브러리를 권장하며, 부하에서만 드러나는 경쟁 상태를 만든다. 더 나쁜 점은, 개발자들이 생성된 코드를 충분히 이해하지 못해 이런 문제들을 알아차리지 못한다는 것이다. Thoughtworks는 이것이 ‘역량 부채(competency debt)’를 만든다고 경고한다—팀이 충분히 이해하지 못하는 AI 생성 코드에 의존하게 되면서 자사 시스템을 스스로 유지보수할 능력을 잃게 되는 것이다.
바이브 코딩 클린업 시장은 빠르게 성장하고 있지만, 정확한 수치를 특정하기는 어렵다. 우리가 아는 것은 이것이다. Gartner는 2028년까지 엔터프라이즈 소프트웨어 엔지니어의 75%가 AI 코드 어시스턴트를 사용할 것이라고 예측한다. 그중 일부만 클린업이 필요하더라도—그리고 현재 데이터는 대부분이 그럴 것임을 시사한다—이것은 거대한 신흥 시장이다.
경제성도 매력적이다. 스타트업은 바이브 코딩으로 MVP까지 가는 시간을 몇 주 단축한 뒤, 비슷한 시간과 예산을 클린업에 쓴다. 그래도 전통적인 개발보다 빠르다. AI가 만들어낸 난장을 효율적으로 리팩터링할 수 있는 전문가라면 시간당 200~400달러의 요율을 받는다. 일부는 서비스를 제품화하고 있다: 고정가 클린업 패키지, AI 코드 감리, 그리고 ‘vibe-to-production’ 파이프라인.
Thoughtworks는 AI 보조와 함께 코드 churn은 늘어나는 반면 리팩터링 활동은 줄어들고 있으며, 대부분의 AI 보조 프로젝트가 프로덕션 이전에 대규모 클린업을 필요로 한다고 보고했다. 다수의 컨설팅 업체가 이제 ‘AI 코드 시정(remediation)’ 역할을 명시적으로 채용하고 있다. 이 시장은 실제로 존재하고, 성장 중이며, 아직 대부분 미개척 상태다.
우리는 소프트웨어가 만들어지는 방식의 근본적 변화를 목도하고 있다. AI가 초기 구현을 담당하고, 사람이 아키텍처, 테스트, 클린업을 담당하는 시대다. 기대했던 미래는 아니지만, 우리가 맞이한 현실이다.
Gergely Orosz는 AI 도구를 “매우 열정적인 주니어 개발자”에 비유한다. 코드를 빠르게 쓰지만 끊임없는 감독이 필요하다는 것이다. 차이는, AI 주니어는 결코 시니어가 되지 않는다는 점이다. 그들은 항상 클린업 전문가를 필요로 할 것이다.
이는 흥미로운 커리어 경로를 만든다. 바이브 코딩 클린업을 숙달한 주니어 개발자는 2년 안에 시니어급 연봉을 받을 수 있다. AI의 역량과 한계를 모두 이해하는 시니어 엔지니어는 대체 불가능해진다. 견고한 클린업 프로세스를 구축한 회사는 경쟁 우위를 확보한다.
Donado Labs는 바이브 코딩으로 빚어진 참사들을 충분히 수습해 본 덕분에 그 패턴을 알고 있다. AI 가속은 효과적이지만, 전문적 클린업이 프로세스에 내재화되어 있을 때만 그렇다. 우리는 프로토타이핑과 일상 작업에는 AI를 쓰지만, 아키텍처와 핵심 로직은 사람이 쓴다. 우리의 “Vibe to Production” 서비스는 AI 프로토타입을 엔터프라이즈급으로 끌어올린다: 제대로 된 테스트, 보안 강화, 그리고 후임자가 울지 않게 만드는 문서화.
AI 코딩으로 성공하는 회사는 사용량이 많은 회사가 아니라, 똑똑하게 사용하는 회사다. AI로 프로토타입을 만든 뒤, 기술 부채가 복리로 불어나기 전에 클린업에 투자한다. 그들은 바이브 코딩을 다른 도구와 마찬가지로 다룬다: 강력하지만 전문성이 없으면 위험한 것.
다음에 누군가가 AI가 프로그래머를 대체할 것이라고 말한다면, 코드 누가 치울 건지 물어보라. 진짜 기회는 그곳에 있다.