AI 진전의 다섯 가지 지표를 각각 쌍곡선 모델로 적합해 ‘극점’으로 휘어지는 유일한 지표를 찾고, 밀리초 정밀도의 특이점 날짜와 그 의미(기술이 아닌 인간의 관심이 가속되고 있다는 주장)를 제시한다.
URL: https://campedersen.com/singularity
Title: The Singularity will Occur on a Tuesday

"잠깐, 특이점이라는 게 그냥 인간들이 패닉에 빠지는 거라고?" "항상 그랬지."
샌프란시스코의 모두가 특이점 얘기를 한다. 디너 파티에서, 커피숍에서, 왜인지 애슈턴 커처가 나타난 OpenClaw 밋업에서까지. 대화의 형태는 늘 같다. 누군가는 곧 온다고 하고, 누군가는 과장이라고 하고, 아무도 숫자를 내놓지 않는다.
이건 질문이 잘못됐다. 만약 일이 가속하고 있다면(그리고 측정 가능한 수준으로 실제로 그렇다) 흥미로운 질문은 ‘오는가’가 아니라 ‘언제인가’다. 그리고 가속하고 있다면, 우리는 정확히 언제인지 계산할 수 있다.
나는 AI 진전의 실제 지표 5개를 모아 각각에 독립적으로 쌍곡선 모델을 맞춰 보았고, 그중 극점(pole)을 향해 진짜 곡률을 보이는 지표를 찾았다. 날짜는 밀리초 정밀도다. 카운트다운이 있다.
(이게 제정신이 아니라는 건 안다. 그래도 한다.)
내가 ‘인간적(anthropic) 유의미성’이라고 부르는 기준으로 고른 지표 5개(여기서 anthropic은 기업 이름이 아니라 그리스어 의미(“인간에 관한”)다. 다만 데이터셋에 그 회사들이 수상할 정도로 자주 등장하긴 한다):
MMLU 벤치마크 점수(% 정답)
GPT-3 Jun 2020 43.9 Chinchilla Mar 2022 67.5 GPT-4 Mar 2023 86.4 Gemini Ultra Dec 2023 83.7 Claude 3 Opus Mar 2024 86.8 Claude 3.5 Sonnet Jun 2024 88.7 o1 Sep 2024 90.8 DeepSeek-R1 Jan 2025 90.8 GPT-4.5 Feb 2025 89.6 GPT-4.1 Apr 2025 90.2 Claude Opus 4 May 2025 88.8 Claude Opus 4.5 Nov 2025 90.8
달러당 출력 토큰 수(tokens/$)
GPT-3 (davinci)Jun 2020 16,667 GPT-3.5 Turbo Mar 2023 500,000 GPT-4 Mar 2023 16,667 GPT-4 Turbo Nov 2023 33,333 GPT-4o May 2024 66,667 Claude 3.5 Sonnet Jun 2024 66,667 Gemini 2.0 Flash Dec 2024 2,500,000 DeepSeek-R1 Jan 2025 456,621 GPT-4.5 Feb 2025 6,667 Gemini 2.5 Pro Mar 2025 100,000 GPT-4.1 Apr 2025 125,000 Claude Sonnet 4 May 2025 66,667 Claude Opus 4.5 Nov 2025 40,000 Claude Opus 4.6 Feb 2026 40,000
프론티어 릴리스 간격(일)
GPT-3 → ChatGPT Nov 2022 902 ChatGPT → GPT-4 Mar 2023 104 GPT-4 → Claude 2 Jul 2023 119 → Claude 3 Opus Mar 2024 89 → o1 Sep 2024 84 → Gemini 2.0 Dec 2024 90 → DeepSeek-R1 Jan 2025 40 → GPT-4.5 Feb 2025 38 → Gemini 2.5 Pro Mar 2025 26 → GPT-4.1 Apr 2025 20 → Claude Sonnet 4 May 2025 38 → Claude Opus 4.5 Nov 2025 186 → Claude Opus 4.6 Feb 2026 73
각 지표는 [0,1]로 정규화. 릴리스 간격은 반전(짧을수록 좋음). 달러당 토큰 수는 정규화 전에 로그 변환(원값이 5자릿수(orders of magnitude) 범위를 가로지르며, 로그를 안 쓰면 250만 tokens/$의 Gemini Flash가 적합을 지배하고 나머지는 잡음이 된다). 각 시계열은 자체 스케일을 유지하며, 하나의 앙상블로 합치지 않는다.
대부분의 사람들은 AI를 지수(exponential)로 외삽한다. 잘못된 선택이다!
지수 함수 f(t)=a e^{bt}는 t→∞에서만 무한대로 간다. 즉, 영원히 기다리게 된다. 말 그대로.
우리에겐 ‘유한한’ 시간에 무한대에 도달하는 함수가 필요하다. 특이점(singularity)의 요지가 바로 그것이다. 극점(pole), 수직 점근선, 수학이 깨지는 지점:
x(t)= \frac{k}{t_s - t} + c
t→t_s^-이면 분모가 0으로 간다. x(t)→∞. 버그가 아니다. 바로 그게 ‘기능’이다.
5개 지표에 걸친 52개 데이터 포인트를 x_j(t) = k_j / (t_s − t) + c_j에 적합했다.
다항식 성장(t^n)은 유한한 시간에 무한대에 도달하지 않는다. 열사(heat death)까지 기다려도 t^{47}은 여전히 유한하다. 다항식은 AGI가 “수십 년 뒤”라고 믿는 사람들을 위한 것이다.
지수 성장은 t=∞에서 무한대가 된다. 기술적으로는 특이점이지만, 무한히 인내심 많은 특이점이다. 무어의 법칙은 지수였다. 우리는 더 이상 무어의 법칙 위에 있지 않다.
쌍곡선 성장은 성장하는 대상이 자기 자신의 성장을 ‘가속’할 때 나타난다. 더 나은 AI → 더 나은 AI 연구 도구 → 더 나은 AI → 더 나은 도구. 초선형(supralinear) 동역학을 가진 양의 피드백. 특이점은 실제이며 유한하다.
절차는 간단하다. 그게 당신을 불안하게 해야 한다.
모델은 각 지표에 대해 별도의 쌍곡선을 적합한다:
y_i^{(j)} = \frac{k_j}{t_s - t_i} + c_j
각 시계열 j는 고유한 스케일 k_j와 오프셋 c_j를 갖는다. 특이점 시각 t_s는 공유한다. MMLU 점수와 달러당 토큰 수를 같은 y축에 올릴 이유는 없지만, 극점이 ‘언제’인지에 대해서는 합의할 수 있다.
각 후보 t_s에 대해 시계열별 적합은 k_j와 c_j에 대해 선형이다. 질문은 이것이다: 어떤 t_s가 쌍곡선을 가장 잘 맞추는가?
아무도 말해주지 않는 특이점 적합의 비밀: 대부분의 지표에는 실제로 특이점이 없다. 모든 시계열을 합친 총 RSS를 최소화하면, 최적 t_s는 언제나 무한대로 간다. 멀리 있는 쌍곡선은 직선으로 퇴화하고, 직선은 잡음 데이터도 그럭저럭 잘 맞춘다. 그 결과 “특이점 날짜”는 당신이 설정한 탐색 경계가 된다. 특이점을 찾는 게 아니라, 탐색 격자의 끝을 찾게 된다.
그래서 대신 ‘진짜 신호’를 찾는다. 각 시계열을 독립적으로 두고, t_s를 그리드 서치해서 R² 피크를 찾는다. 즉, 근처의 다른 대안들보다 쌍곡선이 ‘더 잘’ 맞는 날짜다. 시계열이 실제로 극점을 향해 휘고 있다면, R²는 어떤 유한한 t_s에서 최대가 된 뒤 감소한다. 정말로 선형이라면, R²는 t_s→∞로 갈수록 계속 증가하며 결코 피크를 만들지 않는다. 피크가 없으면 신호도 없고, 투표권도 없다!
피크를 보이는 시계열이 하나 있다! arXiv의 “emergent”(emergence에 관한 AI 논문 수)는 명확하고 애매함 없는 R² 최대값을 갖는다. 나머지 네 개는 직선이 단조롭게 더 잘 맞는다. 특이점 날짜는 실제로 쌍곡선이 되는 그 단 하나의 지표에서 나온다.
이 방식은, 어떤 지표도 개별적으로는 지지하지 않는 날짜를 억지로 5개 평균으로 만들어내는 것보다 더 정직하다.
같은 입력 → 같은 날짜. 결정론적이다. 확률적 요소는 모델이 아니라 우주에 있다.
특이점은 다음에 발생한다:
2034년 7월 18일 화요일
02:52:52.170 UTC
n = 5개 시계열에 걸친 52개 데이터 · 95% CI: 2030년 1월–2041년 1월(132.4개월 범위)
MMLU: R²=0.747 Tokens/$: R²=0.020 Release gaps: R²=0.291 arXiv "emergent": R²=0.926 Copilot code share: R²=1.000
적합이 수렴했다! 공유된 t_s에서 각 시계열은 고유한 R²를 갖기 때문에, 쌍곡선이 무엇을 잘 포착하고 무엇을 못 포착하는지 정확히 볼 수 있다. 중요한 건 arXiv의 R²다. 실제로 피크를 만든 시계열이기 때문이다.
95% 신뢰구간은 t_s에 대한 프로파일 우도(profile likelihood)에서 나온다. 특이점 날짜를 앞뒤로 미끄러뜨려 적합이 F-임계값을 넘어 악화될 때까지 본다.
3078일
:
21시간
:
28분
:
46초
.
882밀리초
2034년 7월 18일 화요일 02:52:52.170 UTC까지
지표 하나를 통째로 빼면 날짜는 얼마나 움직일까?
드롭-원-아웃 민감도(Drop-One-Out Sensitivity)
| 제외 | 새 t_s | 변화 |
|---|---|---|
| MMLU | 2034년 7월 | +0.0개월 |
| Tokens/$ | 2034년 7월 | +0.0개월 |
| Release gaps | 2034년 7월 | +0.0개월 |
| arXiv "emergent" | 2036년 2월 | +18.6개월 |
| Copilot code share | 2034년 7월 | +0.0개월 |
단일 시계열을 뺐을 때 t_s가 몇 년씩 움직인다면, 그 시계열이 모든 일을 하고 있었다는 뜻이다. 변화가 0이라면, 애초에 그 시계열에는 신호가 없었다.
표는 이야기를 분명히 말해준다. arXiv가 전부를 하고 있다. 이걸 빼면 날짜는 탐색 경계로 점프한다(남은 시계열 중 유한한 피크를 갖는 것이 없기 때문). 다른 걸 빼면 아무것도 움직이지 않는다. 그것들은 날짜에 기여한 적이 없고, 공유된 t_s에서의 ‘맥락 곡선’만 제공했을 뿐이다.
참고: Copilot은 데이터 포인트가 정확히 2개이고 파라미터도 2개(k와 c)라서 어떤 쌍곡선이든 완벽하게 맞는다. RSS 0, t_s에 영향 0. 그냥 동승 중이다!
모델은 t_s에서 y→∞라고 말한다. 하지만 arXiv의 emergence 논문 수에서 “무한대”는 무슨 뜻인가? 2034년 화요일에 논문이 무한히 많이 출판된다는 뜻이 아니다.
그건 모델이 깨진다는 뜻이다. t_s는 현재 궤적의 곡률이 더는 유지될 수 없는 지점이다. 시스템은 질적으로 새로운 무언가로 돌파하거나, 포화에 도달해 쌍곡선이 틀렸던 것이 된다. 물리적 예측이 아니라 상전이(phase transition) 마커다.

t_s는 그가 아래를 내려다보는 순간이다.
하지만 당신을 불편하게 해야 할 부분은 이것이다: 실제로 쌍곡선으로 가고 있는 지표는 기계의 능력이 아니라 인간의 ‘관심’이다.
MMLU, 달러당 토큰 수, 릴리스 간격. 실제 능력과 인프라 지표들. 전부 선형이다. 극점도 없고, 특이점 신호도 없다. 유한한 날짜를 가리키는 유일한 곡선은 emergence에 관한 논문 수다. 연구자들이 새로운 행동을 알아차리고 이름 붙이는 것. 밈적으로 측정된 분야의 흥분도.
데이터가 말하는 바: 기계는 일정한 속도로 개선되고 있다. 인간은 그것에 대해, 스스로의 가속을 더 가속하는 방식으로, 점점 더 빠르게 패닉에 빠지고 있다.
사람들이 논쟁하는 특이점과는 아주 다른 특이점이다.
t_s가 AI의 놀라움 속도가 인간이 처리할 수 있는 능력을 초과하는 순간을 표시한다면, 흥미로운 질문은 기계에 무슨 일이 생기느냐가 아니다. 우리에게 무슨 일이 생기느냐다.
그리고 불편한 답은: 이미 일어나고 있다는 것이다.

노동 시장은 조정되고 있는 게 아니다. ‘뚝’ 하고 부러지고 있다. 2025년에 110만 건의 해고가 발표됐다. 1993년 이후 그 기준을 넘긴 건 여섯 번째뿐이다. 그중 55,000건 이상이 명시적으로 AI를 이유로 들었다. 하지만 HBR은 기업들이 AI의 성능이 아니라 _잠재력_을 근거로 인력을 줄이고 있음을 발견했다. 대체는 ‘예상에 기반한’ 것이다. 곡선이 극점에 도달할 필요는 없다. 그저 도달할 것처럼 보이기만 하면 된다.
제도는 따라잡지 못한다. EU AI Act의 고위험 규정은 이미 2027년으로 연기됐다. 미국은 2025년 1월에 자체 2023년 AI 행정명령을 철회한 뒤, 12월에 주(州) 법을 선제하려는 새 명령을 냈다. 그러나 캘리포니아와 콜로라도는 어쨌든 각자 가고 있다. 지금 쓰이는 법은 2023년의 문제를 규제한다. 입법이 GPT-4를 따라잡을 즈음이면 우리는 GPT-7에 있다. 정부가 눈에 띄게 따라잡지 못하면 신뢰는 조금씩 깎이는 게 아니다. 붕괴한다. 전 세계 AI 신뢰도는 56%로 떨어졌다.
자본은 닷컴 버블 수준으로 집중되고 있다. 2025년 S&P 500 상위 10개 종목(거의 모두 AI 인접)이 지수 비중 40.7%에 도달해 닷컴 피크를 넘어섰다. ChatGPT 출시 이후 AI 관련 주식은 S&P 500 수익의 75%, 이익 성장의 80%, 설비투자 성장의 90%를 가져갔다. 실러 CAPE는 39.4다. 마지막으로 이 정도였던 때는 1999년이다. 유입되는 돈은 AI가 실제로 초지능에 도달할 필요가 없다. 충분한 사람들이 곡선이 계속 위로 간다고 믿기만 하면 된다.
사람들은 ‘맥’을 잃고 있다. 치료사들은 FOBO(Fear of Becoming Obsolete, 쓸모없어질 것에 대한 공포)가 급증하고 있다고 보고한다. 임상적 언어가 인상적이다. 환자들은 이를 _“우주가 ‘너는 더 이상 필요 없다’고 말하는 것”_처럼 묘사한다. 미국 노동자의 60%는 AI가 일자리를 더 많이 없애고 덜 만들 것이라 믿는다. AI 사용은 전년 대비 13% 늘었지만, AI에 대한 신뢰는 18% 감소했다. 더 많이 쓸수록 덜 믿는다.
인식론(epistemics)이 금 가고 있다. AI 연구의 3분의 1도 재현 가능하지 않다. 연구자의 5% 미만만 코드 공유를 한다. 기업 연구소는 출판을 줄이고 있다. 프론티어 랩이 아는 것과 대중이 아는 것 사이의 격차가 커지고, 정책을 만드는 사람들은 이미 구식이 된 정보에 기반해 움직인다. 의회에서 증언하는 전문가들이 서로 모순되는 것은, 분야가 전문성이 형성되는 속도보다 더 빨리 움직이기 때문이다.
정치가 재정렬되고 있다. TIME은 포퓰리즘적 AI 반발을 다룬다. Foreign Affairs는 “다가오는 AI 반발: 분노 경제가 포퓰리즘을 어떻게 가속할 것인가”를 실었다. HuffPost는 AI가 2026년 중간선거를 규정할 거라고 말한다. MAGA는 AI가 친기업인지 반노동인지에 대해 분열하고 있다. 샌더스는 데이터센터 모라토리엄을 제안했다. 기존의 좌우 축은, 애초에 답하도록 만들어지지 않은 질문의 무게 아래서 휘어지고 있다.
이 모든 일은 t_s보다 8년 앞서 벌어지고 있다. 사회적 특이점이 기술적 특이점을 앞지른다. 제도적·심리적 혼란은 능력이 수직으로 치솟기를 기다리지 않는다. _궤적_이 읽히는 순간 시작된다.
t_s의 극점은 기계가 초지능이 되는 순간이 아니다. 인간이 기계에 대해 일관된 집단적 결정을 내릴 능력을 잃는 순간이다. 실제 능력은 거의 부차적이다. 사회적 직물은 모델 성능의 프론티어가 아니라, 주의(attention)와 제도적 반응 시간의 이음새에서 풀린다.
날짜는 한 시계열에서 나온다. arXiv “emergent”만이 진짜 쌍곡선 곡률을 보인다. 나머지 네 개는 직선이 더 잘 맞는다. 특이점 날짜는 사실상 “AI emergence 연구가 수직으로 간다는 날짜”다. 분야의 흥분도가 선행 지표인지 후행 지표인지가, 이것이 의미가 있는지의 핵심이다.

모델은 정상성(stationarity)을 가정한다. 날씨가 계속 ‘변화할 것’이라고 가정하는 것과 같다. 곡선은 로지스틱으로 굽을 수도(과열이 포화) 있고, 모델이 표현할 수 없는 다른 형태로 바뀔 수도(진짜 상전이) 있다. t_s는 현재 레짐이 계속될 수 없는 지점을 표시할 뿐, 그 다음을 말해주지 않는다.
MMLU는 천장에 도달 중이다. 벤치마크 포화는 첨도(leptokurtic) 압축 아티팩트를 만든다. MMLU의 낮은 R²는 이를 반영한다. 포화 데이터에 쌍곡선은 잘못된 모양이다.
달러당 토큰 수는 로그 변환(값이 5자릿수 범위) 했고 비단조적이다(GPT-4가 3.5보다 더 비쌌고, Opus 4.5는 DeepSeek-R1보다 비싸다). 비용 곡선은 매끈하지 않다. 파레토식 진보가 있고, 그 사이사이에 “이번 건 더 많이 썼다”가 있다.
지표 5개는 충분하지 않다. 진짜 쌍곡선 곡률을 가진 시계열이 더 많을수록 날짜는 arXiv 하나에 덜 의존하게 된다. 제대로 된 연구라면 SWE-bench, ARC, GPQA, 컴퓨트 구매, 인재 연봉 등을 추가할 것이다. 나는 표에 들어갈 정도라서 5개를 썼다.
Copilot은 데이터 포인트가 두 개뿐이다. 파라미터 두 개, 점 두 개, 자유도 0, RSS 기여 0. 민감도 분석이 ‘상관없음’을 확인해준다.
실제 데이터. 실제 모델. 실제 날짜!
수학은 특정한 날, 특정한 밀리초에 극점을 향해 휘어지는 하나의 지표를 찾았다. 인간이 emergent AI 행동을 발견하는 속도다. 다른 네 지표는 선형이다. 기계는 꾸준히 개선된다. 가속하는 건 우리다!
그 가속의 사회적 결과(노동 대체, 제도 실패, 자본 집중, 인식론 붕괴, 정치 재정렬)는 2034년에 대한 예측이 아니다. 2026년의 묘사다. 데이터 속의 특이점은 인간의 주의(attention) 속 특이점이며, 이미 닿는 모든 것에 중력을 행사하고 있다.
완벽하게 좋은 타이머 앞에서 인식론적 겸손이 방해하도록 둘 이유는 없다.
반대편에서 보자!