Claude Fable 5를 몇 시간 동안 시험해 본 뒤 얻은 초기 인상, 성능, 비용, Claude.ai와 Claude Code에서의 사용 사례, 그리고 실제 작업에 투입해 본 결과를 정리했다.
2026년 6월 9일
오늘 공개된 Claude Fable 5를 미리 써볼 수는 없었지만, 지난 약 5.5시간 동안 이것저것 시험해 봤다. 첫인상은 이 모델이 일종의 괴물 같다는 것이다. 느리고, 비싸고, 지금까지 내가 던져준 모든 일을 아주 태연하게 처리해 왔다. 요즘 최전선 모델들에서 자주 그렇듯, 진짜 과제는 이 모델이 못하는 일을 찾는 쪽이다.
먼저, 핵심 특성부터 살펴보자.
Anthropic은 Claude Fable 5가 Claude Mythos 5와 같은 성능을 제공하지만, 해로운 용도로 사용되지 않도록 훨씬 더 엄격한 가드레일이 적용되어 있다고 주장한다. 이 가드레일은 충분히 자주 발동되기 때문에 Claude API에는 그것에 걸렸을 때 알려주는 새로운 메커니즘이 추가되었고, 거절이 발생하면 자동으로 다른 모델로 폴백하도록 요청할 수 있는 새 메커니즘까지 들어갔다.
Claude Mythos 5도 오늘 함께 공개되었는데, Anthropic의 설명에 따르면 “안전 분류기 없이 Claude Fable 5의 기능을 공유한다”고 한다.
이 모델들은 100만 토큰 컨텍스트 윈도우, 최대 128,000 출력 토큰, 그리고 2026년 1월 지식 컷오프 날짜를 가진다.
가격은 Claude Opus 4.5/4.6/4.7/4.8의 두 배다. 입력 토큰은 백만 개당 10달러, 출력 토큰은 백만 개당 50달러다. 더 긴 컨텍스트 사용에 대한 가격 인상은 없다.
그 외에는 업그레이드 가이드가 Opus 4.8용 유사 가이드에 비해 훨씬 얇다.
Fable을 가장 잘 설명하는 방법은 이 모델이 크게 느껴진다는 것이다. 속도와 비용 면에서만이 아니라, 알고 있는 것의 양에서도 그렇다.
다음은 예시 프롬프트다. 나는 이것을 사용해 Fable의 지식을 Opus 4.8과 비교했다. 오타도 그대로 포함했다.
List all of Simon Willion's open source projects, most recent first, each with a rough date of when they were first released
Opus 4.8의 답변은 이렇게 시작했다.
Simon Willison의 오픈 소스 프로젝트 전체 목록을 신뢰할 수 있고 포괄적이며 날짜까지 검증된 형태로 가지고 있지는 않으며, 부정확한 날짜나 지어낸 항목을 제시할 위험을 감수하기보다는 그 점을 솔직하게 말하고 싶습니다.
합리적인 확신을 가지고 말씀드릴 수 있는 것은 다음과 같습니다.
Simon Willison의 잘 알려진 프로젝트:
LLM (~2023) – 대형 언어 모델과 상호작용하기 위한 명령줄 도구이자 Python 라이브러리입니다.
Datasette (~2017) – 데이터를 탐색하고 공개하기 위한 도구로, 아마도 그의 가장 두드러진 최근 프로젝트입니다.
sqlite-utils (~2018-2019) – SQLite 데이터베이스를 다루기 위한 Python 라이브러리 및 CLI 도구로, 종종 Datasette와 함께 사용됩니다.
Django (2005) – Adrian Holovaty와 함께 Django 웹 프레임워크를 공동 창시했으며, 원래 Lawrence Journal-World 신문사에서 개발되었습니다.
또한 그는 Datasette plugins의 대규모 생태계와 많은 소규모 유틸리티(
shot-scraper, 데이터를 가져오기 위한 다양한*-to-sqlite도구 등)를 관리하고 있습니다.
나쁘지 않다. 같은 프롬프트에 대해 Fable 5가 내놓은 답변의 시작 부분은 이랬다. 두 모델 모두 검색 접근 없이 실행했다.
아마 Simon Willison을 말씀하시는 것 같습니다 — 다작하는 오픈 소스 개발자이자 Django 공동 창시자, 그리고 Datasette의 창시자입니다.
먼저 중요한 단서를 말씀드리자면, 진정으로 완전한 목록을 만드는 것은 현실적으로 어렵습니다. Simon Willison은 악명 높을 정도로 다작합니다 — 그가 공개한 저장소는 수백 개에 이르고(Datasette만 해도 플러그인이 100개 이상이며, 그중 다수를 그가 직접 작성했습니다), 제 지식에는 컷오프 날짜가 있으므로 가장 최근 작업은 빠질 것입니다. 아래는 대략적인 최초 공개 날짜와 함께 정리한 그의 주요 프로젝트들입니다. 최신순으로 나열했습니다.
주요 프로젝트(대략적인 날짜)#
- files-to-prompt (2024년 4월) – 파일들을 하나의 프롬프트로 이어 붙여 LLM에 넣는 도구
- datasette-extract (2024) – LLM을 사용해 구조화된 데이터를 추출하는 플러그인
- LLM (2023년 5–6월) – 대형 언어 모델과 상호작용하기 위한 CLI 도구이자 Python 라이브러리이며, 대규모 플러그인 생태계도 보유함(llm-gpt4all, llm-mistral, llm-claude 등, 2023년 이후)
- symbex (2023년 6월) – 심볼 기준으로 Python 코드를 검색
- ttok 및 strip-tags (2023년 5월) – 토큰 수 계산과 HTML 정리를 위한 CLI 도구로, LLM 파이프라인에 사용됨
- datasette-lite (2022년 5월) – WebAssembly/Pyodide를 통해 브라우저 안에서 완전히 실행되는 Datasette
- shot-scraper (2022년 3월) – Playwright를 이용한 웹사이트 스크린샷 자동화
- s3-credentials (2021년 11월) – 범위가 제한된 AWS S3 자격 증명을 만드는 CLI
- django-sql-dashboard (2021) – Django용 SQL 리포팅 대시보드
- Dogsheep suite (2019) – 개인 분석 도구 모음: twitter-to-sqlite, github-to-sqlite, healthkit-to-sqlite, dogsheep-beta 등
- sqlite-utils (2018) – SQLite 데이터베이스를 다루기 위한 CLI 및 Python 라이브러리
- Datasette (2017년 11월) – 그의 대표 프로젝트로, 데이터를 탐색하고 공개하기 위한 도구
- csvs-to-sqlite (2017) – CSV 파일을 SQLite로 변환
- Various early tools (~2007–2010) – soupselect, json-head, geocoders 등
- Django (2003–2005년에 개발, 2005년 7월 오픈 소스 공개) – Lawrence Journal-World에서 Adrian Holovaty와 공동 창시
(참고로 GPT-5.5도 있다. Fable보다 더 많은 프로젝트를 나열했다!)
예전부터 나는 모델이 얼마나 많은 것을 _아는지_에는 관심이 없다고 말해 왔다. 내가 원하는 것은 모델이 텍스트와 코드를 유용하게 다루고, 필요한 정보는 검색 도구를 통해 적극적으로 찾아보는 능력이지, 그런 정보를 가중치 안에 구워 넣는 것이 아니다.
하지만 이런 식의 지식량은 모델 크기를 가늠하는 꽤 괜찮은 대리 지표다. 파라미터 수가 더 많으면 세상에 대한 더 많은 세부사항을 집어넣을 수 있다.
_더 많은 것을 안다_는 사실이 우리가 던지는 과제에서 더 낫다는 뜻일까? 현대적인 라이브러리와 패턴에 대한 지식이 더 깊은 코딩 모델이라면 실제 코딩 작업을 더 효과적으로 밀어붙일 수 있으리라는 점은 충분히 상상할 수 있다.
Fable이 정말 Opus보다 더 큰가? Anthropic은 모델 크기에 대해 아무 말도 하지 않았으니 우리가 가진 것은 정황뿐이다. 하지만 속도, 가격, 그리고 내가 직접 찔러본 지식의 양을 보면 이건 대형 모델이라는 생각이 든다. 어쩌면 지금까지 어느 벤더가 내놓은 것 중 가장 큰 모델일지도 모른다.
Anthropic은 Fable 5를 자사 모든 표면에 제공했다. Claude.ai 채팅 인터페이스, 웹용 Claude Code, Claude Code CLI, 그리고 Claude Cowork에서도 쓸 수 있다. 이 모델은 구독 플랜에서 “6월 22일까지” 이용 가능하며(나는 현재 월 100달러 Max를 쓰고 있다), 그 이후에는 추가 과금된다.
Claued.ai는 종종 과소평가된다. 2025년 9월 이후로 모든 채팅은 코드를 실행할 수 있는 완전한 컨테이너 환경에 접근할 수 있었고, 추가 패키지를 설치하거나 GitHub에서 저장소를 직접 클론하는 것도 가능했다.
지난주에 micropython-wasm을 공개했다. 이것은 wasmtime을 사용해 WebAssembly 안에서 커스텀 빌드의 MicroPython을 실행함으로써, 신뢰할 수 없는 PYthon 코드를 위한 샌드박스로 동작하는 Python 라이브러리다.
나는 Fable이 이것을 MicroPython이 아니라 완전한 Python 실행으로 업그레이드할 수 있는지 보기로 했다. 다음 프롬프트로 시작했다.
Clone simonw/micropython-wasm from GitHub and research how this could use a full Python as opposed to MicroPython
Fable은 이를 위해 Brett Cannon의 cpython-wasi-build 빌드를 사용할 수 있다고 파악했지만, 환경 제한 때문에 스스로 그것을 다운로드할 수는 없었다.
그래서 나는 그 페이지에서 zip 파일 두 개를 받아 Claude에 업로드했다.
Here's the Brett Cannon builds(python-3.zip,_build-python-3.zipas attachments)
그러자 끝이었다. 몇 분 동안 열심히 돌더니 전체를 다 작동하게 만들었다.
응답의 일부에는 이런 내용이 있었다.
파일시스템 표면을 줄이기 위해 더 깔끔한 단일 zip stdlib 접근도 시도해 보았지만, CPython의
getpath부트스트랩이 추가적인 prefix 조정 없이는 zip 내부에서encodings를 찾지 못합니다. 디렉터리 preopen 방식은 안정적으로 작동하므로 PoC는 그것을 사용합니다. zip 경로도 해결 가능하지만_PYTHONHOME/frozen-getpath 작업이 필요합니다.
그래서 나는 이렇게 말했다.
Try a bit more at the single-zip-stdlib problem
그리고 조금 뒤에는 이렇게 말했다.
I want a wheel that has the whole system in it, the Python wrappers and the WASM files and the stdlibrary, so I can do uv run --with path-to-whl python -c "demo code"
...그러자 이 13.9MB cpython_wasm-0.1.0-py3-none-any.whl 파일을 만들어 줬다. 아래처럼 그 wheel URL과 uv를 사용해 샌드박스 안에서 Python 코드를 실행해 볼 수 있다.
uv run --with https://static.simonwillison.net/static/cors-allow/2026/cpython_wasm-0.1.0-py3-none-any.whl \
cpython-wasm -c 'print(45 ** 56)'
이건 정말 강력한 출발이었다.
오늘이 Fable 공개일이라는 걸 알아차리기 전, 오늘의 스트레치 골은 Datasette Agent에 새 기능을 추가하는 것이었다. 이 에이전트 소프트웨어 안의 도구 호출이 실행 도중 일시정지하고, 사용자에게 직접 승인을 요청할 수 있게 만들고 싶었다.
새 모델에게 던져주기엔 꽤 묵직한 과제처럼 느껴졌다.
하루 동안 Fable은 그 문제를 해결했을 뿐 아니라, 이런 종류의 고급 일시정지-재개 메커니즘을 도구 호출에서 지원하는 데 도움이 되는 내 기반 LLM 라이브러리의 이슈 여섯 개도 찾아내고 실제로 반영했다.
처음에는 다소 험한 해킹으로 모든 것을 작동하게 만들었지만, LLM 자체에 대한 변경도 범위 안에 있다고 내가 말하자마자 그 해킹을 하나씩 풀어내며 대신 LLM의 공식 지원 기능으로 바꾸기 시작했다.
내 스트레치 골은 거의 전부 Fable이 작성한 LLM 0.32a3로 바뀌었다. 릴리스 노트는 다음과 같다.
Datasette Agent의 human-in-the-loop
ask_user()기능 요구에 따라, 도구 호출 동작 방식을 다음과 같이 개선했습니다.
- 도구 구현은 이제
llm_tool_call이라는 이름의 파라미터를 선언할 수 있으며, 그러면 현재 호출에 대한llm.ToolCall객체가 전달됩니다. 이를 통해 현재llm_tool_call.tool_call_id에 접근할 수 있습니다. 도구 내부에서 tool call에 접근하기 참고. #1480- 이제 모든 도구 호출에는 고유한
tool_call_id가 보장됩니다. 이를 제공하지 않는 프로바이더의 경우tc_접두사가 붙은 ULID가 합성됩니다. #1481- 도구는 이제
llm.PauseChain예외를 발생시켜 도구 체인을 깔끔하게 일시정지할 수 있으며, 사람의 승인을 기다리는 등의 용도에 유용합니다. 이 예외는.tool_call과.tool_results(완료된 형제 결과)가 첨부된 상태로 호출자에게 전파되며, 자리표시자 결과를 넣은 채 모델 호출이 이뤄지지 않습니다. 도구 내부에서 체인 일시정지하기 참고. #1482- 동시 도구 실행의 실패 의미론: 비동기 형제 도구 호출은 일시정지나 훅 예외가 전파되기 전에 항상 끝까지 실행됩니다. #1482
- 이제 체인은 해결되지 않은 도구 호출로 끝나는
messages=히스토리에서 재개할 수 있습니다. 첫 번째 모델 호출 전에 일반적인before_call/after_call절차를 통해 그 호출들이 실행되며, 이미 결과가 있는 것은 건너뜁니다.execute_tool_calls()메서드는 이제 응답이 요청한 호출 대신 명시적ToolCall객체 목록을 실행하기 위한 새로운 선택적tool_calls_list=인자도 받습니다. 보류 중인 도구 호출이 있는 체인 재개하기 참고. #1482- 비동기 도구 실행기가
tools=에 없는 도구 호출을 조용히 버리던 버그를 수정했습니다. 이제 이 경우 sync 실행기와 동일하게Error: tool "..." does not exist결과를 반환합니다. #1483
Fable이 여기서 구성한 API 설계, 테스트, 코드, 문서화의 품질에 정말 감탄했다. 오늘 몇 시간을 여기에 썼지만, 체감상 며칠치 작업을 해낸 느낌이다.
최근에는 다양한 코딩 에이전트 전반에서 내 로컬 LLM 사용량을 추적하기 위해 AgentsView를 쓰기 시작했다. 오늘은 그 도구에 사용자 정의 Fable 가격을 추가하는 TIL도 공개했다. 아주 가까운 미래에는 아마 이런 작업이 필요 없을 것 같다.
가격을 설정한 뒤, 사용량을 탐색하기 위해 localhost 웹 서버를 띄우는 다음 명령을 실행했다.
uvx agentsview serve
다음은 오늘 여러 프로젝트에 걸친 Fable 사용량의 분해를 보여주는 트리맵이다.
![이미지 1: 두 개의 패널이 있는 비용 추적 대시보드 스크린샷. 첫 번째 패널의 제목은 "Cost Attribution"이며, Project / Model / Agent와 Treemap / List 토글 버튼이 있고 Project와 Treemap이 선택되어 있다. 이탤릭 텍스트로 "Click to hide from chart"가 보인다. 트리맵에는 prod_datasette_agent $99.26 89.9%라고 표시된 커다란 빨간 블록이 있고, 오른쪽에 cloud(파랑), datasette(청록), llm(빨강), money(분홍)라고 표시된 더 작은 블록들이 있으며, 아주 얇은 주황색 조각도 있다. 범례에는 다음이 나열되어 있다: 1 prod_datasette_agent $99.26, 2 cloud $3.98, 3 datasette $2.81, 4 llm $2.30, 5 money $1.92, 6 simon $0.15. 두 번째 패널의 제목은 "Top Sessions by Cost"이며, 아홉 개의 세션이 나열되어 있다. 각 세션에는 "Claude" 배지, 프롬프트 발췌, 프로젝트 이름과 세션 UUID(여기서는 생략), 토큰 수, 비용이 있다: 1. Review ./datasette-agent and ./datasette-apps - we are going to add a new feature to agent but you ... prod_datasette_agent, 78.2M, $99.26. 2. issues.db is a copy of the Datasette issues database. There are a LOT of notes in there relating to... datasette, 826.8k, $2.81. 3. Consult fly-docs and then look at datasette.cloud (which launches fly machines) and datasettecloud-... cloud, 924.7k, $2.61. 4. simonwillisonblog.db is a copy of my blog, plus all my software releases and other interesting thin... money, 542.9k, $1.92. 5. Look in datasette.cloud and figure out all remaining steps and decisions that need to be made in or... cloud, 455k, $1.37. 6. Review PRs and issues filed against this repo within the last 4 weeks and see if any deserve to be ... llm, 323.3k, $0.95. 7. run mypy, llm, 320.9k, $0.76. 8. [Image #1] fix this in github actions, llm, 183.9k, $0.59. 9. simon, simon, 26.4k, $0.15.](https://static.simonwillison.net/static/2026/agentsview-fable-full-day.jpg)
오늘 사용한 토큰 비용은 110.42달러였고, 전부 월 100달러 구독의 일부로 처리되었다.
Fable의 다섯 가지 thinking effort 레벨 전부에 대해 “Generate an SVG of a pelican riding a bicycle”를 실행해 봤다.
결과는 이 문서에서 볼 수 있다.