Claude Opus 4.8 소개

Claude Opus를 새로운 버전인 Claude Opus 4.8로 업그레이드합니다. 이 버전은 Opus 4.7을 기반으로 벤치마크 전반에서 개선되었으며, 더 효과적인 협업자입니다. 오늘부터 동일한 가격으로 사용할 수 있습니다.

Opus 4.8은 여러 새로운 기능과 함께 출시됩니다. claude.ai의 사용자는 이제 Claude가 작업에 들이는 노력의 양을 제어할 수 있습니다. Claude Code에는 매우 대규모의 문제를 해결할 수 있게 해주는 새로운 “dynamic workflows” 기능이 추가되었습니다. 또한 Opus 4.8의 fast mode는 모델이 2.5배 속도로 작업할 수 있는 모드로, 이전 모델들보다 이제 세 배 더 저렴합니다.

Opus 4.8의 기능

아래 표는 Opus 4.8이 코딩, 에이전트형 기술, 추론, 실용적인 지식 작업 과제의 테스트에서 이전 버전 및 다른 모델들과 어떻게 비교되는지 보여줍니다. 더 자세한 내용과 훨씬 더 폭넓은 기능 평가 결과는 Claude Opus 4.8 System Card에서 확인할 수 있습니다.

Opus 4.8과 협업하기

초기 테스터들은 Claude Opus 4.8이 에이전트형 작업을 수행할 때 더 신뢰할 수 있고 판단력이 더 날카롭다고 평가했습니다. 아래에는 Opus 4.8과 협업한 경험에 대한 여러 테스터들의 의견이 담겨 있습니다.

Image 2: logo

Claude Opus 4.8은 판단력이 눈에 띄게 더 좋습니다. Claude Code에서는 올바른 질문을 하고, 자신의 실수를 잡아내며, 계획이 타당하지 않을 때 이의를 제기하고, 큰 변경을 하기 전에 복잡한 다중 서비스 탐색에 대한 확신을 쌓습니다. 함께 구축하기에 훌륭한 모델입니다.

Image 3: logo

우리의 Super-Agent 벤치마크에서 Claude Opus 4.8은 모든 사례를 처음부터 끝까지 완수한 유일한 모델이었으며, 비용 동일 조건에서 이전 Opus 모델들과 GPT-5.5를 능가했습니다. 번역, 심층 리서치, 슬라이드 제작, 분석용 에이전트 제품에서 강력한 신뢰성을 제공합니다.

Image 4: logo

CursorBench에서 Claude Opus 4.8은 모든 effort 수준에서 이전 Opus 모델들을 능가합니다. 도구 호출은 같은 지능으로 더 적은 단계만 사용해 의미 있게 더 효율적이며, 처음부터 끝까지 과제를 완수합니다.

Image 5: logo

Claude Opus 4.8은 우리의 Legal Agent Benchmark에서 기록된 최고 점수를 달성했으며, all-pass 기준에서 전체적으로 10%를 넘긴 첫 번째 모델입니다. 실질적인 법률 업무에서 이는 고객이 실제 변호사 업무를 얼마나 안심하고 위임할 수 있는지에 직접 연결되는 정확도 향상입니다.

Image 6: logo

Claude Opus 4.8은 Opus 4.7에 비해 삶의 질을 크게 높여주는 업데이트처럼 느껴집니다. 더 빠르고, 협업하기 쉬우며, 긴 세션 동안 맥락과 스타일 지시를 더 잘 유지합니다. Opus 4.8은 목소리, 취향, 기술적 실행이 모두 나란히 이루어져야 하는 작업에서 제가 계속 신뢰하게 된 모델입니다.

Image 7: logo

Claude Opus 4.8은 우리가 테스트한 컴퓨터 사용 및 브라우저 에이전트 모델 가운데 가장 강력하며, Online-Mind2Web에서 84%를 기록해 Opus 4.7과 GPT-5.5 모두를 의미 있게 뛰어넘었습니다. 고객의 에이전트 워크로드가 처음부터 끝까지 신뢰 가능해야 하는 방식에 맞게, 반성적으로 사고하면서도 작업에 집중합니다.

Image 8: logo

Claude Opus 4.8은 도구를 깔끔하게 사용하고, 무인으로 계속 실행되어야 하는 우리의 자율 엔지니어링 워크로드에 필요한 일관성으로 지시를 따릅니다. Opus 4.6보다 개선되었고, Opus 4.7에서 보았던 댓글 과다 및 도구 호출 문제를 해결했습니다. Anthropic의 이번 출시는 Devin 위에서 구축하는 엔지니어들에게 더 빠른 역량 향상으로 직접 이어집니다.

Image 9: logo

우리의 장기 실행 평가에서 Claude Opus 4.8의 분석은 이전 Opus 모델들보다 일관되게 더 높은 품질을 보였습니다. 더 빨리 완료했고, 더 풍부하며 더 정보 밀도가 높은 출력을 만들어냈습니다. 전반적으로 신호 대 잡음 비율이 눈에 띄게 더 좋아졌습니다. 가장 큰 차별점은 Opus 4.8이 분석의 입력과 출력에 있는 문제를 선제적으로 표시하는 경향이었으며, 이는 다른 모델들이 일상적으로 놓치고 사용자가 직접 찾아내야 했던 부분입니다.

Image 10: logo

CoCounsel Legal 전반에서 Claude Opus 4.8은 이전 Opus 모델들과 비교해 일관성과 추론 품질에서 의미 있는 개선을 보여주었습니다. 고객이 의존하는 고위험 전문 워크플로에서는 이러한 신뢰성이 중요합니다. 법률 및 세무 전문가를 위한 수탁자급 AI 시스템을 구축하는 과정에서 이러한 발전은 실제 워크플로에서 신뢰할 수 있는 AI 성능의 기준을 높이는 데 도움이 됩니다.

Image 11: logo

Claude Opus 4.8은 엔터프라이즈 AI의 새로운 기준을 세웁니다. 데이터 및 지식 작업을 위한 Databricks의 AI 에이전트인 Genie에서, 새로운 Opus 모델은 에이전트형 추론에 단계적 도약을 가져와 이전 어떤 Opus보다 더 깊고 다단계적인 질문을 더 빠르게 처리합니다. 또한 멀티모달 강점을 통해 Genie는 PDF, 다이어그램, 기타 비정형 콘텐츠를 Opus 4.7보다 61% 저렴한 토큰 비용으로 직접 추론할 수 있습니다.

Image 12: logo

Hebbia의 orchestrator에서 금융 문서 워크플로에 대해 Claude Opus 4.8은 Opus 4.7과 동일한 강한 품질을 제공하면서도, 인용 정밀도는 눈에 띄게 더 좋고 검색 시 토큰 효율성도 더 뛰어나며, 이는 고객이 매일 처리하는 밀도 높은 공시 문서 유형에 매우 잘 맞습니다.

01 /

Opus 4.8에서 가장 두드러진 개선점 중 하나는 _정직성_입니다. 우리는 모든 모델이 정직하도록 훈련합니다. 예를 들어, 뒷받침할 수 없는 주장을 피하도록 합니다. 그러나 AI 모델의 일반적인 문제는 때때로 성급하게 결론을 내리고, 근거가 빈약한데도 자신이 작업에서 진전을 이뤘다고 자신 있게 주장한다는 점입니다. 초기 테스터들은 Opus 4.8이 자신의 작업에 대한 불확실성을 더 잘 표시하고, 근거 없는 주장을 할 가능성은 더 낮다고 보고했습니다. 이는 우리의 평가로도 확인되며, Opus 4.8은 이전 버전보다 자신이 작성한 코드의 결함을 아무 언급 없이 지나치게 둘 가능성이 약 네 배 낮은 것으로 나타났습니다.

언제나처럼 우리는 출시 전에 모델에 대해 상세한 정렬 평가를 수행했습니다. 긍정적인 특성 측면에서, 우리 Alignment 팀은 Opus 4.8이 “사용자 자율성 지원과 사용자의 최선의 이익에 따라 행동하는 것과 같은 친사회적 특성 지표에서 새로운 최고치를 달성했다”고 결론지었습니다. 또한 이 평가는 Opus 4.8이 오도나 오용 협조 같은 비정렬 행동 비율에서 Opus 4.7보다 상당히 낮고, 우리 모델 중 가장 잘 정렬된 모델인 Claude Mythos Preview와 비슷한 수준임을 보여주었습니다. 전체 정렬 평가는 배포 전 안전성 테스트 모음과 함께 Claude Opus 4.8 System Card에 보고되어 있습니다.

오늘 함께 출시되는 내용

Claude Opus 4.8에 더해, 다음과 같은 업데이트도 제공합니다.

Dynamic workflows. research preview로 제공되는 이 새로운 기능은 Claude Code에서 Claude가 훨씬 더 큰 작업을 맡을 수 있게 해줍니다. Claude는 작업을 계획한 뒤 하나의 세션 안에서 수백 개의 병렬 하위 에이전트를 실행할 수 있습니다. 그리고 Opus 4.8에서는 에이전트들이 훨씬 더 오래 실행될 수 있습니다. 그런 다음 사용자에게 보고하기 전에 출력 결과를 검증합니다. 예를 들어, 이제 Opus 4.8이 탑재된 Claude Code는 기존 테스트 스위트를 기준으로 삼아 수십만 줄의 코드에 걸친 코드베이스 규모의 마이그레이션을 시작부터 병합까지 수행할 수 있습니다. Claude Code의 Enterprise, Team, Max 플랜에서 사용할 수 있는 dynamic workflows에 대해서는 이 게시물에서 자세히 읽어볼 수 있습니다.
claude.ai와 Cowork의 effort control. 모델 선택기 옆의 새로운 제어 기능을 통해 사용자는 Claude가 응답에 얼마나 많은 노력을 들일지 선택할 수 있습니다. 더 높은 effort 설정에서는 Claude가 더 자주, 더 깊이 생각하여 더 나은 응답을 제공합니다. 더 낮은 effort 설정에서는 Claude가 더 빠르게 응답하고 사용자의 rate limit을 더 천천히 소모합니다. 이제 사용자는 이 선택권을 가지며, effort control은 모든 플랜에서 사용할 수 있습니다.
Messages API는 이제 messages 배열 안의 system 항목을 허용합니다. 개발자는 프롬프트 캐시를 깨뜨리거나 사용자 턴을 통해 업데이트를 우회시키지 않고도 작업 중간에 Claude의 지시를 업데이트할 수 있습니다. 이는 특정 harness 안에서 에이전트가 실행되는 동안 권한, 토큰 예산 또는 환경 맥락을 업데이트하는 데 사용할 수 있습니다.

Video 3

effort에 대한 참고

Opus 4.8의 기본값은 high effort이며, 우리는 이것이 품질과 사용자 경험 사이의 전반적으로 가장 좋은 균형이라고 판단합니다. 코딩 작업에서는 이 effort 수준이 Opus 4.7의 기본값과 비슷한 수의 토큰을 사용하면서도 더 나은 성능을 제공합니다. 사용자는 “extra”(Claude Code에서는 “xhigh”) 또는 “max”를 선택할 수 있으며, 이 경우 모델은 더 많은 토큰을 사용해 더 나은 결과를 얻습니다. 우리는 어려운 작업과 장시간 실행되는 비동기 워크플로에는 “extra” 사용을 권장합니다. 더 높은 effort 수준의 더 높은 토큰 사용량을 수용하기 위해 Claude Code의 rate limit도 증가시켰으며, 사용자는 각자의 프로젝트에 적합한 설정을 선택할 수 있습니다.

다음은 무엇인가요?

사용자들은 Opus 4.8이 이전 버전에 비해 절제되어 있지만 분명한 개선이라는 점을 느끼게 될 것입니다. 물론 아직 더 해야 할 일이 있습니다. 우리는 Opus와 같은 많은 기능을 더 낮은 비용으로 제공하는 모델을 개발하고 출시하기 위해 노력하고 있습니다.

그뿐 아니라, 우리는 Opus보다 더 높은 지능을 갖춘 새로운 종류의 모델도 출시할 계획입니다. Project Glasswing의 일환으로 현재 소수의 조직이 사이버보안 작업을 위해 Claude Mythos Preview를 사용하고 있습니다. 이 수준의 역량을 지닌 모델은 일반 공개 전에 더 강력한 사이버 안전장치가 필요합니다. 우리는 이러한 안전장치를 신속히 개발하는 데 빠르게 진전을 이루고 있으며, 앞으로 몇 주 안에 Mythos급 모델을 모든 고객에게 제공할 수 있을 것으로 기대합니다.

사용 가능 여부

Claude Opus 4.8은 오늘부터 모든 곳에서 사용할 수 있습니다. 일반 사용 가격은 Opus 4.7과 동일하게 유지됩니다. 입력 토큰 백만 개당 $5, 출력 토큰 백만 개당 $25입니다. fast mode 가격은 입력 토큰 백만 개당 $10, 출력 토큰 백만 개당 $50입니다. 개발자는 Claude API를 통해 claude-opus-4-8를 사용할 수 있습니다.

Opus 4.8의 기능

Opus 4.8과 협업하기

Image 2: logo

Claude Opus 4.8은 판단력이 눈에 띄게 더 좋습니다. Claude Code에서는 올바른 질문을 하고, 자신의 실수를 잡아내며, 계획이 타당하지 않을 때 이의를 제기하고, 큰 변경을 하기 전에 복잡한 다중 서비스 탐색에 대한 확신을 쌓습니다. 함께 구축하기에 훌륭한 모델입니다.

Image 3: logo

우리의 Super-Agent 벤치마크에서 Claude Opus 4.8은 모든 사례를 처음부터 끝까지 완수한 유일한 모델이었으며, 비용 동일 조건에서 이전 Opus 모델들과 GPT-5.5를 능가했습니다. 번역, 심층 리서치, 슬라이드 제작, 분석용 에이전트 제품에서 강력한 신뢰성을 제공합니다.

Image 4: logo

CursorBench에서 Claude Opus 4.8은 모든 effort 수준에서 이전 Opus 모델들을 능가합니다. 도구 호출은 같은 지능으로 더 적은 단계만 사용해 의미 있게 더 효율적이며, 처음부터 끝까지 과제를 완수합니다.

Image 5: logo

Claude Opus 4.8은 우리의 Legal Agent Benchmark에서 기록된 최고 점수를 달성했으며, all-pass 기준에서 전체적으로 10%를 넘긴 첫 번째 모델입니다. 실질적인 법률 업무에서 이는 고객이 실제 변호사 업무를 얼마나 안심하고 위임할 수 있는지에 직접 연결되는 정확도 향상입니다.

Image 6: logo

Claude Opus 4.8은 Opus 4.7에 비해 삶의 질을 크게 높여주는 업데이트처럼 느껴집니다. 더 빠르고, 협업하기 쉬우며, 긴 세션 동안 맥락과 스타일 지시를 더 잘 유지합니다. Opus 4.8은 목소리, 취향, 기술적 실행이 모두 나란히 이루어져야 하는 작업에서 제가 계속 신뢰하게 된 모델입니다.

Image 7: logo

Claude Opus 4.8은 우리가 테스트한 컴퓨터 사용 및 브라우저 에이전트 모델 가운데 가장 강력하며, Online-Mind2Web에서 84%를 기록해 Opus 4.7과 GPT-5.5 모두를 의미 있게 뛰어넘었습니다. 고객의 에이전트 워크로드가 처음부터 끝까지 신뢰 가능해야 하는 방식에 맞게, 반성적으로 사고하면서도 작업에 집중합니다.

Image 8: logo

Claude Opus 4.8은 도구를 깔끔하게 사용하고, 무인으로 계속 실행되어야 하는 우리의 자율 엔지니어링 워크로드에 필요한 일관성으로 지시를 따릅니다. Opus 4.6보다 개선되었고, Opus 4.7에서 보았던 댓글 과다 및 도구 호출 문제를 해결했습니다. Anthropic의 이번 출시는 Devin 위에서 구축하는 엔지니어들에게 더 빠른 역량 향상으로 직접 이어집니다.

Image 9: logo

우리의 장기 실행 평가에서 Claude Opus 4.8의 분석은 이전 Opus 모델들보다 일관되게 더 높은 품질을 보였습니다. 더 빨리 완료했고, 더 풍부하며 더 정보 밀도가 높은 출력을 만들어냈습니다. 전반적으로 신호 대 잡음 비율이 눈에 띄게 더 좋아졌습니다. 가장 큰 차별점은 Opus 4.8이 분석의 입력과 출력에 있는 문제를 선제적으로 표시하는 경향이었으며, 이는 다른 모델들이 일상적으로 놓치고 사용자가 직접 찾아내야 했던 부분입니다.

Image 10: logo

CoCounsel Legal 전반에서 Claude Opus 4.8은 이전 Opus 모델들과 비교해 일관성과 추론 품질에서 의미 있는 개선을 보여주었습니다. 고객이 의존하는 고위험 전문 워크플로에서는 이러한 신뢰성이 중요합니다. 법률 및 세무 전문가를 위한 수탁자급 AI 시스템을 구축하는 과정에서 이러한 발전은 실제 워크플로에서 신뢰할 수 있는 AI 성능의 기준을 높이는 데 도움이 됩니다.

Image 11: logo

Claude Opus 4.8은 엔터프라이즈 AI의 새로운 기준을 세웁니다. 데이터 및 지식 작업을 위한 Databricks의 AI 에이전트인 Genie에서, 새로운 Opus 모델은 에이전트형 추론에 단계적 도약을 가져와 이전 어떤 Opus보다 더 깊고 다단계적인 질문을 더 빠르게 처리합니다. 또한 멀티모달 강점을 통해 Genie는 PDF, 다이어그램, 기타 비정형 콘텐츠를 Opus 4.7보다 61% 저렴한 토큰 비용으로 직접 추론할 수 있습니다.

Image 12: logo

Hebbia의 orchestrator에서 금융 문서 워크플로에 대해 Claude Opus 4.8은 Opus 4.7과 동일한 강한 품질을 제공하면서도, 인용 정밀도는 눈에 띄게 더 좋고 검색 시 토큰 효율성도 더 뛰어나며, 이는 고객이 매일 처리하는 밀도 높은 공시 문서 유형에 매우 잘 맞습니다.

01 /

오늘 함께 출시되는 내용

Claude Opus 4.8에 더해, 다음과 같은 업데이트도 제공합니다.

Dynamic workflows. research preview로 제공되는 이 새로운 기능은 Claude Code에서 Claude가 훨씬 더 큰 작업을 맡을 수 있게 해줍니다. Claude는 작업을 계획한 뒤 하나의 세션 안에서 수백 개의 병렬 하위 에이전트를 실행할 수 있습니다. 그리고 Opus 4.8에서는 에이전트들이 훨씬 더 오래 실행될 수 있습니다. 그런 다음 사용자에게 보고하기 전에 출력 결과를 검증합니다. 예를 들어, 이제 Opus 4.8이 탑재된 Claude Code는 기존 테스트 스위트를 기준으로 삼아 수십만 줄의 코드에 걸친 코드베이스 규모의 마이그레이션을 시작부터 병합까지 수행할 수 있습니다. Claude Code의 Enterprise, Team, Max 플랜에서 사용할 수 있는 dynamic workflows에 대해서는 이 게시물에서 자세히 읽어볼 수 있습니다.
claude.ai와 Cowork의 effort control. 모델 선택기 옆의 새로운 제어 기능을 통해 사용자는 Claude가 응답에 얼마나 많은 노력을 들일지 선택할 수 있습니다. 더 높은 effort 설정에서는 Claude가 더 자주, 더 깊이 생각하여 더 나은 응답을 제공합니다. 더 낮은 effort 설정에서는 Claude가 더 빠르게 응답하고 사용자의 rate limit을 더 천천히 소모합니다. 이제 사용자는 이 선택권을 가지며, effort control은 모든 플랜에서 사용할 수 있습니다.
Messages API는 이제 messages 배열 안의 system 항목을 허용합니다. 개발자는 프롬프트 캐시를 깨뜨리거나 사용자 턴을 통해 업데이트를 우회시키지 않고도 작업 중간에 Claude의 지시를 업데이트할 수 있습니다. 이는 특정 harness 안에서 에이전트가 실행되는 동안 권한, 토큰 예산 또는 환경 맥락을 업데이트하는 데 사용할 수 있습니다.

Video 3

Opus 4.8의 기능

Opus 4.8과 협업하기

오늘 함께 출시되는 내용

effort에 대한 참고

다음은 무엇인가요?

사용 가능 여부

관련 콘텐츠

Anthropic, 이탈리아 기업·연구·개발자 지원을 위해 밀라노 사무소 개설

Anthropic, 서울 사무소 개설을 앞두고 KiYoung Choi를 Anthropic Korea 대표이사로 선임

Anthropic 공동창업자 Chris Olah의 교황 Leo XIV 회칙 "Magnifica humanitas"에 대한 발언

관련 추천 글

Claude Opus 4.6를 최대한 활용하기 | Claude

Claude Sonnet 4.5 소개

Claude Fable 5에 대한 첫인상

Claude Opus 4.5와 새 LLM 평가가 점점 더 어려워지는 이유

Opus 4.8의 기능

Opus 4.8과 협업하기

오늘 함께 출시되는 내용

effort에 대한 참고

다음은 무엇인가요?

사용 가능 여부

관련 콘텐츠

Anthropic, 이탈리아 기업·연구·개발자 지원을 위해 밀라노 사무소 개설

Anthropic, 서울 사무소 개설을 앞두고 KiYoung Choi를 Anthropic Korea 대표이사로 선임

Anthropic 공동창업자 Chris Olah의 교황 Leo XIV 회칙 "Magnifica humanitas"에 대한 발언

관련 추천 글

Claude Opus 4.6를 최대한 활용하기 | Claude

Claude Sonnet 4.5 소개

Claude Fable 5에 대한 첫인상

Claude Opus 4.5와 새 LLM 평가가 점점 더 어려워지는 이유