DeepSeek-V3.1를 공개합니다. Think/Non-Think 하이브리드 추론, 더 빨라진 사고, 강화된 에이전트 능력과 함께 API 업데이트(128K 컨텍스트, Anthropic 포맷, Strict Function Calling), 도구·에이전트 성능 향상, 모델·토크나이저 업데이트, 요금제 변경 소식을 확인하세요.
DeepSeek-V3.1 소개: 에이전트 시대를 향한 우리의 첫걸음! 🚀
🧠 하이브리드 추론: Think & Non-Think — 하나의 모델, 두 가지 모드
⚡️ 더 빠른 사고: DeepSeek-V3.1-Think는 DeepSeek-R1-0528 대비 더 짧은 시간에 답에 도달
🛠️ 더 강력한 에이전트 능력: 사후 학습으로 도구 사용과 다단계 에이전트 작업 향상
지금 사용해 보세요 — "DeepThink" 버튼으로 Think/Non-Think 전환: https://chat.deepseek.com/
🔹 deepseek-chat → 비사고 모드
🔹 deepseek-reasoner → 사고 모드
🧵 두 모델 모두 128K 컨텍스트
🔌 Anthropic API 포맷 지원: https://api-docs.deepseek.com/guides/anthropic_api
✅ 베타 API에서 Strict Function Calling 지원: https://api-docs.deepseek.com/guides/function_calling
🚀 더 많은 API 리소스, 더욱 매끄러운 API 사용 경험
📈 SWE / Terminal-Bench에서 더 나은 성능
🔍 복잡한 검색 작업에서 더 강력한 다단계 추론
⚡️ 사고 효율성 대폭 향상



🔹 V3.1 Base: V3 기반으로 840B 토큰 지속 사전학습을 통해 장문 컨텍스트 확장
🔹 Tokenizer 및 채팅 템플릿 업데이트 — 새 토크나이저 설정: https://huggingface.co/deepseek-ai/DeepSeek-V3.1/blob/main/tokenizer_config.json
🔗 V3.1 Base 오픈소스 가중치: https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base
🔗 V3.1 오픈소스 가중치: https://huggingface.co/deepseek-ai/DeepSeek-V3.1
🔹 새 요금제 시작 및 비피크 시간 할인 종료: 2025년 9월 5일 16:00 (UTC)
🔹 그때까지는 API가 현재 요금을 따름
📝 요금제 페이지: https://api-docs.deepseek.com/quick_start/pricing/
