프롬프트 캐싱: LLM 토큰 비용 10배 절감, 그런데 어떻게? | ngrok 블로그

ko생성일: 2025. 12. 22.갱신일: 2026. 2. 14.

OpenAI와 Anthropic에서 캐시된 입력 토큰이 일반 입력 토큰보다 훨씬 저렴하고 더 빠를 수 있는 이유를, 토크나이저·임베딩·어텐션(Transformer)과 KV 캐시 관점에서 설명합니다.