대형 LLM 아키텍처 비교

ko생성일: 2025. 8. 18.갱신일: 2025. 8. 18.

GPT-2부터 DeepSeek V3/R1, Gemma 3·3n, Mistral Small 3.1, Llama 4, Qwen3, SmolLM3, Kimi K2, gpt-oss까지 2024-2025년 오픈 모델의 핵심 아키텍처 변화를 MLA·GQA·MHA, MoE, 슬라이딩 윈도우 어텐션, RMSNorm과 Pre/Post-Norm, QK-Norm, NoPE, 토크나이저·KV 캐시 등 관점에서 그림과 함께 정리하고 비교합니다.