Triton 내부 깊이 파헤치기 (1부)

ko생성일: 2025. 11. 2.갱신일: 2025. 11. 6.

GPU 프로그래밍용 고수준 언어 Triton의 내부를 살펴보고, Triton 프로그램이 어떻게 CUDA 커널(정확히는 CUBIN)로 컴파일되는지 단계를 따라 정리합니다. nvcc 기반 CUDA 컴파일 경로, Triton의 MLIR 백엔드 전환, IR→PTX→CUBIN→SASS 추출까지 개요와 예시를 통해 설명합니다.