AI 생성 Metal 커널로 Apple 기기에서 PyTorch 추론을 87% 가속

ko생성일: 2025. 9. 10.갱신일: 2025. 9. 11.

최신 모델로 PyTorch 코드에서 자동으로 Metal 커널을 생성·최적화해 Apple 하드웨어에서 평균 1.87배(최대 수백 배) 가속을 달성한 방법을 소개합니다. 에이전틱 스웜 전략, CUDA 레퍼런스와 프로파일링 정보를 활용한 문맥 주입, 그리고 215개 PyTorch 모듈 전반의 정량적 실험 결과를 다룹니다.