AMD announces unified UDNA GPU architecture — bringing RDNA and CDNA together to take on Nvidia's CUDA ecosystem

News

By Paul Alcorn 기여: Jarred Walton 게시일: 2024년 9월 9일

둘이 하나로.

Radeon RX 7900 XTX

(이미지 제공: AMD)

독일 베를린 IFA 2024 현장에서, AMD의 컴퓨팅 & 그래픽 비즈니스 그룹 수석부사장 겸 총괄인 잭 후인(Jack Huynh)은 소비자 지향의 RDNA와 데이터센터 지향의 CDNA 아키텍처를 하나의 마이크로아키텍처로 통합한 UDNA를 발표했다. 이는 AMD가 견고하게 구축된 Nvidia의 CUDA 생태계에 보다 효과적으로 맞서기 위한 발판이 될 전망이다. 이 발표는 AMD가 시장 점유율 확대를 가속하기 위해 하이엔드 게이밍 그래픽 카드의 우선순위를 낮추는 결정을 내린 가운데 나왔다.

AMD는 2019년 GCN 마이크로아키텍처에서 벗어나면서, 새 그래픽 마이크로아키텍처를 두 갈래로 분리했다. RDNA는 소비자 시장의 게이밍 그래픽 제품을, CDNA는 데이터센터의 컴퓨팅 중심 AI와 HPC 워크로드를 겨냥해 설계된 것이다.

후인은 기자단과의 질의응답에서 이러한 분리의 배경과, 이제 통합 설계를 지향하게 된 이유를 설명했다. 이후 우리는 다가올 아키텍처에 대한 추가 질문도 이어갔다. 다음은 대화를 약간 편집해 정리한 내용이다.

Jack Huynh [JH], AMD: 오늘날 우리에겐 인스팅트(Instinct) 데이터센터 GPU를 위한 CDNA 아키텍처와 소비자용 제품을 위한 RDNA가 있습니다. 말하자면 포크된(forked) 상태죠. 앞으로는 이를 UDNA라고 부를 겁니다. 인스팅트와 클라이언트(소비자) 모두를 아우르는 단일 통합 아키텍처가 됩니다. 이렇게 통합하면 오늘날처럼 개발자들이 둘 중 하나를 선택해야 하는 상황을 줄일 수 있고, 그로 인해 가치가 개선되지 않는 문제도 해소할 수 있습니다.

우리가 분리했던 이유는 세부 최적화와 마이크로 최적화를 하기 위해서였지만, 데이터센터 비즈니스를 키워 가는 지금 같은 시기엔 개발자들에게 매우 어렵습니다. 그래서 이제 통합이 필요합니다. 앞서 말했듯, 저는 수백만 명의 개발자를 생각하고 있습니다. 우리가 가야 할 곳이 바로 그 지점이니까요. 1단계는 수백, 수천, 수만, 수십만, 그리고 언젠가 수백만 명으로 가는 겁니다. 지금 팀에 말하고 있는 게 바로 그 규모의 확장입니다. 지금부터 그 스케일을 구축해야 합니다.

Tom's Hardware [TH], Paul Alcorn: UDNA로 두 아키텍처를 다시 합치면, 이전의 RDNA와 CDNA 분리와의 하위 호환성은 유지되나요?

JH: 우리가 하려는 일 중 하나는… RDNA 쪽에서 몇 가지 실수를 했다는 겁니다. 매번 메모리 계층 구조나 서브시스템을 바꾸면, 최적화 매트릭스가 초기화되어 버립니다. 더는 그러고 싶지 않습니다.

그래서 앞으로는 RDNA 5, RDNA 6, RDNA 7만 생각하는 게 아니라 UDNA 6, UDNA 7까지 생각하고 있습니다. 다음 세대 세 가지를 한꺼번에 계획하는 이유는, 한 번 최적화를 쌓아 올리면 메모리 계층 구조를 바꾸느라 그 최적화를 잃고 싶지 않기 때문입니다. 그래서 완전한 전방/후방 호환성을 강제하는 방향으로 가고 있습니다. 엑스박스에서도 그렇게 하고 있어요. 충분히 가능한 일이고, 다만 사전 계획이 많이 필요합니다. 해야 할 일이 훨씬 많아지긴 하지만, 그게 우리가 가는 방향입니다.

PA: 통합 아키텍처로 되돌린다는 건, 분명히 하자면, 미래에는 데스크톱 GPU도 MI300X와 동일한 아키텍처를 갖게 된다는 뜻인가요? 맞습니까?

JH: 클라우드-투-클라이언트 전략입니다. 그건 우리를 매우 효율적으로 만들어 줄 거라고 봅니다. 두 팀이 각각 하는 대신 한 팀이 하면 되니까요. 그다지 미친 짓을 하는 건 아닙니다. 단기적으로 마이크로 최적화를 하려고 분기했던 건데, 이제 규모가 생긴 만큼 다시 통합해야 하고, 그게 옳은 접근이라고 믿습니다. 작은 마찰은 조금 있을지 모르죠.

PA: 이렇게 다시 합치는 데는 얼마나 걸릴까요? 몇 세대의 제품이 더 지나야 그 모습을 보게 되나요?

JH: 그건 아직 공개하지 않았습니다. 전략이니까요. 전략은 제게 매우 중요합니다. 옳은 전략이라고 생각합니다. 우리가 제대로 하고 있는지 확인해야 하죠. 사실 개발자들과 이야기해 보면 이 전략을 좋아합니다. 여러 부서에서 각자 다른 걸 요구하는데, 저는 그 복잡성을 줄여야 하거든요.

[…] 개발자 관점에서 보면, 이 전략을 아주 좋아합니다. 실제로 더 일찍 했으면 좋았을 거라고 하죠. 하지만 하늘을 나는 비행기의 엔진을 바꿀 수는 없습니다. 무언가를 망치지 않으면서 적절한 전환점을 찾아야 합니다.

[후인 발언 끝] 네, 하이엔드 실리콘이 시장을 만들 수는 있지만, 결국 승패를 가르는 건 소프트웨어 지원이다. Nvidia는 독보적인 독점 생태계인 CUDA로 사실상 뚫기 어려운 해자를 어떻게 만드는지 교과서적으로 보여줬다.

Nvidia는 무려 18년 전 CUDA를 시작하며 제국의 토대를 쌓기 시작했다. 가장 근본적인 장점 중 하나는 CUDA의 ‘U’, 즉 Compute Unified Device Architecture(통합)라는 단어가 상징하듯, 모든 용도를 위한 단 하나의 CUDA 플랫폼을 갖고 있고 AI, HPC, 게이밍에 동일한 하위 마이크로아키텍처를 폭넓게 활용한다는 점이다.

후인은 CUDA 개발자가 400만 명에 달한다며, AMD도 그와 유사한 성공을 거둘 수 있도록 길을 닦는 것이 목표라고 말했다. 결코 쉬운 과제가 아니다. AMD는 Nvidia에 맞서기 위해 오픈 소스 ROCm 소프트웨어 스택에 계속 의존하고 있지만, 이는 스택 최적화의 일부 부담을 떠안을 사용자와 오픈 소스 커뮤니티의 동참이 필요하다. AMD가 그 작업을 단순화할 수 있는 일이라면, 특정 애플리케이션/게임 유형에서 일부 마이크로 최적화를 포기하더라도 생태계 확산에는 도움이 될 것이다.

AMD는 ROCm 스택의 종종 산발적인 효과 때문에 적잖은 비판을 받아 왔다. 2022년 자일링스 인수 당시, AMD는 당시 자일링스 CEO였던 빅터 펭(Victor Peng)을 ROCm 통합 팀의 수장으로 세워 프로젝트를 더 강하게 통제하겠다고 밝히기도 했다(펭은 최근 은퇴). 그 노력은 어느 정도 성과를 냈지만, AMD는 여전히 ROCm 스택의 완성도에 관한 비판을 받고 있다. Nvidia의 CUDA에 맞서 완전히 경쟁 가능한 위치를 확보하려면 할 일이 분명 많이 남아 있다.

또한 퀄컴, 삼성, Arm, 인텔 등 업계의 폭넓은 지지를 얻고 있는 가속기용 오픈 소프트웨어 생태계인 UXL 재단(UXL Foundation)의 등장에도 불구하고, 회사는 ROCm에 계속 초점을 두고 있다.

UDNA가 현재의 RDNA/CDNA 분리 대비 정확히 무엇을 바꿀까? 후인은 많은 세부사항을 밝히지 않았고, 아직 밑작업이 많이 남아 있는 것도 분명하다. 다만 뚜렷한 잠재적 고충 지점 중 하나는 RDNA에 전용 AI 가속 유닛이 부족하다는 점이었다. Nvidia는 2018년부터 RTX 전 라인업에 텐서 코어를 도입했다. AMD는 RDNA 3에서 제한적인 AI 가속만 제공하는데, 사실상 FP16 유닛을 WMMA 명령어를 통해 보다 최적화된 방식으로 활용하는 수준이며, RDNA 2는 이런 작업을 순수하게 GPU 셰이더에 의존한다.

우리의 가정으로는, 어떤 시점에 AMD가 UDNA를 통해 GPU에 텐서 연산에 대한 풀스택 지원을 가져올 것이라는 것이다. CDNA는 2020년부터 그런 기능 유닛을 갖추고 있었고, 2021년 CDNA 2, 2023년 CDNA 3에 이르기까지 처리량과 수치 형식 지원이 확대되었다. 요즘 데이터센터와 클라이언트 양쪽 GPU에서 AI 작업 비중이 압도적으로 커진 만큼, 클라이언트용 GPU에 텐서 지원을 추가하는 건 매우 시급한 과제처럼 보인다.

통합 UDNA 아키텍처는 CUDA와 경쟁하는 여정에서 다음으로 합리적인 단계지만, AMD 앞에는 넘어야 할 산이 많다. 후인은 새 아키텍처의 출시 시점을 확답하진 않았지만, AI 시장에 걸린 수십억 달러를 고려하면 새로운 마이크로아키텍처 전략을 실행하는 것이 최우선 과제가 될 건 분명하다. 다만 우리가 AMD RDNA 4에서 들은 바에 따르면, UDNA는 적어도 한 세대 뒤에나 등장할 것으로 보인다.

AMD announces unified UDNA GPU architecture — bringing RDNA and CDNA together to take on Nvidia's CUDA ecosystem

News

By Paul Alcorn 기여: Jarred Walton 게시일: 2024년 9월 9일

둘이 하나로.

Radeon RX 7900 XTX

(이미지 제공: AMD)

Tom's Hardware [TH], Paul Alcorn: UDNA로 두 아키텍처를 다시 합치면, 이전의 RDNA와 CDNA 분리와의 하위 호환성은 유지되나요?

PA: 통합 아키텍처로 되돌린다는 건, 분명히 하자면, 미래에는 데스크톱 GPU도 MI300X와 동일한 아키텍처를 갖게 된다는 뜻인가요? 맞습니까?

PA: 이렇게 다시 합치는 데는 얼마나 걸릴까요? 몇 세대의 제품이 더 지나야 그 모습을 보게 되나요?

AMD, 통합 UDNA GPU 아키텍처 발표 — RDNA와 CDNA를 하나로 묶어 Nvidia의 CUDA 생태계에 맞선다

AMD announces unified UDNA GPU architecture — bringing RDNA and CDNA together to take on Nvidia's CUDA ecosystem

관련 추천 글

CUDA 온톨로지

그래픽 API는 필요 없다 — Sebastian Aaltonen

인텔을 떠나며

순수 Rust로 SIMD 프로그래밍 입문

AMD announces unified UDNA GPU architecture — bringing RDNA and CDNA together to take on Nvidia's CUDA ecosystem

관련 추천 글

CUDA 온톨로지

그래픽 API는 필요 없다 — Sebastian Aaltonen

인텔을 떠나며

순수 Rust로 SIMD 프로그래밍 입문