Rabu, 18 November 2020

하이엔드 독주 타파 라데온 봉기, AMD 라데온 RX 6800 시리즈 - 보드나라

AMD는 인텔과 CPU, 엔비디아와 GPU 시장에서 경쟁한다.

PC 시장에 관심 좀 가졌던 네티즌이라면 알겠지만, 몇 년전만 해도 AMD는 부동산 등의 자산 매각에 그치지 않고 회사 자체의 매각설이 나돌 정도로 위기에 직면했었다. CPU와 GPU 모두 일부 가성비가 뛰어난 메인스트림급 제품 위주로 간신히 명맥만 이어가는 형국이었다.

그러던 AMD가 지난 2017년 라이젠 시리즈로 기사회생하더니 올해 Zen3 아키텍처인 라이젠 5000 시리즈로 CPU 시장에서 독주할 모양새를 갖춘데 이어, 이제는 RDNA2 아키텍처 기반으로 설계된 라데온 RX 6000 시리즈를 통해 게이밍 그래픽 카드 시장에서도 하이엔드 경쟁을 선언했다.

AMD가 선언한 하이엔드 게이밍 그래픽 카드 경쟁은 어떤 모습일까?

 

라데온의 고질병, 고발열과 고전력은 이제 그만~

라데온 RX 6000 시리즈는 최대 40CU 구성이었던 RX 5000 시리즈의 두 배에 달하는 최대 80CU, 그보다 높은 클럭을 구현하였지만 제조 공정은 여전히 TSMC 7nm가 이용된다.

때문에 단순히 라데온 RX 5000 시리즈의 RDNA 아키텍처를 그대로 유지했다면 무시무시한 발열과 전력 소모를 감당할 수 없었겠지만, 전력 효율을 50% 이상 개선한 RDNA2 아키텍처를 적용해 현실적인 소비전력과 발열 제어를 이뤄냈다.

본격적인 이야기에 앞서, AMD 라데온 그래픽 카드에 고질적인 문제로 지적받아온 쿨링과 소비전력은 어떤지 우선 짚어보자.

소비전력과 발열 테스트는 Furmark 1.22.2.0 버전을 이용해 10분간 4K 4xMSAA 조건의 부하를 주어 풀 로드 상태를 비교했으며, 부팅 후 시스템이 안정화된 상태를 유지한 5분 직후의 idle 상태도 기록했다.

 

이에 따르면 라데온 RX 6800 시리즈의 소비전력과 발열은 지금까지의 라데온 시리즈에 대한 편견을 씻기에 충분했다. 아이들 시 거의 비슷한 온도를 보였고, 풀로드 상태에서는 RX 6800이 RTX 3070보다 오히려 낮은 온도를 기록하는 기염을 토했다. 파운더스 에디션이 아닌 제조사 커스텀 모델이라 직접적인 비교는 어렵지만, RX 6800 XT도 RTX 3080에 충분히 경쟁력있는 발열과 소비전력 특성을 구현하는데 성공했다.

 

라데온 RX 6800 시리즈의 레퍼런스 모델에 트리플 팬이 사용된 만큼 RTX 3070 FE와 같은 듀얼팬 구조일 경우 라데온 RX 6800 시리즈의 발열이 더 높게 측정될 수 있지만, 이런 경우까지 감안해 트리플 팬을 사용한 것도 AMD의 탁월한 선택이라 평가하고 싶다.

트리플 팬을 사용하면서 블로워팬이 사용된 기존 레퍼런스 제품들과 달리 소음도 대폭 줄어든 것이 또  다른 강점이다.

 

RX 6000 시리즈 전성비 개선의 핵심, 128MB 인피티니 캐시

라데온 RX 6000 시리즈에 사용된 RDNA2 아킽겟처는 많은 부분이 바뀌지는 않았지만, 지포스 RTX 20 시리즈부터 도입된 실시간 레이트레이싱 지원, 무려 128MB에 달하는 인피니티 캐시, AMD가 전통적으로 강조해온 전성비 강화를 위한 세부적인 튜닝을 이뤄냈다.

 

공식 발표상 RDNA2의 전성비 개선율은 54%이고, 특히 RX 6900 XT는 그보다 더욱 높은 65%의 전력 효율 개선을 이뤄낸 것이 특징이다. 지금까지 경쟁사 대비 고질적인 약점으로 지적받던 소비전력과 발열 특성을 개선하기 위한 노력이 반영된 것이고, 실제 위 테스트 결과 경쟁 모델과 비교해도 전혀 뒤쳐지지 않는 모습이다.

 

이렇게 소비전력대비 성능 개선을 위해 RDNA2 아키텍처에 적용된 대표적인 변화가 바로 인피니티 캐시(Infinity Cache)로 불리는 L3 캐시의 도입이다. 인피니티 캐시 접근시 소비 전력은 GDDR6 메모리에 엑세스할 때에 비해 약 1/8 수준이고, 대역폭도  라데온 RX 6000 시리즈의 256bit 메모리 인터페이스에 비해 최대 4배에 달한다.

 

이에 실제 구현 단계에서는 인피니티 캐시가 없는 256bit GDDR6 메모리 구조에 비해 최대 2.4배의 전력당 성능 개선을 이뤄냈고, 이는 엔진 클럭 향상을 뒷받침해주게 되었다. 추가로, 인피니티 캐시의 무려 128MB에 달하는 대용량은 GDDR6 메모리 접근 필요성을 감소 시켜주는 것은 물론 최대 48%, 평균 34%의 레이턴시 개선 효과를 가져왔다.

AMD 라이젠의 게임 성능 개선의 핵심으로 레이턴시 개선이 꼽혀왔던 것을 감안하면, 실제 게임 성능을 좌우하는 그래픽 카드의 레이턴시 개선이 얼마나 성능에 큰 영향을 끼치는지는 실제 게임 테스트 결과를 통해 알아보겠다.

 

이렇게 전력 효율 개선에 집중한 라데온 RX 6800 시리즈는 베이퍼 챔버와 그라파이트 써멀, 트리플 쿨링팬, 다이캐스트 알루미늄 프레임과 백패널, 써멀 블록 등의 쿨링 솔루션을 도입했다. 결과적으로 라데온 RX 6800 XT는 동일 조건에서 라데온 RX 5700 XT 대비 최대 소음이 6dBA(70%) 줄어 정숙한 사용 환경을 제공한다.

 

한편, 라데온 RX 6000 시리즈에는 전력 공급을 위한 2온즈 구리 PCB 4층을 포함한 총 14층 PCB가 사용되었고, 라데온 RX 6800 XT의 경우 총 15페이즈 전원부 중 메모리 전원부는 인피니티 캐시 덕에 전력 효율을 높여 8개의 메모리 칩에 전력을 공급하는데 2페이즈 전원부가 할당되었다.

 실제 제조사 커스텀 모델은  설계에 따라 다를 수 있지만, AMD가 경쟁 모델로 내세운 RTX 3080이 10개 메모리 칩에 3페이즈, RTX 3090이 24개 메모리 칩에 4페이즈 전원부를 할당한 것과 비교되는 부분이다.

 

전체 GPU 메모리 엑세스로 성능 up, AMD SAM(Smart Access Memory)

라데온 RX 6000 시리즈에서 눈에 띄는 기능 중 하나는 바로 CPU가 전체 VRAM에 엑세스할 수 있는 SAM(Smart Access Memory) 기능이다.

해당 기능은 라이젠 5000 시리즈, RX 6000 시리즈 그래픽 카드 및 AMD 500 시리즈 칩셋 메인보드로 이뤄진 일명 라라랜드(라이젠 + 라데온) 시스템에서 AGESA 1.1.0.0 바이오스와 64bit OS, 라데온 소프트웨어 20.11.2 이상 버전 드라이버가 필요하다.

 

해당 기능을 쓰기 위해서는 바이오스의 'Above 4G Decoding' 옵션과 'Resize BAR(Base Address Register)' 기능을 활성화해야 하며, 특별히 OS와 드라이버 설정을 건드려줄 필요는 없다.

이는 현재 일반적으로 CPU의 VRAM 직접 접근 용량이 256MB로 제한된 일반적인 경우와 달리 전체 VRAM에 직접 접근이 가능하므로, 시스템 메모리를 거치는데 필요한 오버헤드와 레이턴시가 대폭 개선되어 성능 향상으로 이어진다.

AMD는 SAM을 통해 평균 6%의 성능 향상이 기대된다는 자료를 공개했다.

 

라데온 RX 6000 t시리즈 중 우선 출시되는 라데온 RX 6800 시리즈 중 XT 모델과 12월 8일 출시될 라데온 RX 6900 XT는 레이지(Rage, 격렬히) 모드를 지원한다. 레이지 모드는 팬 속도와 GPU의 클럭 잠재력을 최대화한 설정으로, 레이지 모드 시 실제 동작 클럭은 쿨러와 제품 디자인, 칩 수율 등 다양한 요소에 의해 제품마다 차이가 발생할 수 있다.

AMD 라데온 RX 6800 XT의 공식 레이지 모드의 게임 클럭과 부스트 클럭은 기본 설정인 균형 조절 대비 각각 50MHz와 60MHz 높아지며, SAM과 함께 라데온 RX 6000 시리즈의 성능을 극대화하는 한 축이 되어줄 것이다.

 

DX12 울티메이트, 실시간 레이트레이싱과 메시 셰이딩 등 지원

AMD도 마침내 레이트레이싱 경쟁에 뛰어들었다.

전용 코어를 탑재한 엔비디아의 지포스 RTX 시리즈와 달리 CU에 레이 가속기를 적용한 하이브리드 방식으로, 앞서 설명한 인피니티 캐시는 이 과정에서 광선 추적 유지와 레이턴시 개선을 뒷받침해준다.

지포스 RTX 시리즈에서 보듯, 레이 트레이싱 전용 유닛이 있는 경우라도 셰이더 연산과 병행하는 과정에서 성능 저하를 피할 수 없는데, AMD가 전용 레이 트레이싱 유닛 대신 하이브리드 방식을 택한 것은 어차피 성능 저하를 피할 수 없다면 효율을 극대화하기 위한 선택의 결과로 판단된다.

 

레이트레이싱은 작업 부하가 상당히 높은 만큼 지포스 RTX 시리즈와 마찬가지로, RDNA2 아키텍처 역시 제한적인 영역에만 레이트레이싱을 적용하기에 완성된 화면에 노이즈가 발생하는 것을 피할 수 없다. 이를 보완하고 자연스러운 장면을 보여줄 수 있도록 FidelityFX 디노이저를 사용한다.

 

다음 성능 확인 과정에서 알 수 있지만, RX 6000 시리즈 역시 실시간 레이 트레이싱을 적용하면 상당한 성능 저하가 발생한다. 엔비디아는 텐서 코어를 도입한 인공 지능 기반 DLSS 기술로 이를 보완할 수 있는데, AMD 라데온 RX 6000 시리즈는 아직 이에 해당하는 기술이 없다.

물론 레이 트레이싱 적용에 따른 성능 저하 보완 기술의 필요성을 외면할 수 없는 만큼, AMD는 FidelityFX Super Resolution 기술을 개발 중이다. 자세한 내용은 공개되지 않았지만 MS의 엑스박스 시리즈 X/S에 이식을 고려하면 DX12의 DirectML을 활용하는 방식이 될 것으로 예상된다.

 

한편, 레이트레이싱 지원이 포함된 DX12 울티메이트를 지원하는 AMD의 RDNA2 아키텍처는 유동적인 셰이딩 비율(Variable Rate Shading) 조절 기능과 메시 셰이딩(Mesh Shading), 샘플러 피드백 기능을 지원한다.

쉽게 말해 게이머가 인지하기 어려운 부분에 메시/ 셰이딩 연산 부하를 낮추고 자원을 재활용해 전체적인 성능을 개선하고 효율을 높여주기 위한 기능이다. 동일 오브젝트라도 먼 거리에 있을 때는 렌더링 복잡도와 셰이딩을 낮추고, 가까이 다가가면 보다 원래 의도했던 복잡도와 높은 셰이딩을 적용하는 방식이다.

이러한 기능은 일반 게임에 비해 렌더링 부하가 높은 VR 경험 개선에 특히 도움이 될 것으로 기대되며, 라데온 RX 6000 시리즈에 VR-HMD 연결 편의성을 위해 도입된 VirtualLink 포트 (USB Type-C)와 전략적 시너지 효과가 기대되는 대목이다.

 

라데온 RX 6000 시리즈는 MS가 엑스박스 시리즈 X/S 제품군에 추가한 다이렉트스토리지 기능의 윈도우 버전을 지원하며, 엔비디아지 지포스 RTX 30 시리즈에 RTX I/O 라는 이름으로 지원하는 기술과 근본적으로 동일한 기술이다.

스토리지에 저장된 각종 게임 데이터를 바로 GPU로 불러와 로딩 속도를 획기적으로 개선하는 것이 핵심으로, MS는 다이렉트 스토리지의 개발자 프리뷰 버전을 2021년 공개할 예정인 만큼 현 시점에서는 AMD와 엔비디아 양사의 그래픽 카드 모두 사용할 수 없는 상황이다.

Let's block ads! (Why?)


https://news.google.com/__i/rss/rd/articles/CBMiNWh0dHBzOi8vd3d3LmJvZG5hcmEuY28ua3IvYmJzL2FydGljbGUuaHRtbD9udW09MTY2NzUy0gEA?oc=5

2020-11-18 14:00:00Z
CBMiNWh0dHBzOi8vd3d3LmJvZG5hcmEuY28ua3IvYmJzL2FydGljbGUuaHRtbD9udW09MTY2NzUy0gEA

Tidak ada komentar:

Posting Komentar