반응형

 

 

 

- 차기 플래그십 엑시노스 탑재로 알려진 RDNA2 아키텍처 기반 모바일 GPU 벤치마크 찌라시. (성당기사단장님)

20년 3월에 나왔던 내용

맨해튼 3.1 181.8프레임

아즈텍 노멀 138.25프레임

아즈텍 하이 58프레임

 

21년 2월 내용

맨해튼 3.1 169.2프레임

아즈텍 하이 49.7프레임

2차 테스트시까진 어느정도 프레임을 유지하나 3차부터 쓰로틀링 영향 있어보여.

3차 테스트시 평균 25프로 정도 하락.

 

이 값을 근거로 GPU 규모, 사양을 계산해보겠음.

RDNA2 아키텍처를 사용하는 제품이 많지 않고 모바일이나 저전력 제품은 거의 없는 상황이라서 다른 아키텍처의 사례를 손에 잡히는대로 써서 계산해보는거라서 이런 식의 추측도 가능하다 정도로 받아들이면 될듯.

 

 

- RDNA2 아키텍처 GPU와 비교

현재 GFX벤치 결과를 얻을 수 있는 RDNA2 아키텍처 기반 제품은 RX6900XT, RX6800XT, RX6800, RX6700XT, RX6600M인데 이 중 사양이 가장 낮아서 비교에 유리한 RX6600M은 결과가 적어서 제외.

나머지 제품으로 GFX벤치 결과와 찌라시 내용을 비교해보면

맨해튼 3.1 : RX6000 제품 간 최대 결과 차이가 거의 없음.

아즈텍 노멀, 하이 : 제품 간 결과 차이는 있으나 코어 연산성능이 제대로 반영되지는 않았고 메모리 대역폭에 성능이 비례하는 경향을 보임. 어쨌든 일단 비교에 활용할 수는 있을듯.

 

차기 엑시노스의 메모리 사양은 LPDDR5 64bit 6400MHz로 추측됨.

JEDEC 표준에서 LPDDR5 클럭은 최대 6400MHz이고 최근에 삼성에서 양산 발표한 사양임.

그 이상은 LPDDR5X인데 이건 3nm 제품부터 적용될 것으로 보임.

(링크 : 파운드리, 메모리 단신 (2021.04.03. 삼성, TSMC, 엔비디아))

이 경우 메모리 대역폭은 51.2GB/s 이고, 이는 RX6700XT 메모리 대역폭의 13.3% 수준.

찌라시상 아즈텍 노멀, 하이 결과가 RX6700XT의 16%, 13.5% 수준인걸로 보아 어느 정도 들어맞는듯.

특히 최근 찌라시 내용이 아주 근접.

메모리 대역폭-벤치마크 결과 경향에서 아즈텍 노멀이 더 오차범위가 작음.

 

 

- 엔비디아 사례

테그라 GPU와 모바일, 저전력 GPU 사양을 비교해보면 TDP 10W 선에서 비슷한 사양(코어, 클럭)을 갖고 있음.

데스크탑용 GPU와 비교하면 파스칼 아키텍처의 경우 코어 사양, 클럭과 TDP가 비례하는 경향이 보임.

(코어 사양 x 클럭과 TDP의 관계이고 근사적으로 연산성능과 TDP의 관계로 볼 수 있음.)

그 외 케플러, 맥스웰, 볼타 아키텍처는 잘 안 들어맞음.

 

 

- AMD 베가 사례

AMD 아키텍처로 저전력 GPU 사양을 짐작하려면 APU가 비교 대상으로 가장 적절한데 RDNA1,2 아키텍처를 사용하는 APU가 아직 출시되지 않아서 APU를 비교 대상으로 삼으려면 베가 아키텍처를 끌고 올 수 밖에 없음.

실제 모바일 AP에서 GPU에 할당되는 전력은 10W 미만일 것이고, 베가64, 56과 같은 공정인 14nm이면서 TDP 6W APU의 GPU 사양을 보면 192SP, 12TMU, 4ROP, 600MHz

이 사양과 데스크탑용인 베가64,56 코어의 사양, TDP를 비교해보면 (엔비디아 파스칼과 같이) 연산성능과 TDP가 비례관계로 잘 맞는게 베가56임. (3584SP, 224TMU, 64ROP, 210W)

파스칼 결과와 합쳐보면 오차범위는 ±5%

 

 

- RDNA2 기반 GPU로 추정 (그래픽 카드 성능 계산기)

대근님이 만든 그래픽카드 성능 계산기라는게 있는데 코어 성능, 텍스처/렌더링 성능, 메모리 대역폭, 각 단계 지연 등을 모델링해서 사양이 달라졌을 때 성능을 추정하는 방식임.

이게 아키텍처, 벤치마크마다 각 항목의 반영 값을 찾아야되는데 경험이 없어서 그런지 아즈텍 하이만 어떻게 때려 맞췄음.

(RX6900XT, RX6800XT, RX6800, RX6700XT의 사양과 예측 벤치마크 결과가 아즈텍 하이 실제 결과와 딱 맞는 모델링을 찾았다는 것.)

이 모델링에 엑시노스 GPU 추정 사양을 넣어서 찌라시의 결과와 일치하는 사양을 찾아보면 다음과 같음.

(TMU는 SP 수에 비례, 16ROP, 메모리 대역폭 51.2GB/s 가정)

4CU : 256SP 2.22GHz or 1.68GHz

5CU : 320SP 1.91GHz or 1.44GHz

6CU : 384SP 1.70GHz or 1.29GHz

7CU : 448SP 1.56GHz or 1.18GHz

8CU : 512SP 1.45GHz or 1.09GHz

 

엑시노스 GPU 면적을 보면 25mm2 내외이고, TSMC 7nm 공정의 AMD APU에서 8CU 사양의 GPU 면적이 (아키텍처에 따라 다르지만) 30~35mm2 정도임.

차기 엑시노스 공정이 4nm로 알려져있는데 현재 공개된 정보로는 TSMC 7nm 대비 삼성 4LPE 공정의 면적 이득은 94% 정도임.

엑시노스에서 GPU 면적을 기존과 같게 유지한다면 산술적으로 11CU가 가능함.

하지만 이전부터 말리 GPU의 면적은 문제로 지적되어왔고, 그에 반해 퀄컴의 아드레노 GPU는 절반 이하의 면적으로 더 높은 성능을 보였기때문에 이와 경쟁하려한다면 GPU 면적을 10mm2 초반대로 낮추는게 필요함.

10mm2에 맞춘다면 4CU, 6CU가 되려면 13mm2 내외, 8CU는 18mm2 내외의 면적이 필요한 것으로 계산됨.

예상 면적으로 보아 최대 6CU가 가능할 것으로 보임.

 

4~6CU 중에서 6CU만 해도 추정 클럭이 최대 1.70GHz여서 모바일용 제품에서 가능한 클럭인지 의심스러움.

4nm 공정과 7nm 공정의 스피드 게인 차이(현재 정보로 23% 정도로 예상)를 반영한다고 해도 4nm 기준 1.70GHz는 7nm 기준 1.38GHz으로 여전히 상당히 높음.

하지만 RDNA2 아키텍처가 클럭이 높은 편이고 (특히 저사양으로 갈수록. RX6700XT가 2.3GHz로 베가의 2배 수준.)

베가 아키텍처 사례를 보면 APU의 GPU 클럭이 그래픽 카드 클럭의 50~80% 구간에 있는데 이걸 위 가정에 반영해보면

TSMC 7nm 공정의 RX6900XT 클럭의 80%가 1.46GHz여서 4nm 기준 1.70GHz가 불가능한 값은 아님.

하지만 그보다 CU수가 줄고 클럭이 높아지기는 어려울듯.

 

이전 찌라시로 계산된 클럭에 비해 최근 찌라시로 계산된 클럭이 24~25%정도 낮은데

최근 찌라시의 25% 정도 쓰로틀링이 있다는 내용과 숫자가 들어맞음.

우연일지? 실제 쓰로틀링 전후 결과가 유출된 것일지?

 

앞서 연산성능을 기준으로 클럭을 추정하는걸 해보면

베가56과 라인업상 같은 위치에 있는건 플래그십 풀칩에서 일부 컷팅된 최상위칩, RX6800XT임.

TDP 6W 기준으로 잡았을 때, RX6800XT와 같은 공정으로 가정하고 384SP에서 RX6800XT 연산성능의 2%가 되는 클럭을 계산해보면 438MHz

4nm 공정의 스피드 게인을 반영해도 539MHz여서 턱없이 낮은 값임.

이 방식은 잘 안 맞는듯.

 

 

- 정리 : 차기 플래그십 엑시노스 GPU 사양 추정 (4nm, Pamir, Voyager GPU?)

1. 찌라시 성능.

아즈텍 하이 사양-성능 경향으로 보아 개인적으로는 최근 내용이 더 그럴듯한듯.

2020년 3월

맨해튼 3.1 181.8프레임

아즈텍 노멀 138.25프레임

아즈텍 하이 58프레임

 

2021년 2월

맨해튼 3.1 169.2프레임

아즈텍 하이 49.7프레임

2차 테스트시까진 어느정도 프레임을 유지하나 3차부터 쓰로틀링 영향 있어보여. 3차 테스트시 평균 25프로 정도 하락.

 

2. 추정 사양.

삼성 4LPE 공정.

6CU (384SP, 24TMU, 16ROP) 1.29GHz

면적 13mm2 내외.

 

 

- 2021.07.18. 최근 찌라시 내용을 추가하면서 수치 변경.

 

 

 

반응형
Posted by gamma0burst Trackback 0 : Comment 8

댓글을 달아 주세요

  1. addr | edit/del | reply 2021.07.17 14:35

    비밀댓글입니다

  2. addr | edit/del | reply shaind 2021.07.19 11:20

    아이스 유니버스가 직접 다이샷을 봤다면서 6cu라고 하네요.

  3. addr | edit/del | reply 2021.07.19 11:30

    비밀댓글입니다

  4. addr | edit/del | reply ny 2021.08.04 23:47

    아즈텍 하이에서 6800xt가 500fps 정도 나오는데,
    쉐이더 병목으로 40fps 정도가 한계 아닐까 싶네요...

    아즈텍 노말에선 말씀하신대로 높게 나올 가능성이 있겠지만요.

  5. addr | edit/del | reply BlogIcon ㄷㄷ 2021.08.05 01:44

    아무래도 rdna는 WGP가 기본 단위 같은데
    지금까지와 달리 홀수개 cu가 될지 궁금해지더라구요.
    요즘 rdna3 wgp가 256sp가 된다는 루머가 막 떠돌더라는...

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2021.08.05 02:17 신고

      CU없이 WGP 단위로 재편되면 최소 단위는 WGP로 가겠지요.
      그럼 CU 기준으로 홀수개가 되기는 어려워보이네요.

  6. addr | edit/del | reply 하루살이 2021.08.12 01:11

    스팀덱 벤치가 나온다면 정확한 추측이 가능할텐데 아쉽네요...

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2021.08.12 02:31 신고

      시간이 해결해주겠지요.
      렘브란트가 먼저 나오냐, 스팀덱이 먼저 나노야겠네요.