본문 바로가기
스마트폰/삼성 SAMSUNG

엑시노스9810 GPU(Mali-G72) 성능 분석. (GFX벤치)

by gamma0burst 2018. 4. 15.

- 많이 늦었지만 엑시노스9810 GFX벤치 결과 분석, Mali-G72 GPU 성능 분석입니다.

커뮤니티들에서 한바탕 소란이 지나갈 때까지 기다린 감도 있습니다.

 

 

- GFX벤치 결과

(링크 : https://gfxbench.com/device.jsp?benchmark=gfx40&os=Android&api=gl&D=Samsung+Galaxy+S9%2B+%28Mali-G72%2C+SM-G965%29&testgroup=overall

https://gfxbench.com/device.jsp?benchmark=gfx40&os=Android&api=gl&D=Samsung+Galaxy+S9+%28Mali-G72%2C+SM-G960%29&testgroup=overall)

사양은 Mali-G72MP18 572MHz

드라이버 r9p0

 

엑시노스8895(G71MP20), SDM845(Adreno640)와 비교하면

카 체이스 : 엑시노스8895 대비 +11%, SDM845 대비 -20%

맨해튼3.1 : 엑시노스8895 대비 +10%, SDM845 대비 -23%

맨해튼3.0 : 엑시노스8895 대비 +20%, SDM845 대비 -7%

티렉스 : 엑시노스8895 대비 +18%, SDM845 대비 -3%

 

엑시노스9810 그래픽 성능이 전작(엑시노스8895) 대비 +20%라고 밝혔는데 맨해튼3.0 기준으로 공식 발언은 지켰습니다.

(링크 : http://www.samsung.com/semiconductor/minisite/exynos/products/mobileprocessor/exynos-9-series-9810/)

 

 

- Mali-G72/엑시노스9810 GPU 성능 분석

Mali-G72에 대한 내용과 엑시노스9810에 대한 내용이 섞여 있습니다.

둘의 내용을 분리해서 다루기가 어렵네요.

 

G72 성능에서 따져볼 항목은 세 가지입니다.

성능, 전력 효율, 면적 효율(성능 밀도)

 

1. 성능

MP수가 많은 제품끼리 동사양 성능을 비교해보면 G71 대비 성능향상치는

카 체이스 +18% / 맨해튼3.1 +16% / 맨해튼3.0 +11% / 티렉스 +3% / ALU2 +3%

 

MP수가 적은 제품끼리 동사양 성능을 비교해보면 G71 대비 성능향상치는

카 체이스 +15% / 맨해튼3.1 +10% / 맨해튼3.0 +16% / 티렉스 +4% / ALU2 +4%

 

앞선 내용과 대동소이합니다.

(Helio P60 탑재 Oppo R15 리뷰 : https://www.sogi.com.tw/articles/oppo_r15_pro/6250766

긱벤치 사이트에서는 OPPO PACM00 이나 MT6771V/C 로 검색하며 나옵니다.)

 

일단 그래픽 성능은 G71 대비 +15% 내외, 연산성능은 동급.

 

2. 전력효율.(전력대성능비)

ARM 발표대로면 G72는 G71 대비 에너지 효율 +25%, 성능 밀도 +20%

(동일 공정 노드, 비슷한 조건)

(링크 : ARM Cortex-A75/A55, Mali-G72 발표.)

 

비슷한 조건에서 G71 대비 에너지 효율 +25% 라고 하는데

시스템 전체 전력 기준이지만 엑시노스8895 대비 전성비가 맨해튼3.1 기준으로 1.95배, 티렉스 기준 1.58배로 엄청나게 올라갔습니다.

(링크 : https://www.anandtech.com/show/12520/the-galaxy-s9-review/6)

(엑시노스8895,9810 공정 차이를 반영하면 맨해튼3.1 기준 1.66배, 1.34배)

스냅드래곤835는 넘어갔고, SDM845에 5% 정도 떨어지는 수준까지 따라왔습니다.

SDM845가 갤럭시S9+고, 엑시노스9810이 갤럭시S9라서 시스템 전력상 SDM845가 불리할 수도 있으니 실제 GPU 전력만으로 계산한 값에서는 차이가 더 벌어질 수도 있습니다만 어쨌든 이 정도면 장족의 발전.

시스템 전력이라서 실제와 전성비 값 자체는 다를 수 있겠으나 최소한 저 값들보다 낮지는 않을겁니다.

GPU외의 소비전력을 제외하면 전성비 차이는 더 커집니다.

 

ARM이 언급한 전력 효율 25%보다 훨씬 큰데 절대 성능 향상을 의도적으로 억제한 영향도 있을듯 합니다.

엑시노스8895(갤럭스S8)의 전력이 맨해튼3.1 7.35W, 티렉스 5.86W

엑시노스9810(갤럭시S9)의 전력이 맨해튼3.1 4.08W, 티렉스 4.34W

갤럭시S8 기준으로 설정했다면 GPU 전력, 성능을 더 끌어올릴 여지가 있었다는겁니다.

ARM 발표에서 G72 탑재 제품이 2017년 제품 대비 성능 +40%라고 하는데, 이걸 엑시노스9810이라고 가정한다면 G72의 전력효율 +25%에 공정 성능 +10%를 반영해서 +37.5%로 계산할 수 있고, 이 때 맨해튼3.0 성능은 64.8 x1.375 = 89.1 fps

현재 엑시노스9810 결과 대비 +15%이고 역산하면 627MHz 일 때의 성능입니다.

커널상 676MHz까지 있었으니 비현실적인 클럭도 아니고, 전력을 폭주시킬만한 클럭 상승도 아닙니다.

(링크 : 갤럭시S9 커널 정보. (엑시노스9810판))

엑시노스8895,9810 공정 성능 차이 10%만 단순 반영해도 엑시노스9810 GPU 클럭은 546 x1.1 = 600MHz이고, MP수가 줄어들거나 GPU 아키텍처의 전력효율 향상치까지 포함하면 그 이상의 클럭설정이 가능했을겁니다.

커널에서 637MHz로 설정했던 흔적이 있었던 것처럼 말이지요.

(링크 : 갤럭시S9 커널 정보. (엑시노스9810판))

(물론 그렇게하면 쓰로틀링 특성이 악화됐을거고 무선사업부에서 이런 점을 부담스러워서 이렇게 설정했을 수도 있습니다.)

결국 최대 성능을 포기한 대신 높은 전력효율을 선택했다고 봐야할듯 합니다.

고성능 구간을 포기하고 고효율 구간을 선택한거지요.

 

3. 성능 밀도.(면적대성능비)

성능 밀도=면적대비성능은 엑시노스8895의 GPU 면적 정보가 없어서 직접적으로 비교하기는 어려울 것 같습니다.

ARM 발표 내용에서 이미 G72 면적이 4% 정도 증가했을 것으로 예상했습니다.

(링크 : ARM Cortex-A75/A55, Mali-G72 발표.)

 

(링크 : http://www.techinsights.com/about-techinsights/overview/blog/samsung-galaxy-s9-teardown/)

다이 이미지로 보면 GPU면적이 24.5mm2 정도로 상당히 큽니다.

(A630이 확인된걸로는 10.1mm2 정도로 2배 이상 작습니다. 그런데 성능은 10~20%정도 높지요.)

10LPP와 10LPE의 공정 면적 차이가 없다고 보고, G72MP18 면적이 24.5mm2

앞서 G71 -> G72의 면적 증가를 +4.2%로 예상했으니 이걸로 G71MP20 면적을 단순 계산해보면 26.1mm2

24.5mm2보다 7%정도 넓습니다.

MP1 면적으로 G72MP19를 계산하면 25.6mm2, MP20이라면 26.7mm2가 나옵니다.

 

면적 증가 비율이 크게 틀리지 않았다는 가정하에 전후사정을 끼워맞춰보면,

엑시노스8895->9810으로 오면서 빅코어 CPU 면적이 2.36배로 늘었습니다.

(4코어 기준8.21mm2 -> 19.4mm2)

MP20에서는 전작보다 GPU 면적이 커지는데 CPU 면적이 늘어난 상황에서 GPU 면적까지 늘어나는건 허용하기 어려웠을 것이고, MP수를 더 줄이면 성능을 위해서 클럭을 올려야해서 전성비, 절대성능 둘 다 못 잡는 결과가 될겁니다.

결국 MP18정도로 타협된듯 합니다.

 

정리해보면 G72는 면적대성능비를 희생해서 전력대성능비 얻었고,

무선 혹은 S.LSI에서는 여기에 추가로 절대성능을 희생해서 전력대성능비를 더 높인듯 합니다.

 

 

- GPU 성능 추세

(플래그십 AP GPU 성능 추세)

전성비를 얻고 절대성능을 포기한 대가는 생각보다 크게 돌아올 가능성이 높아보입니다.

 

SDM845(A630)은 더 높은 방향으로 아드레노 계열의 성능 추세를 이탈했습니다.

그에 반해 엑시노스9810은 낮아지는 방향으로 성능 추세를 이탈했습니다.

기존 추세대로였다면 이번에 A630 정도의 성능이 나왔어야했지요.

기존 추세로 돌아가기위해서는 19년 3월 출시 제품(차기 플래그십 엑시노스, 갤럭시S10 탑재?) 성능이 맨해튼3.0 기준 102 fps 정도 나와야 합니다.

엑시노스9810이 77.6 fps이니 여기서 +30% 이상 올려야 합니다.

 

물론 그 정도 성능향상 전례가 없었던건 아닙니다.

5433부터 8895까지 작게는 30%, 크게는 70% 이상의 성능 향상이 있었습니다.

하지만 그건 planar -> finfet 이라는 공정의 퀀텀점프, MP8->MP12->MP20 으로 이어지는 급격한 다이사이즈 증가, 사양 증가의 힘이 컸습니다.

이미 늘어날만큼 늘어나서 되려 MP수를 줄여야되는 최근 상황, 상대적으로 면적과 성능에서 이득이 적은 8LPP로의 공정 전환 이라는 조건에서 30% 증가가 쉬워보이지는 않습니다.

(EUV 7nm 공정의 조기도입을 얘기하는 경우도 있으나 가능성은 0이라 봐도 무방합니다.)

 

이번처럼 피크 성능보다 전력효율을 우선시하는 방침이 바뀌지 않는다는 가정 하에서 +30% 성능 향상은 온전히 GPU 아키텍처의 개선에 달려있습니다.

10LPP->8LPP에서의 성능 향상이 +5%정도로 예상되는데, 아키텍처나 MP 증가가 나머지 25%를 책임질 수 있어야겠지요.

(링크 : 파운드리 공정 비교. (2018.02.24.))

S-GPU는 당장 어렵다고 생각한다면 ARM 아키텍처 밖에 선택지가 없는데 기존의 말리 아키텍처 변경에 따른 성능 향상치는 다음과 같습니다. (맨해튼3.0 기준)

T760->T880 : +38% / T880->G71 : +26% / G71->G72 : +11%

점점 향상치가 낮아지고 있지요.

이런 추세에서 갑자기 T760->T880 시절로 돌아갈 수 있을까요.

 

게다가 최근의 AP 사양 추세는 성능만을 바라보며 GPU 면적의 무조건적인 확장을 허용하는 분위기가 아닙니다.

빅코어는 싱글성능을 위해 확장되었는데 이는 시작해버린 이상 이제 되돌릴 수 없는 흐름이고, NPU같은 머신러닝을 위한 유닛도 들어가야하는 등 GPU를 위한 면적은 점점 작아지고 있습니다.

즉, MP수가 더 이상 늘어나기는 어려워지고 있습니다.

그렇다면 차기 말리 아키텍처는 MP 감소치까지 커버해야하기때문에 성능 향상은 25%가 아니라 그 이상이 되어야 할겁니다.

그런데 전례를 봐도 최대치가 40%도 안 됩니다.

전례없는 성능 향상을 보여줘야하는데 과연 가능할까요.

 

 

- 정리

1. Mali-G72 성능

Mali-G71 대비

그래픽 성능 +15%, 연산성능 동급.

면적 증가.

전력대성능비 향상. ARM 발표치인 +25%가 대략 맞는 것으로 추정.

 

2. 엑시노스9810 GPU 성능

Mali-G72MP18 572MHz

엑시노스8895(Mali-G71MP20 546MHz) 대비 그래픽 성능 +10 ~ +20%

SDM845(Adreno630) 대비 그래픽 성능 -5 ~ -25%

성능보다는 전력 효율 위주의 셋팅을 한 것으로 보이며, 그 덕에 G72 자체의 전력 효율 개선치보다 더 높은 효과를 얻은 것으로 추정.

 

 

 

댓글23