본문 바로가기
스마트폰/삼성 SAMSUNG

엑시노스8895 GPU 성능. (Exynos8895, Mali-G71MP20)

by gamma0burst 2017. 5. 4.
반응형

- 갤럭시S8/8+ 탑재 엑시노스8895 GPU 성능분석입니다.

Mali-G71MP20 546MHz 사양입니다.

갤럭시S8 커널에 특별한 내용은 없었고 GPU 클럭 테이블은 아래와 같습니다.

839 764 683 572 546 455 385 338 260MHz



- GFX 벤치 결과

(링크 : https://gfxbench.com/device.jsp?benchmark=gfx40&os=Android&api=gl&D=Samsung+Galaxy+S8%2B+%28Mali-G71%2C+SM-G955x%29&testgroup=overall)

드라이버 버전은 r3p0


하이레벨 테스트 결과를 정리하면 아래와 같습니다.

맨해튼, 티렉스 클럭은 정확하다 장담할 순 없지만 이전 제품과의 성능 격차, 같은 GPU 아키텍처를 쓰는 타사 AP 성능 등을 종합적으로 고려해봤을 때 가장 적당한 값을 선택했습니다.


하이레벨 테스트 결과를 보면 8890 -> 8895에서 카 체이스 +54% / 맨해튼3.1 +40% / 맨해튼 +46% / 티렉스 +35% 증가하였습니다.

(나중에 다룰 기회가 있겠지만 스냅835 A540 710MHz 결과와 비슷합니다.)

삼성 공식 사이트에서 GPU 성능 +50%라고 하는데 정확한 기준은 모르겠지만 실제 결과와 크게 벗어나지 않는 수준으로 보입니다.

(링크 : http://www.samsung.com/sec/smartphones/galaxy-s8/performance/)


아키텍처 측면에서보면 T880 -> G71에서의 성능향상은 평균 +10% 정도로 보입니다.

(MP수 증가로 인한 효율저하가 있을 수 있겠으나 심각한 수준은 아닌 것으로 보입니다.)

미디어텍, 화웨이 제품을 기준으로 했을 때 15~20% 정도로 잡혔던 것에 비하면 낮은 편인데, 엑시노스의 경우 출시 후에도 드라이버 업데이트 등으로 꾸준히 성능 올라간데 반해 다른 업체는 초기 성능에서 정체된 영향인 것으로 생각됩니다.

(엑시노스8890의 경우를 보면 출시 후 현재까지 3~7% 정도 결과가 올라갔습니다.)

다르게 보면 G71 역시 추가로 성능이 올라갈 여지가 있다고 볼 수 있습니다.

맨해튼3.1의 경우 아키텍처에 의한 성능향상이 전혀 보이지 않는데 향후 성능이 올라갈 가능성이 있는거지요.



- Mali-G71 연산성능

GFX벤치 ALU2 결과를 보면 엑시노스8890 : 48 fps / 엑시노스8895 : 110.1 fps로 2.3배 올랐습니다.

동일 사양으로 계산해보면 T880 -> G71 에서 +64%의 향상이 있습니다.

Adreno 사례도 그렇지만 아직까지 ALU2 테스트 구성을 정확히 모르겠네요.


다른 앱으로 GPU GFLOPS라는게 있는데 GPU 연산성능을 잘 테스트하는듯 합니다. (개발자가 ioncannon인듯)

(링크  : http://www.coolapk.com/apk/com.ioncannon.cpuburn.gpugflops)


 

(왼쪽 : 엑시노스8895, 오른쪽 : 엑시노스8890)

이 앱으로 테스트한 결과를 보면 엑시노스8890 : 197.2 GFLOPS / 엑시노스8895 : 338.6 GFLOPS로 +72% 연산성능이 증가했습니다.

동일 사양은 환산해보면 T880 -> G71 에서 +23% 증가했습니다.


일단 벡터에서 스칼라 구조로 바뀌면서 효율이 좋아진건데 구체적인 수치를 뽑아보겠습니다.

T880은 1MP에 3ALU, G71은 1MP에 3 Execution engine이 있습니다.

다 ALU로 표기하기로 하고 ALU당 연산성능을 계산하면 아래와 같습니다.

T880 : 197.2 / 0.650 / 12 = 25.28 FLOPS/MP -> 8.43 FLOPS/ALU

G71 : 338.6 / 0.546 / 20 = 31.00 FLOPS/MP -> 10.34 FLOPS/ALU

 

1ALU당 연산성능이 정수로 떨어진다고 본다면 T880은 9 FLOPS/ALU, G71은 11 FLOPS/ALU가 될겁니다.

미드가르드 아키텍처 1ALU 구성이 FP32 유닛 x4 + Scalar 유닛 x1 으로 알려져있는데, 여기서 9 FLOPS/cycle이 나온다면 정말 정직하게 FP32 유닛이 2op/cycle, Scalar 유닛이 1op/cycle 해서 2x4 + 1x1 = 9 의 결과가 나왔다는게 됩니다.


비프로스트 아키텍처의 1ALU(Execution engine)은 32bit x4 구조로 1FMA + 1ADD/SF 구성이어서 이론적으로 FP32 기준 4 x3 = 12 op/cycle 입니다.

(링크 : ARM Mali-G71 발표. (코드네임 : 비프로스트, Bifrost))

앞서 엑시노스8895 연산성능에서 계산된 값이 10.34 FLOPS/ALU 였으니 이론치보다 낮습니다.

클럭이 546MHz가 아닌 바로 아래의 455MHz였다고 가정하고 다시 계산해보면 이론적으로 327.6 GLFOPS가 나옵니다.

위의 테스트 결과에서 AVG값인 320.5 GFLOPS보다 약간 높아서 실제 대부분 테스트는 455MHz로 돌아갔고,

초반 피크 구간도 최대 클럭에 미처 도달하지 못하고 455MHz로 내려간 것으로 해석할 수 있을듯 합니다.


앱이 잘 알려진게 아니어서 테스트 결과가 정말 없는데 테스트 결과가 추가로 나온다면 최대 393 GFLOPS까지도 기대해볼 수 있겠네요.

 

 

- 쓰로틀링 테스트

GFX벤치 맨해튼 오프스크린을 20회 loop 진행한 결과입니다.

시간으로는 20분 정도라고 하네요.

(링크 : https://www.computerbase.de/2017-04/samsung-galaxy-s8-plus-test/#abschnitt_throttling_noch_im_rahmen)

엑시노스8895는 3회차부터 455MHz로 떨어지고, 10회 이상 유지되다가 16회차부터 338MHz로 떨어집니다.

15분이상 455MHz는 유지하니 괜찮다고 볼지, 최대 값 대비 상대적으로 떨어지는 정도를 중요시할지, 절대 프레임을 중요시할지 등등 판단은 각자 알아서.

 

 

- 정리 : 엑시노스8895 GPU

Mali-G71MP20 최대 546MHz

엑시노스8890 (Mali-T880MP12) 대비 하이레벨 결과 +45~50%

맨해튼3.1 에서 +10% 정도의 추가 성능 향상 가능성


T880 대비 G71 향상치

 GFX벤치 하이레벨 테스트 : +10~15%

 연산성능 : +33% (1ALU당 연산성능 9 FLOPS/cycle -> 12 FLOPS/cycle)

 

 

 

반응형

댓글