- 갤럭시S7 탑재 엑시노스8890 GFX벤치 결과 분석입니다.

링크 : https://gfxbench.com/device.jsp?benchmark=gfx40&os=Android&api=gl&D=Samsung+Galaxy+S7+%28Mali-T880%2C+SM-G930x%29&testgroup=overall

링크 : https://gfxbench.com/device.jsp?benchmark=gfx40&os=Android&api=gl&D=Samsung+Galaxy+S7+edge+%28Mali-T880%2C+SM-G935x%29&testgroup=overall

스냅820 Adreno530과 성능 비교는 아주 간단히 넘어갈거고, T880 성능 얘기 위주로 할겁니다.

 

 

- 결과

AP

GPU

MP

CLK FREQ
(MHz)

FPS

Car Chase
offscreen

Manhattan 3.1
offscreen

Manhattan
offscreen

T-Rex
offscreen

ALU2
offscreen

Exynos 5433

T760

6

700/700/700/600

7.6

11.5

17.9

42

13.7

Exynos 7420

T760

8

772/772/772/700

9.1

16.6

25.1

61.6

20.1

MT6755

T860

2

700

2.5

4.8

7.2

17.5

6

Kirin 950

T880

4

800

6.3

10.3

18

41.8

19.5

Exynos 8890

T880

12

650/650/600/546

15.5

29.2

40.7

88.8

42.6

 

왜 클럭이 저럴거라고 보는가 하면,

엑시노스5433, 7420 은 이전부터 얘기했던 내용이고, MT6755는 사양, 기린950은 이전에 언급했습니다.

(링크 : 엑시노스8890 GFX벤치 유출 결과 분석. (Exynos8890, Mali-T880MP12))

엑시노스8890은 커널정보 기준입니다.

 

 

- 클럭 설정 (커널)

최근 올라온 갤럭시S7 커널을 보면 이렇습니다.

(커널에서 새로운 내용이 몇 개 있기는한데 따로 다를 정도로 많지는 않아서 일단 계속 보는 중입니다.)

 

 

 

클럭을 보면 806 754 728 702 650 600 546 419 338 260

하지만 아래에 나올 내용이나 현재 출시 상태를 봐서는 최대 클럭은 650MHz 입니다.

이를 알 수 있는 부분이 650MHz 항목에 나오는 cpu_egl_max 항목.

다른 부분은 CPU_MAX로 나오는데 650MHz만 156000 입니다.

아래 부분을 보면 GPU_BOOST_EGL_MIN_LOCK, 1872000 으로 나오는데

이건 GPU 클럭이 650MHz 일 때는 빅코어 최대 클럭은 최대 1.56GHz로 제한된다는 내용으로 보입니다.

(아니면 1.9GHz?)

GPU가 650MHz 일 때는 빅코어 클럭을 제한할 정도로 전력이 올라간다는겁니다.

그 이상으로 클럭을 올리는건 힘들다고 봐야겠지요.

또한 다른 대부분의 일반적인 상황에서는 600MHz 동작이 한계라고 보입니다.

이런 식으로 보면 650MHz라는 클럭은 일종의 덤, 부스트 클럭으로 볼 수 있습니다.

 

GPU 최대 클럭 650MHz 로 나옵니다.

 

보면 전력 상수(power_coeff)가 625 입니다.

위에 나온 클럭, 전압으로 650MHz에서의 전력을 계산해보면 625 x 0.8^2 x 0.65 = 260, 2.6W로 나옵니다.

702MHz 조건으로 계산하면 625 x 0.85^2 x 0.702 = 317, 3.17W 가 됩니다.

엑시노스7420 GPU 전력이 커널상 2.88W 였습니다.

(링크 : 갤럭시S6 커널 정보. (엑시노스7420, 엑시노스5433 64bit, 엑시노스7580))

3W 선이 한계 전력이고 702MHz에서는 전력이 크게 올라가니 650MHz 선에서 클럭이 정해진듯 합니다.

 

 

- Mali-T880 성능 분석

테스트별 클럭을 추정을 해보면,

카 체이스, 맨해튼3.1 : 650MHz

맨해튼 : 600MHz

티렉스 546MHz

카 체이스, 맨해튼3.1은 최대 클럭이니 그렇다쳐도 맨해튼 클럭이 낮은건 650MHz로 계산시 기린950 이나 기존 T860보다 사양대비 성능이 떨어지게 나오기때문입니다.

600MHz로 계산하면 기린950하고 비슷해지기도 하고요.

티렉스 클럭이 이보다 더 낮아진 것도 비슷한 이유입니다.

이렇게보면 기존에 2단계로 테스트 클럭이 정해진 것이 이번에는 3단계로 세부화 됐습니다.

 

사양대비성능을 비교해보면 이렇습니다.

 

AP

GPU

MP

FPS/MP/clk Ratio

Car Chase
offscreen

Manhattan 3.1
offscreen

Manhattan
offscreen

T-Rex
offscreen

ALU2
offscreen

Exynos 5433

T760

6

0.001810

0.002738

0.004262

0.011667

0.003806

Exynos 7420

T760

8

0.001473

0.002688

0.004064

0.011000

0.003589

MT6755

T860

2

0.001786

0.003429

0.005143

0.012500

0.004286

Kirin 950

T880

4

0.001969

0.003219

0.005625

0.013063

0.006094

Exynos 8890

T880

12

0.001987

0.003744

0.005653

0.013553

0.006502

 

AP

GPU

MP

FPS/MP/clk Ratio

Car Chase
offscreen

Manhattan 3.1
offscreen

Manhattan
offscreen

T-Rex
offscreen

ALU2
offscreen

Exynos 5433

T760

6

100%

100%

100%

100%

100%

Exynos 7420

T760

8

81%

98%

95%

94%

94%

MT6755

T860

2

99%

125%

121%

107%

113%

Kirin 950

T880

4

109%

118%

132%

112%

160%

Exynos 8890

T880

12

110%

137%

133%

116%

171%

 

아키텍처별 성능 차이를 비교해보면 이렇습니다.

AP

GPU

MP

FPS/MP/clk Ratio

Car Chase
offscreen

Manhattan 3.1
offscreen

Manhattan
offscreen

T-Rex
offscreen

ALU2
offscreen

Exynos 5433

T760

6

100%

100%

100%

100%

100%

MT6755

T860

2

99%

125%

121%

107%

113%

Exynos 8890

T880

12

110%

137%

133%

116%

171%

 

카 체이스, 맨해튼3.1, 맨해튼, 티렉스 순으로 성능향상치를 보면,

T760 -> T860 : 0%, +25%, +21%, +7%

T860 -> T880 : +10%,+9%, +10%, +8%

 

T860 대비 T880은 전체적으로 +10% 수준입니다.

티렉스는 나온지 오래된 테스트라서 최적화의 여지도 적으니 그러려니.

 

같은 T880인데도 사양대비성능에서 기린950이 엑시노스8890보다 낮은건 (특히 맨해튼3.1 차이는 16%) 드라이버의 차이로 보입니다.

기린950은 r7p0, 엑시노스8890은 r9p0 입니다.

 

ALU2 결과(연산성능)를 보면 T860 - T880 차이는 +52% 입니다.

T860 -> T880 에서 MP당 ALU 수가 1.5배(2개 -> 3개)로 늘어났으니 사양에 맞는 결과입니다.

 

 

- 예상보다 낮은 Mali-T880 성능

최초에 미디어텍 발표 정보 등을 통해 T880 성능은 T860 대비 +20% 정도로 봤습니다.

그런데 실제는 +10% 정도로 나왔지요.

미디어텍이 공개한 정보의 형태가 기존 제품 대비 몇% 성능 향상이라는 식인데, 이게 틀렸단 얘기입니다.

(링크 : ARM Mali-T880 그래픽 성능 추정. (update 2015.08.26))

아무래도 미디어텍은 ARM에게 제공받은 정보를 근거로 사양을 설정하고 기존 제품과의 성능 차이를 계산해서 표기했을겁니다.

그렇다면 T880에서의 성능이 초기 예상치보다 낮게된건, ARM의 초기 제공 정보보다 실제 성능치가 낮게 나왔기때문일 가능성이 있습니다.

(링크 : ARM Mali-T880 그래픽 성능 추정. (update 2015.08.26))

이런 가능성을 의심하게 하는게 최근 미디어텍이 헬리오 X25를 발표하면서 나온 헬리오 X20 사양입니다.

 

(링크 : http://chinese.engadget.com/2016/03/16/mediatek-helio-x25-x20/)

최근 발표에서 미디어텍은 헬리온 X20 사양을 T880MP4 780MHz로 발표했는데,

최초 발표시에는 700MHz 였습니다.

(링크 : ARM Mali-T880 그래픽 성능 추정. (update 2015.08.26))

그렇다면 700MHz에서의 성능이 예상보다 낮아서 클럭을 올렸다는 추측이 가능합니다.

기존 정보대로면 T860 700MHz -> T880MHz 700MHz 에서 +20% 였습니다.

그런데 실제 T860 700MHz -> T880MHz 780MHz 에서 +20%가 된다는겁니다.

그렇다면 동클럭에서 T860과 T880의 성능 차이는 700/780 x 1.2 = 1.077, 7.7% 라는게 됩니다.

티렉스에서 둘의 성능 차이가 8% 수준이니 일단 앞뒤 정황은 들어맞습니다.

 

 

- Adreno530 과 성능 비교

갤럭시S7 스냅820 버전과 비교해보면 이렇습니다.

 

AP

GPU

MP

CLK FREQ
(MHz)

FPS

Car Chase
offscreen

Manhattan 3.1
offscreen

Manhattan
offscreen

T-Rex
offscreen

Exynos 8890

T880

12

650/650/600/546

15.5

29.2

40.7

88.8

Snapdragon 820

A530

 

624MHz

18.4

32.2

48.8

93.1

Exynos8890 (+20% est)

T880

12

650/650/600/546

16.7

32.1

44.4

98.3

 

티렉스를 제외하면 스냅820 대비 평균 15% 정도 낮습니다.

ARM 초기 정보(추정)대로 T860 대비 +20% 였을 때의 추정 성능이 맨 밑 줄입니다.

스냅820과 성능 차이가 크게 줄어들지요.

티렉스는 계산상 저렇게 나왔지만 현재 나온 7~8% 수준에서 벗어나기 힘들었을듯 합니다.

 

결국 ALU 수를 늘린 효과는 있었지만 충분하지 않았다고 봅니다.

최대 MP16까지 지원하다는 GPU에서 MP12라는, 최대 사양에 가까운 MP수를 도입했음에도 불구하고 경쟁 제품과의 성능 격차는 여전히 존재하고 있습니다.

더 이상 부족한 사양을 탓하기는 힘든 상황인거지요.

아키텍처에 근본적인 한계가 있다는 결론을 피할 수 없습니다.

이래서는 쓰는 업체 입장에서도 슬슬 짜증나는 않을런지......

 

 

- 정리

엑시노스8890 GPU

Mali-T880MP12

650MHz 연산성능 : 397.8 GFLOPS

 

1. 갤럭시S7 성능/클럭 설정

카 체이스, 맨해튼3.1 : 650MHz

맨해튼 : 600MHz

티렉스 : 546MHz

스냅드래곤820 (Adreno530) 대비 평균 -15% (티렉스 제외. 티렉스는 -5%)

 

2. 전력

650MHz : 2.6W

702MHz : 3.17W

실제 전력은 온도, 누설전력 등에 따라 더 높아질 수 있음.

 

3. Mali-T880 성능

(카 체이스, 맨해튼3.1, 맨해튼, 티렉스 순.)

T760 -> T860 : 0%, +25%, +21%, +7%

T860 -> T880 : +10%,+9%, +10%, +8%

 

 

 

신고
Posted by gamma0burst Trackback 0 : Comment 14

댓글을 달아 주세요

  1. addr | edit/del | reply asdf 2016.03.19 18:21 신고

    경쟁사보다는 떨어지긴하지만 말리치고는 선방하긴했네요. 저 전력소모는 GPU단독 전력소모겠죠? 모바일쪽은 전력소모비중에서 램이 차지하는 비중이 크던데말이지요. 그거까지합치면 꽤 크겠지요

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2016.03.19 18:45 신고

      전력때문에 클럭을 올릴 여유는 더 이상 없을거고, 드라이버 버프 밖에 믿을게 없을겁니다.
      전력은 GPU 단독입니다.
      메모리 전력은 순수 램 소모전력도 있지만 내부적인 인터페이스, 클럭 도메인 등의 램관련 파트의 전력 비율도 상당합니다.
      그런 것까지 다 종합해서 램 전력이라고 본다면 비중이 크다고 할만 합니다.

  2. addr | edit/del | reply 흡혈귀왕 2016.03.19 19:27 신고

    테이블에 806MHz이 최대 클럭이면
    올 3분기에 나오는 리비전 모델이 해당 클럭일수도 있겠군요 (750~800MHz??)

    그나저나 ARM은 이번에도 성공했네요....ㅡㅡ

    아주기냥 파닥파닥임 ㄷㄷㄷㄷㄷ

    만일 T880 후속도 미드가르드 아키텍쳐 유지라면
    삼성도 다른 길을 찾아봐야할지도 모르겠습니다.

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2016.03.19 19:46 신고

      (개인 추정치지만) 14LPP -> 16FF+ 스피드 게인이 7% 입니다.
      삼성이 공정 개선해서 추가적으로 올릴 수 있는 여지가 최소 7%는 된다는걸로 볼 수 있고,
      이걸 650MHz에 대입하면 696MHz, 대충 702MHz에 가깝네요.
      702MHz로 역산하면 8% 입니다.
      공정이 바뀌더라도 클럭 테이블상 한단계씩 올라가는 정도에 그칠거 같습니다.

      후속 아키텍처가 mimir인데 이게 어떻게 나오는지가 중요할듯.

    • addr | edit/del BlogIcon A TNT 2016.03.20 13:52 신고

      설마 T990이라고 네이밍 새로 만들고 코어당 ALU 4개 넣는 식으로 미드가르드를 또 우려먹는건 아니겠죠... ㅋ

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2016.03.20 14:01 신고

      T658, T678이 발표만 되고 제품화되지 않은걸봐서는 4ALU/MP 구성이 전력, 성능에 딱히 이득이 없는듯 합니다.
      그렇다면 더 이상 울궈먹을 여지도 없겠지요.
      T760 -> T860에서의 성능 향상치가 제법 있는걸 봐서는 오히려 프론트나 백엔드 좀 더 다듬어서 성능 좀 올리는걸로 대충 떼우고 넘어갈까봐 걱정됩니다.

    • addr | edit/del BlogIcon A TNT 2016.03.21 08:28 신고

      원래 Mali GPU가 성능이 낮게 나오는 이유가 FP 성능의 부족으로 지목 되고 있어시는데 T880에 ALU 구성을 늘리고도 예상 외로 성능 증가폭이 너무 낮네요.

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2016.03.21 16:44 신고

      그러게요.
      30%까지는 아니더라도 20% 정도만 됐어도 충분히 효과적이었을텐데 말입니다.

  3. addr | edit/del | reply 흡혈귀왕 2016.03.19 19:57 신고

    그러고보니 아드레노530도 당초 유출 스펙으로 나온
    650MHz 클럭보다 낮은 624MHz로 나왔으니

    차기 리비전된 스냅드래곤823엔 650MHz
    차기 리비전된 엑시노스889x엔 702MHz 정도로 생각해볼수있겠군요...

  4. addr | edit/del | reply BlogIcon ㅇㅇ 2016.03.20 09:41 신고

    말리가 딱히 인상적인 gpu가 아니군요
    삼성은 파워 vr로 갈아타던가 해야겠어요

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2016.03.20 11:29 신고

      이매지네이션도 애플말고는 그나마 고사양으로 쓰는게 인텔인데 sw 지원이 안 좋은듯 합니다.
      애플에 비해 사양대비성능이 너무 안 나오는데, 나중에 성능 올라가는걸 봐서는 드라이버 등 sw 지원 영향으로 보입니다.
      문제는 해결되는 기간이 너무 오래걸린다는거고요.
      sw 지원이 느리다는거지요.

    • addr | edit/del BlogIcon A TNT 2016.03.21 08:29 신고

      삼성이 예전에 비반테 인수 했다면 어떻게 되었을지 궁금하긴 하군요

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2016.03.21 16:46 신고

      인수한다해도 그래도 쓰지는 않았을거고 자체 GPU 개발에 투입했겠지요.
      애초에 다른 IP에 비해 경쟁력이 있었으면 인수와 관계없이 썼겠지요.
      아키텍처가 근본적으로 밀리든, 지원이 부족했던거든 간에 다른 IP 대비 이렇다 할 장점이 없었을듯.