- 갤럭시S6 엑시노스7420 그래픽 성능 분석입니다.

 

 

- GFX벤치

GFX벤치 결과로 보겠습니다.

3DMark 결과는 아직 올라오지 않은듯 합니다.

(링크 : http://gfxbench.com/device.jsp?benchmark=gfx30&os=Android&api=gl&D=Samsung%20Galaxy%20S6%20Edge%20%28SM-G925%29)

 

 

- 시스템 정보

시스템 정보입니다.

대부분 이미 알려진 사양 그대로입니다.

 

디스플레이 : 5.1", 2560 x 1440

CPU : A57 2.1GHz 쿼드 + A53 쿼드

GPU : Mali-T760MP8

램 : 3GB

용량 : 32/64/128GB

 

GPU가 헥사(6)코어로 표기되고 있는데 이건 시스템 정보가 잘못된겁니다.

밑에서 자세히 다루겠지만 MP6으로 나올 수 없는 결과들입니다.

 

 

- 테스트 결과

테스트 결과는 이렇습니다.

 

오프스크린 기준.

맨해튼 : 26.0 fps

티렉스 : 59.2 fps

ALU : 103.2 fps

텍셀 필레이트 : 5218 MTex/s

 

 

- 결과 분석 (1) ALU, 텍셀

1. ALU

ALU는 최적화 영향에서 비교적 자유롭고 연산성능에 비례하는 결과를 보이기때문에 텍셀필레이트 값과 함께, MP수와 클럭을 계산하기 좋은 도구가 됩니다.

 

갤럭시 노트4, 엑시노스5433, Mali-T760MP6 700MHz의 결과가 70.4 fps 입니다.

(링크 : http://gfxbench.com/device.jsp?benchmark=gfx30&os=Android&api=gl&D=Samsung%20Galaxy%20Note%204%20%28Mali-T760%2C%20SM-N910x%2C%20SM-N916%29)

갤럭시S6, 엑시노스7420 결과는 103.2 fps 입니다.

+47% 정도 높습니다.

 

계산해보면 엑시노스7420은

T760MP6 1026MHz 혹은

T760MP8 770MHz 입니다.

 

아무리 엑시노스7420가 14nm라도 1GHz가 넘는 클럭은 무리입니다.

기술적으로는 가능해도 현실적으로 상용품에 적용하기에는 무리가 있습니다.

T760MP8 770MHz로 보는게 타당합니다.

이전에 했던 추정 클럭과도 일치하는 값입니다.

(링크 : 갤럭시S6 그래픽 성능 추정. (Galaxy S6, Exynos7420))

 

2. 텍셀필레이트

5218 MTex/s 이 나왔습니다.

MP8 이면 8 Tex/cycle 이니 클럭은 652MHz로 계산됩니다.

텍셀필레이트 테스트시 클럭은 650MHz로 보입니다.

전에 갤럭시 알파 커널에서 나온 엑시노스7420 GPU 클럭 테이블은 엑시노스5433하고 같았고,

166 260 350 420 500 550 600 700 으로 나왔는데, 현재는 다른 것으로 보입니다.

(링크 :갤럭시 알파 커널 뜯어보기. (Exynos5433 64bit 지원 논란, Exynos7420))

최소한 600과 700 사이에 650MHz가 있고 700MHz 위에는 770MHz가 있는 것으로 보입니다.

 

 

- 결과 분석 (2) 맨해튼, 티렉스

 

(굳이 그래프를 따로 그릴 필요도 없을겁니다. 다른 제품과의 비교는 이 캡쳐로도 충분할듯.)

 

1. 맨해튼

26.0 fps가 나왔습니다.

갤럭시 노트4(T760MP6 700MHz)가 17.9 fps, 스냅드래곤810(A430 600MHz)가 22.8 fps 입니다.

엑시노스5433 대비 +45%, 스냅드래곤810 대비 +14% 입니다.

 

T760MP6 결과를 근거로 26.0 fps가 나오기위한 사양을 계산하면 T760MP8 763MHz가 나옵니다.

지난 성능 예측 포스팅에서도 언급했듯이 실제로는 성능이 저렇게 선형적으로 증가하지는 않기때문에 클럭은 이보다 높을 것이고, 770MHz로 봐야할듯 합니다.

(링크 : 갤럭시S6 그래픽 성능 추정. (Galaxy S6, Exynos7420))

 

클럭당/MP당 성능은 엑시노스5433와 비슷합니다.

사양증가에 따른 1%정도의 효율감소가 보일뿐입니다.

 

2. 티렉스

59.2 fps가 나왔습니다. (60 fps 가까이 나왔네요.)

갤럭시 노트4(T760MP6 600MHz)가 38.6 fps, 스냅드래곤810(A430 600MHz)가 49.8 fps 입니다.

엑시노스5433 대비 +53%, 스냅드래곤810 대비 +19% 입니다.

 

T760MP6 결과를 근거로 59.2 fps가 나오기위한 사양을 계산하면 T760MP8 690MHz가 나옵니다.

맨해튼처럼 여기서도 사양증가에 따른 효율감소치(1.5%정도)를 반영하면 700MHz가 나옵니다.

굳이 가정을 넣어서 클럭을 보정해주지 않더라도 클럭 테이블에 들어갈만한 숫자로는 690보다 700이 더 적당하겠지요.

 

클럭당/MP당 성능은 역시 엑시노스5433과 비슷합니다.

사양증가로 인해 효율이 1.4%정도 떨어졌네요.

 

 

- 소비전력 추정

전력 계산을 해보지요.

엑시노스5433 에서 시작합니다.

갤럭시 노트4 커널에서 계산되는 20nm T760MP6 700MHz 전력은 4.26W

(링크 :갤럭시 알파 커널 뜯어보기. (Exynos5433 64bit 지원 논란, Exynos7420))

삼성 자료를 보면 14nm는 20nm 대비

동일 전력에서 성능(클럭) +20%

동일 성능에서 전력 -35%

 

14nm T760MP6 700MHz면 4.26W x 0.65 = 2.77W

(공정 성능 향상치 기준은 대게 효율이 가능 높은 전압/클럭 구간일텐데 14nm에서 700MHz가 그 구간인지 알 수 없으니 일단 그대로 갑니다.)

 

14nm T760MP8 700MHz면 산술적으로 2.77W x 8/6 = 3.70W

(MP수가 늘어나면 보통 전력효율이 좋아져서 저렇게까지 선형적으로 전력이 늘어나지는 않을텐데, 바로 앞에서 전력이 더 올라갈 부분을 무시했으니 이걸로 상쇄됐다고 치지요.)

 

14nm T760MP8 770MHz면 3.70W x 770/700 = 4.06W

(클럭이 올라가면 전압도 올라가서 전력이 선형보다 더 올라갈텐데 올라간 클럭이 크지도 않고, 처음 계산에서 14nm 클럭을 여유있게 잡았으니 이 정도도 그 범위 안에 들어가겠지요.)

 

다른 방법으로 해볼까요.

동일 전력에서 성능(클럭) +20%로......

 

20nm T760MP6 700MHz가 4.26W

14nm T760MP6 700 x 1.2 = 840MHz가 4.26W

단순 선형 비례로 계산하면 T760MP8 630MHz가 4.26W가 되겠고, T760MP8 770MHz는 5.21W가 되겠네요.

그런데 클럭이 840MHz까지 올라가면 770MHz 대비 전압이 올라갈텐데, 770MHz에서 전압을 정확히 잡기에는 자료가 부족하네요.

 

앞서 계산한 4W 수준에 맞춘다면 840MHz 전압은 770MHz 전압의 1.11배정도로 나옵니다.

(5.21/4.26 = 1.22222, 제곱근을 구하면 1.106, 전력은 전압제곱에 비례하니까......)

이 방법은 이 정도에서 중지.

 

이래저래 4W 정도로 엑시노스5433 하고 비슷한 수준인듯.

 

 

- 정리 : 엑시노스7420 GPU

14nm Mali-T760MP8

 

1. 맨해튼

770MHz

26.0 fps

엑시노스5433 대비 +45%

스냅드래곤810 대비 +14%

테그라K1 대비 -20%

 

2. 티렉스

700MHz

59.2 fps

엑시노스5433 대비 +53%

스냅드래곤810 대비 +19%

테그라 K1 대비 -12%

 

3. 성능

스마트폰 전력 한도 내에서 최고 성능

 

Mali-T760MP8 770MHz 기준

트라이앵글 : 770 MTri/s

픽셀필레이트 : 6.16 GPix/s

텍셀필레이트 : 6.16 GTex/s

연산성능(FP32) : 209.4 GFLOPS

 

4. GPU 전력 추정

엑시노스5433과 비슷한 4W 선으로 추정.

 

5. 찌라시/잡담

찌라시 대로면 맨해튼 30 fps, 티렉스 60 fps

맨해튼 클럭은 900MHz로 계산됐습니다.

(링크 : 찌라시 읽기 (5) 엑시노스 7420 사양 추정. (Exynos7420))

 

실제 나온건 26 fps, 770MHz

스냅드래곤810의 성능 저하로 타겟 성능을 낮춰잡은거겠지요.

구구절절한 얘기는 이전 성능 추정 포스팅을 참고.

(링크 : 갤럭시S6 그래픽 성능 추정. (Galaxy S6, Exynos7420))

 

저기까지 테스트를 했다는건 클럭이 거기까지 올라가기는 한다는거겠지요.

그리고 수율에 따라 다르겠지만 소비전력까지 괜찮게 가져갈 수 있는 상태로 말이지요.

 

섵부른 판단일지 모르겠지만 잘 하면 오버클럭 커널로 재미보는 사람들이 나올지도 모르겠네요.

뽑기 운이 필요하겠지만 스마트폰에서 실사가능한 오버클럭이 나올지도 모를테니......

 

 

 

신고
Posted by gamma0burst Trackback 0 : Comment 25

댓글을 달아 주세요

  1. addr | edit/del | reply ㅁㅁ 2015.03.04 22:43 신고

    이야 노트4도 GPU배터리 괜찮았는데

    저성능에 노트4의 GPU랑 비슷하게 전력을 먹는다라

    14나노가 참 좋네요

    보고 있나 퀄컴?

  2. addr | edit/del | reply 지나가던폰덕 2015.03.04 22:47 신고

    오옷!!! 드디어 나왔네요ㅎㅎ

    기존 찌라시대로 900 MHz였다면 좋았겠지만, 770 MHz로 해도 무리가 없고, 그렇다해서 테그라 K1하고 멀어진 위치는 아니니 2015년 상반기 상황에서는 스마트폰에 들어가는 물건 중 가장 좋은 물건 같습니다.

    남은건 하반기에 나올 7430, 815, A9.... 역시 기대 중입니다ㅎㅎ

  3. addr | edit/del | reply BlogIcon 흡혈귀왕 2015.03.04 22:51 신고

    보니깐 아직 OpenGL ES3.1 환경에서
    최적화가 덜되거나 클럭 셋팅이 제대로안된듯합니다.

    이번 GFX벤치마크3.1의 맨하탄3.1 결과보면
    이론상 16fps 정도 나오는게 맞을텐데
    10.2fps 정도만 나오더군요...

    컴퓨팅 쉐이더쪽 성능 저하거나
    드라이버 최적화 여부와 관련있을듯한데

    아직 결과 데이터가 덜쌓였고
    제품판에서 어찌될지 모르니 지켜봐야할거
    같네용 ㅋ

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2015.03.04 23:14 신고

      어떻게 16 fps가 이론상의 성능인지 궁금하네요.
      대충 짐작하면 A420, 테그라K1 성능 감소 비율을 반영한거 같기도 하고......

      이게 미드가르드의 한계인듯.
      연산성능이 부족해요.
      그래서 최적화 영향도 심하고, 신규 벤치마크에서는 기본기가 약하니 초반에 힘을 못 쓰고.

  4. addr | edit/del | reply BlogIcon ㅁㅁ 2015.03.04 23:20 신고

    그나저나 이글이 810번째 글이네요 ㅋㅋㅋ
    참 재밌는 우연의 일치네요

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2015.03.04 23:25 신고

      GPU 성능을 먼저 다룬게 다행이네요.
      CPU 성능 비교를 먼저했으면 완전 저 멀리 보내버렸을테니까요.ㅋㅋㅋ

  5. addr | edit/del | reply BlogIcon 흡혈귀왕 2015.03.04 23:24 신고

    확실히 이게 3세대 미드가르드 아키텍쳐
    한계 일수도 있겠네요

    쉐이더 코어의 구조적인 문제로
    상대적인 연산 성능이 떨어지는지라..

    OpenGL ES3.1이
    indirect draw commands를 통해
    오버헤드 감소등이 효과가 있지만

    주된 기능은 역시 GPU의
    쉐이더 유닛으로 물리연산, 이펙트 파티클을
    처리하는 compute shader가 주된 기능이니깐요

    ALU 성능이 떨어지니
    자연스레 퍼포먼스 저하가 있을수 밖에...

    뭐 사실 테그라K1 빼고
    OpenGL ES3.1 맨하탄 결과는 결과라
    말하기도 민망하죠..ㄷㄷㄷ

    늘 이야기했지만 15fps 이하는
    리얼타임이 아닌거나 마찬가지라서 ㅋ

    테그라K1만해도 기존
    OpenGL ES3.0대비 30% 가량
    너프먹더군요 ㄷㄷㄷ

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2015.03.04 23:34 신고

      연산성능 스펙 대비 반토막나는 multiply 성능.
      이게 큰듯.
      그리고 코드 최적화해주면 40%까지 올라가는 mul 성능.

  6. addr | edit/del | reply 성당기사단장 2015.03.04 23:46 신고

    찌라시에서도 오버클럭 가능한 수율이 상당할거라고 나오더군요. 아드레노420도 기존보다 200mhz이상 올리는 분들도 있던데 비슷하지 않을까요.

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2015.03.05 19:59 신고

      전력 측면에서 실사용이 가능한 수준의 오버클럭이 가능할지도 모른다는 가능성의 제시라서, 배터리가 쭉쭉 빠지는 기존 오버클럭과는 차이가 있지요.

  7. addr | edit/del | reply BlogIcon sammy 2015.03.05 01:46 신고

    Do you think the second half of Samsung will use Exynos7890 or own soc?

  8. addr | edit/del | reply 2015.03.05 11:37

    비밀댓글입니다

  9. addr | edit/del | reply ㅇㅇ 2015.03.06 04:14 신고

    후.. 이런거 보면
    스로틀링 걸려서 프레임 대폭 낮아질거라는 생각부터 드네요
    그래픽 성능 스로틀링 테스트에서 아이폰은 성능 하락이 거의 없던데
    발열이 많이 없어서 스로틀링이 많이 걸리지 않는건가요>

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2015.03.06 18:58 신고

      아이폰이 쓰로틀링 테스트에서 성능 하락이 거의 없다는건 어떤 데이터를 근거로 한건지 궁금하네요.

      본문의 어느 부분에서 쓰로틀링이 예상되는지도 궁금하네요.

  10. addr | edit/del | reply BlogIcon CoLLecTor 2015.03.06 21:19 신고

    미디어텍의 신형 a53옥타코어가 760mp4 700mhz더군요. 이정도면 얼마나 퍼포먼스가 나올지 궁금합니다.

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2015.03.07 07:00 신고

      T760MP4 600MHz인 RK3288이 맨해튼 10.5 fps/티렉스 25.9 fps 입니다.
      (http://gfxbench.com/device.jsp?benchmark=gfx30&os=Android&api=gl&D=Rockchip%20rk3288%20%28development%20board%29)

      700MHz면 맨해튼 12.3 fps/티렉스 30.2 fps 정도로 계산되네요.
      Adreno330, 애플 A7 수준.
      물론 제조사가 미디어텍인지라 실성능은 보장 못 합니다.

  11. addr | edit/del | reply Favicon of http://www.playwares.com/xe/44876286 BlogIcon ㅇㅇ 2015.03.10 01:19 신고

    저 위에 댓글 쓴 사람인데요
    성능 발표 자료를 보면 생각난다는 말이에요

    http://www.playwares.com/xe/44876286

    테스트 자료 보고 충격과 공포 ..
    3D 구동시 배터리 뭐시기 항목 눌러보시면 밑에 FPS도 나옵니다

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2015.03.10 17:01 신고

      long term performance는 오프스크린이 아니라 제품 해상도에서의 성능입니다.
      아이폰6+가 티렉스 온스크린이 43.0 이고, 롱텀이 42.8 입니다.
      갤럭시 노트4가 티렉스 온스크린 25.6, 롱텀 18.4 고요.
      아이폰급은 아니지만 그렇다고 대폭락도 아니지요.

      iOS에서는 제품특성인지 쓰로틀링 설정탓인지 모르겠지만 롱텀성능이 테스트간 편차가 비교적 적게 안정적으로 나오는데, 안드로이드는 그야말로 중구난방입니다.
      배터리 관련 테스트가 신뢰도가 떨어지는 것도 있고, 전력 차이가 그렇게 크지 않을 두 AP의 결과가 이렇게 다르다는 것도 납득하기 어려운 상황이지요.
      해상도 차이에 따른 GPU 부하 차이, 그에 따른 온도차이가 원인이거나, 쓰로틀링 정책의 차이로 보는게 맞다고 봅니다.

      사용자 입장에서 본다면 어차피 중요한건 실사용 상황이니까 저 테스트 결과로 아이폰 실성능이 좋다고 생각할 수도 있습니다.
      테스트와 같은 상황이 실제 게임에서도 나타난다는 조건이 붙겠지만요.

  12. addr | edit/del | reply ㅇㅇ 2015.03.10 17:40 신고

    iOS는 스로틀링 적용되는 온도가 높거나 하는걸까요?
    정책 차이가 있다고 하더라도 70%정도 깎이는 노트4에 비하면 아무렇지도 않은 수준인데요
    해상도 차이가 난다고 하더라도 초당 43프레임이면 GPU를 풀로 갈구고 있을텐데 부하 차이 같지는 않네요

    저도 이렇게 차이나는게 이상하다고 생각됩니다

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2015.03.10 17:58 신고

      GFX벤치 결과를 다시보니 이상하네요.
      fps단위와 frame단위 사이에 일관성이 없네요.
      frame 기준으로 봐야할듯 합니다.

      갤노트4 : 온스크린 1433, 롱텀 1423
      아이폰6+ : 온스크린 2409, 롱텀 2395
      둘 다 쓰로틀링으로 인한 성능 저하가 별로 없는듯 합니다.
      http://gfxbench.com/device.jsp?benchmark=gfx30&D=Samsung+Galaxy+Note+4+%28Mali-T760%2C+SM-N910x%2C+SM-N916%29&testgroup=overall
      http://gfxbench.com/device.jsp?benchmark=gfx30&os=iOS&api=gl&D=Apple%20iPhone%206%20Plus

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2015.03.10 21:30 신고

      플웨즈 테스트도 무시할 수는 없으니 뭔가 설정에 차이가 있긴한듯 합니다.
      어찌됐든 상온에서 최대성능대비 절반정도로 프레임이 떨어지니까요.



티스토리 툴바