- 스냅드래곤810 (MSM8994)의 GPU 벤치마크가 나왔습니다.

MDP가 나온지도 꽤 됐고, 긱벤치3 결과도 나온지 한참됐는데 이제서야 GPU 벤치가 나온거보면,

어쩌면 NDA가 걸려있었던 걸지도 모르겠습니다.

 

- 초기 벤치로 봐야할듯 합니다.

GFX벤치에도 결과가 2~3개 밖에 없으니 이후에 더 높은 결과가 될지도 모르는 일이니 우선은 초기 벤치로 생각하고 접근해야할듯 합니다.

 

 - 결과

(링크 : http://gfxbench.com/device.jsp?benchmark=gfx30&os=Android&api=gl&D=Qualcomm%20MSM8994%20for%20arm64%20%28Adreno%20430%2C%20development%20board%29)

 

 

- 시스템 정보

램은 3GB, 4GB 가 있습니다.

CPU 클럭은 1.9GHz로 나옵니다.

 

긱벤치에서는 1.55GHz로 나오는데 여기서는 1.9GHz로 나옵니다.

알려진 스냅810 사양이 A57 2.0GHz, A53 1.6GHz로 알려져 있고, HMP 사양에서 긱벤치가 리틀코어 클럭을 표시해왔다는 점을 생각하면 빅코어 클럭은 1.9xGHz인듯 합니다.

뒷자리가 짤리고 1.9GHz로 표기된 것으로 보입니다.

스냅800만 봐도 실제는 2.276GHz인데 퀄컴에서는 2.3GHz로 표기한걸보면 그럴 가능성이 높아보입니다.

 

 

- 분석 

Manhattan off

T-Rex off

ALU off

Texel fillrate off

A430

21.9 fps

48.5 fps

240.8 fps

8514 MTex/s

A420 600MHz

19.5 fps

43.8 fps

165.7 fps

9976 MTex/s

Ratio

+12%

+11%

+46%

-15%

 

1. 하이레벨

맨해튼, 티렉스 모두 10% 정도 오르는데 그쳤습니다.

Adreno420 대비 30% 상승이라는데 그 정도는 아닙니다.

이 부분의 이유에 대해서는 뒤에서 다루겠습니다.

 

2. 텍셀 필레이트

오히려 A420보다 떨어졌습니다.

A420보다 사양이 떨어지지는 않을테니 최소 16 Tex/cycle 일 것이고, 산술적으로 클럭은 532MHz

오차범위를 고려해도 500MHz까지 내려가지는 않을듯 합니다.

발열 이슈가 있는만큼 쓰로틀링에 의해 클럭이 내려갔을 가능성이 있고, 이 부분을 고려하면 최대 클럭을 확정하기는 힘들어 보입니다.

지금 상태로는 최소 550MHz는 되지 않겠나 싶네요.

 

3. ALU

가장 주목되는 부분입니다.

거의 1.5배나 올랐습니다.

ALU 테스트는 연산성능과 관련된 것으로 추정되는데 이렇다면 A430의 연산성능이 크게 올랐다는게 됩니다.

Adreno는 4(+1) VLIW 구조이고, MP4 구성을 취하고 있기때문에 ALU가 늘어난다면 16개 단위로 늘어날겁니다.

연산성능이 1.46가 되려면 아래의 조합이 가능합니다.

144ALU - 780MHz

160ALU - 700MHz

176ALU - 640MHz

192ALU - 580MHz

 

192ALU부터는 클럭이 오히려 A420보다 떨어지네요.

계산 결과로 보면 160ALU - 700MHz이 가장 잘 들어맞습니다.

240.8/165.7 = 1.45762... 인데,

160ALU - 700MHz 조합과 A420(128ALU-600MHz) 연산성능의 비는 1.4583333...

가장 오차가 적습니다.

클럭도 700MHz로 딱 떨어지고요.

러프하게 1.5배로 잡는다면 다른 구성이 될 가능성도 있겠지만, 무리하게 ALU를 늘리기 힘들다고 볼 수도 있고, 20nm 공정으로 인해 클럭상승 여유가 생긴걸 감안하면 이 정도가 적당해보입니다.

ALU 증가 추세가 32-64-96-128의 32 단위였다는 것도 잘 들어맞네요.

3DMark 결과까지 나온다면 확실해질듯 합니다.

 

4. 성능 저하

퀄컴의 주장? 루머? 대로 A420 대비 성능이 30% 증가했다면,

A430 600MHz에서 맨해튼 25.4 fps, 티렉스 57.0 fps로 계산이되고,

A430 700MHz에서 맨해튼 29.6 fps, 티렉스 66.4 fps이 됩니다.

테그라K1에 육박하는 성능이지요.

 

그런데 초기 벤치이지만 지금 나온 결과는 여기에 턱없이 모자랍니다.

말많고 탈많은 쓰로틀링 등의 이유로 성능이 심각하게 떨어지는 것으로 보이는데, 만약 쓰로틀링에 의한 클럭 저하라면

맨해튼 기준으로 518MHz, 티렉스 기준으로 511MHz 상태라고 계산됩니다.

텍셀필레이트 기준 클럭이었던 532MHz와 큰 차이가 없는 값이지요.

 

 

정리

Adreno430

1. 추정 사양

160ALU-16TMU-8ROP

최대 700MHz

텍셀 : 11.2 GTex/s

픽셀 : 5.6 GPix/s

FP32 연산성능 : 252 GFLOPS

 

2. 추정성능 (700MHz 기준)

맨해튼 오프스크린 : 29~30 fps

티렉스 오프스크린 : 60~66 fps

 

하지만......

 

3. 현실(2015.01.25 기준)

500MHz 초반대 클럭의 성능을 보여줌.

A420 대비 +10% 수준.

 

 

 

Posted by gamma0burst Trackback 0 : Comment 34

댓글을 달아 주세요

  1. addr | edit/del | reply 2015.01.25 02:57

    비밀댓글입니다

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2015.01.25 19:49 신고

      그냥 없다고 보시면 됩니다.
      s5 충격이후 대책으로 이런저런게 쏟아져나왔는데 그 과정에서 변한게 많습니다.
      지금은 많이 정리됐는데 그럼에도 아직 진행형이고요.

  2. addr | edit/del | reply 지나가던폰덕 2015.01.25 12:41

    잘 봤습니다.

    이게 진정한 현실은 시궁창.....

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2015.01.25 19:48 신고

      CPU도 그렇고 GPU도 이러니 삼성에서 여유부릴만 하지요.
      (AArch64 지원이라든지, 최적화라든지...)
      나중에 결과가 오를수도 있으니 일단은 좀 더 지켜봐야겠지만요.

  3. addr | edit/del | reply Favicon of https://hailtz.tistory.com BlogIcon HailtzHait 2015.01.25 15:30 신고

    잘보았어요 ~ 역시 하드웨어의 감마님!
    쓰로틀링이 모든걸 말아먹죠.. 따라서 공랭쿨러달린 스마트폰 개발이 시급합니다. +0+... (반은 진담 반은 거짓말)

  4. addr | edit/del | reply 2015.01.25 19:40

    비밀댓글입니다

  5. addr | edit/del | reply Favicon of https://rubp.tistory.com BlogIcon RuBisCO 2015.01.26 17:15 신고

    샘슝을 샘슝을 위해서 재설계 재설계 들어간다니 새 리비전을 기다려야 할 듯 합니다. 그나저나 쿨링 문제라면 개인적으로는 뒤판에 뒤판에 그라파이트 시트를 넓게 바른 K900이나 아예 아예 금속 벡플레이트를 히트싱크로 쓰는 인텔 레퍼런스 같은 형태가 모범적이지 않은가 싶습니다.

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2015.01.26 18:43 신고

      솔직히 오버.
      원래 할 계획이었을게 뻔한데 무슨 삼성을 위해 ;;
      아무리 좋게 해석해도 삼성때문에 일정을 앞당겼다 정도.

  6. addr | edit/del | reply 흡혈귀왕 2015.01.26 19:19

    걍 퀄콤 입장에선
    스냅드래곤815(MSM8996)이나
    스냅드래곤820(MSM8997)이나 좀더 신경쓰는게 나을거 같은데 말이죠....

    스냅드래곤815는 못해도
    노트5 등장할 시기에는 나올거같은데...

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2015.01.27 03:08 신고

      노트5면 반년도 넘게 남았는데 그 때까지 결함을 안고 갈 수는 없으니까요.
      810 개선이 필요하긴 합니다.

  7. addr | edit/del | reply BlogIcon A TNT 2015.01.26 19:45

    아드레노는 진짜 성능향상시키는데 ALU 엄청 때려박네요
    저정도 연산성능이면 엑시노스 7420은 말리 T760만으로 대적하긴 어렵지 않나요
    물론 공정상으로 7420이 이점이 있으니 16코어 때려박고(...) A430정도 압살시킬수는 있을거같지만요

    • addr | edit/del 흡혈귀왕 2015.01.26 19:59

      ALU 결과가 게이밍으로 이어지는것도 아닙니다....
      그런식이면 A8의 ALU성능이
      아드레노420보다 한참 떨어지는데

      하이레벨 벤치는 어떠하죠?
      아드레노420과 동급입니다.

      Mali-T760MP6도 ALU성능은 떨어져도
      하이레벨 벤치는 아드레노420이랑 오차범위내
      비슷비슷합니다........

      그리고 14nm라도 Mali-T760MP16은 무리...ㅡㅡ;;;;

    • addr | edit/del BlogIcon ㅇㅇ 2015.01.27 01:15

      하이레벨이랑 로우레벨 차이점이 뭔가요?
      그리고 연산성능이 ALU인가요
      이게 게이밍 성능과 바로 연관되지 않는 이유를 알고 싶습니다

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2015.01.27 03:16 신고

      T760MP8 900MHz면 연산성능은 비슷하게 나옵니다.
      (엑시노스7420 추정 사양.)

      GPU 그래픽 연산과정을 아주 간단히보면,
      프론트엔드 - 연산기 - 백엔드(TMU, ROP 등) - 메모리 - 출력 로 흘러갑니다.
      연산성능이 높으면 그래픽 성능이 높아지는건 맞지만, 그래픽 성능에서는 그에 못지 않게 프론트/백엔드 단의 영향력이 크기때문에 그래픽 성능은 연산성능을 무조건 따르지 않습니다.
      특히 프론트엔드 성능/효율은 그래픽성능에서 연산성능 차이를 엎어버릴정도로 영향력이 큽니다.

  8. addr | edit/del | reply 2015.01.27 09:38

    비밀댓글입니다

  9. addr | edit/del | reply 2015.01.27 20:54

    비밀댓글입니다

  10. addr | edit/del | reply 2015.01.27 23:16

    비밀댓글입니다

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2015.01.27 23:57 신고

      제 얘기듣고 이후에 추가적으로 얘기를 주고받은건지 모르겠지만, 일단 보면 얘기가 조금씩 바뀌고 있지요?
      처음엔 단정적이다가 이번엔 하나의 안일뿐이다로.
      게다가 그 내용이라는건 예전에 언론에 잠깐 나왔던 내용이고요.
      관심 좀 끌려고 자극적으로 대충 던져놓고 진지하게 따지고 드니까 말바꾸면서 도망칠 구멍 만들고 있다고 느껴지네요.

  11. addr | edit/del | reply BlogIcon 흡혈귀왕 2015.01.28 23:15

    그나저나 G플렉스2 GFX벤치 떳네요....

    죤망수준인듯;;;;

    이쯤되면 왜 무선사업부가
    갤럭시노트4 S-LTE를 스냅드래곤810을
    과제검증단계에서 나가리하고
    엑시노스5433 쓴 이유가 대충 보이네요 ㄷㄷㄷ

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2015.01.30 17:56 신고

      jot mang
      MDP보다 더 떨어지더군요.
      CPU 성능도 안 되고, GPU 성능도 안 되고.
      안 쓰는데는 다 이유가......

  12. addr | edit/del | reply qwerty 2015.01.30 18:19

    이쯤되면 퀄컴주식사놔야할정도....

    a57이 gflex2 리뷰보니까 클럭이 1.38코어로 잡힌거같기도하구요(cpuz).. 아니면 2ghz까지가기는가는대 발열때문에 거의 떨어지거나.. 많이 평이 안좋내요

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2015.01.31 10:48 신고

      10% 넘게 떨어지고 있는거보면 살만하긴 하지요.ㅋ

      A57이 1.38GHz면 쓰로틀링때문에 떨어진걸겁니다.

  13. addr | edit/del | reply BlogIcon 으아 2015.01.31 06:03

    삼성에서 퀄컴꺼 안쓰고 인텔꺼 쓴다는 말이 있던데 갤s6에 인텔ap가 들어가면 어떻게될까요?

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2015.01.31 10:49 신고

      가능성은 낮겠지만 인텔껄 쓴다면 AP가 아니라 모뎀 얘기일겁니다.
      아톰쓸 이유가 없지요.

  14. addr | edit/del | reply BlogIcon ㅇㅇ 2015.02.01 21:33

    드라이버 오버헤드는 무슨 성능을 말하는 건가요?

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2015.02.01 22:21 신고

      모르겠습니다.

    • addr | edit/del Favicon of http://www.tomshardware.com/reviews/gfxbench-3-graphics-performance,3743-6.html BlogIcon 지나다가 2015.02.09 03:02

      http://www.tomshardware.com/reviews/gfxbench-3-graphics-performance,3743-6.html

      참고하시기 바랍니다. (위 링크가 안 눌러질 경우 제 닉네임 클릭)

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2015.02.09 18:54 신고

      일반적인 의미의 오버헤드 테스트였군요.
      API, 드라이버 등의 소프트웨어적인 부분에 대한 효율 측정이라고 보면 될듯 합니다.

  15. addr | edit/del | reply 2015.02.03 22:36

    비밀댓글입니다

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2015.02.05 02:24 신고

      엄청 긴데 저는 아는게 없어서 짧게 답변할 수 밖에 없네요.
      괜히 민망;;

      구체적인건 모르겠지만 내용봐서는 Instanced Tessellation 지원이라고 봐야겠지요.
      별도의 테셀레이션 유닛이 없다는건 거의 확실하니까요.