- 엔비디아 테그라X1 초기 벤치마크 분석입니다.

초기 벤치마크라고 한건 CPU 벤치 결과가 적은게 가장 큰 이유고, GPU 벤치마크 결과도 이제서야 본격적으로 나오고 있기때문입니다.

초기 결과로 보고 있기때문에 이후 결과가 갱신되면 내용이 수정될 수도 있습니다.

 

 

- CPU : 클러스터 마이그레이션?

CPU 사양은 Cortex-A57 x4 + Cortex-A53 x4 인데 시스템 정보에서는 쿼드코어로 나오고 있습니다.

(링크 : 엔비디아 테그라 X1 발표. (1) CPU (Tegra X1))

긱벤치3, GFX벤치 등에서 공통적으로 나타나는 현상입니다.

빅코어 쿼드 + 리틀코어 쿼드 의 구성을 갖고 있지만 동작은 HMP가 아니라는 증거로 볼 수 있습니다.

이는 긱벤치3 결과를 통해서도 확인할 수 있습니다.

 

 

시스템 정보상 Cortex-A57 r1p1 2.014GHz 쿼드코어입니다.

실제 사양이 8코어인건 엔비디아의 공식 발표 내용이니 의심할 여지가 없고, 시스템 정보에서 4코어로 나온다는건 HMP 동작이 아니라는 의미겠지요.

클러스터 마이그레이션으로 알려져있습니다.

추가적인 정보없이 시스템 정보만보면 CPU 마이그레이션의 가능성도 생각할 수 있는데, 긱벤치 결과나 나오는 얘기를 봤을 때 그 쪽 가능성은 낮아보이네요.

일단 클러스터 마이그레이션으로 보입니다.

 

여담입니다만 스냅드래곤808 (MSM8992)이 A57 r1p2, 스냅드래곤810 (MSM8994)이 A57 r1p1 입니다.

같은 아키텍처에 다른 결과라면,

스냅드래곤 808/810에서 발생하는 문제의 원인을 ARM 아키텍처로 몰아가는건 그다지 설득력이 없습니다.

변수는 지금 결과가 스마트폰이나 태블릿에 비해 발열처리에 여유가 있는 플랫폼에서의 결과라는겁니다.

현재 결과가 올라오고 있는 쉴드 포터블도 전작의 예를 봤을 때 쿨링팬을 사용했을 가능성이 높기때문에 스냅드래곤810과 동등한 조건에서의 비교로 보기 힘듭니다.

결국 테그라X1 탑재 태블릿의 CPU 벤치마크의 결과가 나와봐야 스냅드래곤808/810의 문제가 제조사의 역량으로 감당할 수 없는 아키텍처의 한계때문인지, 퀄컴의 기술력 부족, 개발시간 부족때문인지 밝혀질듯 합니다.

 

사실 아키텍처 문제라고 보는게 웃긴겁니다.

그렇게되면 삼성이 한건 마개조에 가까운 커스텀인데, 그걸 퀄컴은 해내지 못 했다는게 됩니다.

결국 퀄컴은 삼성보다 AP 개발역량이 떨어진다는게 되거든요.

퀄컴을 쉴드를 쳐주는건지, 까는건지 알 수가 없네요.

 

 

- 긱벤치3 결과

비교군은 엑시노스7420

엑시노스 7420 : http://browser.primatelabs.com/geekbench3/2130688

테그라 X1 : http://browser.primatelabs.com/geekbench3/2649016

 

긱벤치3 정수 싱글 클럭당점수.

항목별로 우위가 다른데 종합적으로 2% 정도 높습니다.

테스트 제품이 스마트폰보다 TDP 여유가 있기때문이거나, 클러스터 마이그레이션때문에 풀클럭 동작에 유리한게 아닐까 싶은데,

그렇다고 보기에 항목별로 밀리는 부분이 있어서 추가 결과가 나와봐야 확실해질듯 합니다.

 

긱벤치3 부동소수점 싱글 클럭당점수.

성능차이는 다르지만 정수와 비슷한 모습입니다.

 

메모리 점수.

점수가 오차범위 동급인걸로 봐서 LPDDR4-1600 쓰는듯 합니다.

 

클럭당점수를 %차이로만 보면 오차범위 동급입니다.

 

실제 점수.

싱글코어 점수는 비슷합니다만, 멀티코어 점수에서 확 벌어집니다.

HMP 지원 여부의 영향이겠지요.

 

결론만 말하면, Cortex-A57, LPDDR4, HMP 미지원 사양만큼 점수가 나왔습니다.

점수가 나와야될만큼 나와준거지요.

 

 

- GPU : 테그라K1 대비 2배

엔비디아 발표로는 맥스웰 기반 256코어-16TMU-16ROP-1.0GHz

(링크 : 엔비디아 테그라 X1 발표. (2) GPU (Tegra X1, Maxwell))

 

GFX벤치를 보면 역시나 CPU는 쿼드코어로 나옵니다.

이 부분은 위에서 얘기했으니 패스.

 

결과는 이렇습니다.

 

전작인 테그라K1과 비교해보면,

Tegra K1 : https://gfxbench.com/device.jsp?benchmark=gfx30&os=Android&api=gl&D=Google+Nexus+9&testgroup=overall

Tegra X1 : https://gfxbench.com/device.jsp?benchmark=gfx30&os=Android&api=gl&D=NVIDIA+Shield+Android+TV&testgroup=overall

 

Manhattan off

T-Rex off

ALU

Texel fillrate

Tegra X1

64.9

122.7

466.9

14711

Tegra K1

32.4

67.2

282.1

6136

 

1. 텍셀필레이트

이론성능은 16000 MTex/s 입니다.

14711 이 나왔으니 나올만큼 나왔습니다.

텍셀필레이트 결과 기준으로 클럭을 계산하면 14711 / 16 = 919MHz

 

2. ALU

+66% 증가했습니다.

클럭차이(950MHz -> 1.0GHz)를 반영해도 동클럭에서 +57% 증가입니다.

코어 수 증가(192 -> 256)가 그대로 반영되었다면 +33% 증가일텐데 이보다 큽니다.

이 테스트는 연산성능을 반영하는데, 테그라X1에서 gpu 아키텍처는 바뀌었지만 쿠다코어의 연산성능이 근본적으로 바뀌지 않은 상황에서 성능 상승의 원인으로 아키텍처를 지목하기는 힘듭니다.

 

ALU 테스트에서 클럭이 최대 클럭이 아닐 가능성이 있습니다.

텍셀 필레이트 결과를 근거로 한 클럭이 ALU 테스트시 클럭이라고 가정하고 계산해보면 이렇습니다.

 

테그라 X1 : 256코어-919MHz

ALU 결과는 코어 수와 클럭이 비례하기때문에 ALU 결과를 코어수와 클럭으로 나눠보면 코어당 클럭당 프레임이 나옵니다.

466.9 / 256 / 919 = 0.001984

 

테그라K1 : 192코어-767MHz

같은 식으로 하면,

282.1 / 192 / 767 = 0.001916

 

둘의 차이가 거의 없습니다.

%로 보면 3.6% 차이이고, 기준 클럭이 가정값이기때문에 사실상 동급이라고 봐야 합니다.

 

엔비디아의 발표를 보면 맥스웰에서 FP16 연산 성능이 두 배로 올라갔는데 ALU 결과는 같습니다.

(링크 : 엔비디아 테그라 X1 발표. (2) GPU (Tegra X1, Maxwell))

ALU에서 테스트하는 항목이 FP32 이거나, 이전에 언급한대로 FP16 Mul 에 한정되기때문인 것으로 보입니다.

(링크 : Adreno330 vs Mali-T628 GFXBench Manhattan 성능 차이 분석.)

 

3. 맨해튼, 티렉스

테그라K1 대비 2배입니다.

표면적으로 보이는 코어 수/TMU/ROP 증가 외에 백엔드 단의 성능향상도 상당하고 아키텍처 변화까지 겹친 결과로 보입니다.

예전 예측에서는 사양 증가 +33%, 아키텍처에 의한 향상 +35% 로 봤습니다.

(링크 : 맥스웰 GPU 탑재 테그라, 에리스타 GPU 사양/성능 추정.(Maxwell, Erista))

 

 

- 정리

1. CPU

Cortex-A57 r1p1 2.014GHz 쿼드 + Cortex-A53 쿼드

HMP 미지원 : 클러스터 마이그레이션으로 알려짐.

LPDDR4-1600 (25.6GB/s)

긱벤치3 점수는 사양만큼 나와줌

 

2. GPU

테그라K1 대비 2배.

 

 

 

Posted by gamma0burst Trackback 0 : Comment 24

댓글을 달아 주세요

  1. addr | edit/del | reply 흡혈귀왕 2015.05.28 18:27

    솔직히 ARM 탓하는건 웃긴거죠..ㅋㅋ
    삼성은 했는데 커스텀 코어까지 만들던 퀄콤이
    그걸 못해서 겔겔대는건 결국 자기 얼굴에 침뱉기밖에 안되니...

    테그라는
    늘 이전대비 몇배 향상은 지켜주고 있군요(발표 그래프가 매직그래프라서 문제지만ㅎㅎ)

    엔비디아 공식 홈페이지에서 보니
    아예 클라스터 스위칭으로 명시하고 있더군요...

    이걸 일부러 이렇게 한걸까요 아님 익숙치 못한
    빅리틀로 인해 저렇게 구현한것일까요?

    하드웨어적으로 문제없다면
    리나로 커널써서 HMP부활 시키는것도
    가능하려나...ㄷㄷㄷㄷ

    근데 애네들 덴버코어를 포기한건지
    잠시 쉬는건지 생각치도 않게 너무 쉽게
    들어가버렸네요....테그라X1은 사실
    덴버쿼드코어로 기대했었거든요ㅎㅎ

    ARMv8 빅리틀중 제대로 돌아가는게
    엑시노스5433과 엑시노스7420밖에 없는 상황이 뭔가 웃기네요ㅎㅎ

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2015.05.28 19:04 신고

      귀찮고 힘들어서 HMP를 안 한건지 다른 이유가 있는건지 모르겠네요.

      덴버코어는 나온다면 약간 늦게 나올거 같습니다.
      같은 기반에 CPU만 ARM 아키텍처, 덴버로 다른 제품이 번갈아 나오는 식일듯 합니다.

  2. addr | edit/del | reply 2015.05.28 18:39

    비밀댓글입니다

    • addr | edit/del 2015.05.28 18:50

      비밀댓글입니다

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2015.05.28 19:23 신고

      "ARM이 개객긔고 퀄컴은 잘못이 없어요." 라고 말해서 그게 지금 변명이 되냐는거지요.
      '시간과 예산이 조금만 더 있었더라면' 이라니 ㅁ작품의 ㄴ박사도 아니고......

      원래 ARM RTL이 거지같은건 알만한 사람들은 다 알겁니다.
      가장 지원 빵빵하게 받는 티어1인 삼성마저 커스텀 아키텍처 하려고 하는 정도면 말 다했지요.
      라인업이 엎어지면서 810이 급조되면서 시간이 부족했다 그러면 기획하는 윗분들이 문제가 있는거고, 그게 아니라면 더 말할 필요도 없고요.
      뭔 말을 해도 퀄컴은 까일 수 밖에 없습니다.

    • addr | edit/del 2015.05.28 19:58

      비밀댓글입니다

  3. addr | edit/del | reply BlogIcon 2015.05.28 21:58

    cpu가 아쉽아쉽...
    hmp안할거면 뭣하러 a53쿼드를 박았는지 모르겠네요...

    클럭이라도 좀 높았으면 어땠을까 하는(tsmc20nm 의 한계일까요 =ㅁ=)

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2015.05.29 17:32 신고

      1.9~2.0GHz가 20nm에서 A57 클럭 한계치로 보입니다.

      A53은 그래도 들어가야겠지요.
      안 그러면 소비전력이 저 멀리 가버리니..

  4. addr | edit/del | reply 아무래도 2015.05.29 08:40

    삼성은 Coretex를 일찍부터 계속 받아서 써왔고, 퀄컴이 계속 아키텍쳐 라이센서로 만든 코어들을 쓰다가 갑자기 Cortex 에 Big.Little을 쓰게 된거라 상대적으로 많이 불리 할수 밖에 없죠. 역량을 떠나서 @.@

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2015.05.29 17:34 신고

      그게 면죄부가 되는건 아니니까요.
      퀄컴 하위라인업이 ARM 레퍼런스로 도배된걸 생각하면 퀄컴이 기존에 cortex 안 받았다고 하는 것도 앞뒤가 안 맞고요.

  5. addr | edit/del | reply BlogIcon CoLLecTor 2015.05.29 10:32

    뭐랄까.... 퀄컴은 Kryo나올때까지 810/808을 쉬엄쉬엄 하고 대충 넘어가려고 했다가 큰코 다친거 같은느낌이드네요...

    성당님 찌라시보면 820이 14nm 공정에서 3Ghz, 2년이상 Kryo로 울궈먹을거 생각하면, 후기 Kryo 는 대체 클럭이 얼마나 괴랄하게 올라갈지 상상이.....말이죠.... ㄷㄷㄷ

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2015.05.29 17:35 신고

      일정문제라면 64비트 과소평가 발언부터 조짐이 보였지요.
      그러니 kryo가 늦어지고, 64비트는 대응해야하니 A57로 허겁지겁갔으나 시간부족.
      이런 식의 해석이 그나마 퀄컴입장에서 가장 유리한 해석......인데 그렇게 쉴드 느낌이 안 나지요.

  6. addr | edit/del | reply 피노키오 2015.05.29 17:35

    어우 그래픽이 정말... 킬러컨텐츠만 확보된다면 플삼 엑박 콘솔영감님들은 이제 유물함에서 푹 쉬셔도 되겠어요

  7. addr | edit/del | reply qwerty 2015.05.30 09:15

    antutu 점수 유출된걸로만 본다면 hmp지원 안하는게 이상할정도로 점수가 높은거 아닌가요? 제가 잘못해석하고있는걸까요... 왜 geekbench점수가 저런지 모르겠내요 제 생각으로는 HMP지원할 것 같습니다 (갤식스 안투투가 10000대엿고 (정수부분) 테그라가 11000대인대...

    • addr | edit/del 흡혈귀왕 2015.05.30 15:30

      지원 안합니다..;

      이미 엔비디아 공식 홈페이지
      제품 소개에서도 클러스터 스위칭 방식으로
      소개되고있습니다;

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2015.05.30 19:51 신고

      안투투 점수는 사양 판단 자료로 삼기에 부적합합니다.

  8. addr | edit/del | reply 2015.05.30 15:40

    비밀댓글입니다

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2015.05.30 19:52 신고

      개인적으로 요즘 찌라시들 많이 엇나가고 있다고 봅니다.
      그냥 다 뒤죽박죽 섞여있어요.

  9. addr | edit/del | reply BlogIcon 플리즈 2015.05.31 11:11

    클러스터 마이그레이션으로 나온 걸 제외하면 성능면에서는 뭐라 말할 게 없네요. 오랜만에 나오는 a57기반 프로세서에다가. 쿼드로만 나올 줄 알았는데.

    실제품이 어서 나와서 이 참에 좀 비교가 되서 퀄컴의 삽질이 대체 뭐때문인지 밝혀졌으면 좋겠습니다.;; 어쩌다 스냅 810이 그 지경으로 나왔는지가 정말 이해가 안 돼요; 처음부터 싹 커스텀해서 코어도 만드는 회사가 RTL 최적화 역량이 아예 없지도 않을텐데....

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2015.05.31 16:33 신고

      넥서스9 처럼 태블릿으로 나와줘야 제대로 된 성능비교가 가능할테니, 일단은 기다려봐야겠습니다.

  10. addr | edit/del | reply qwerty 2015.06.18 17:45

    화룡이 이론적으로 최대 전력사용량이 20w 그리고 싱글 a57풀로드가 4w뜬시점에서 테그라 x1을 모바일로 성능떨구고서라도 쓸 가능성은없나요?

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2015.06.19 21:46 신고

      스냅810 대체 목적이라면 스마트폰에 들어갈 수 있어야하는데 테그라X1에서 PoP(Package on Packge)가 가능하다는 내용은 아직 확인되지 않고 있습니다.
      PoP이 안 되면 태블릿 이상으로 용도가 제한될 수 밖에 없습니다.

  11. addr | edit/del | reply .... 2015.09.23 08:25

    음, 엑시노스 HMP적용이 성공적인 편이었나요..
    긱벤치 점수분포를 보면 스냅보단 덜해도 꽤나 왔다갔다 하던데. 그다지 안정적인 수준은 아닌듯 싶습니다

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2015.09.23 15:41 신고

      점수가 안정적으로 나오는게 HMP의 성공적인 적용의 증거라고 보시는 이유가 뭔지요?