본문 바로가기
스마트폰/nvidia Tegra

엔비디아 테그라X1 초기 벤치마크 분석. (Tegra X1)

by gamma0burst 2015. 5. 28.

 

- 엔비디아 테그라X1 초기 벤치마크 분석입니다.

초기 벤치마크라고 한건 CPU 벤치 결과가 적은게 가장 큰 이유고, GPU 벤치마크 결과도 이제서야 본격적으로 나오고 있기때문입니다.

초기 결과로 보고 있기때문에 이후 결과가 갱신되면 내용이 수정될 수도 있습니다.

 

 

- CPU : 클러스터 마이그레이션?

CPU 사양은 Cortex-A57 x4 + Cortex-A53 x4 인데 시스템 정보에서는 쿼드코어로 나오고 있습니다.

(링크 : 엔비디아 테그라 X1 발표. (1) CPU (Tegra X1))

긱벤치3, GFX벤치 등에서 공통적으로 나타나는 현상입니다.

빅코어 쿼드 + 리틀코어 쿼드 의 구성을 갖고 있지만 동작은 HMP가 아니라는 증거로 볼 수 있습니다.

이는 긱벤치3 결과를 통해서도 확인할 수 있습니다.

 

 

시스템 정보상 Cortex-A57 r1p1 2.014GHz 쿼드코어입니다.

실제 사양이 8코어인건 엔비디아의 공식 발표 내용이니 의심할 여지가 없고, 시스템 정보에서 4코어로 나온다는건 HMP 동작이 아니라는 의미겠지요.

클러스터 마이그레이션으로 알려져있습니다.

추가적인 정보없이 시스템 정보만보면 CPU 마이그레이션의 가능성도 생각할 수 있는데, 긱벤치 결과나 나오는 얘기를 봤을 때 그 쪽 가능성은 낮아보이네요.

일단 클러스터 마이그레이션으로 보입니다.

 

여담입니다만 스냅드래곤808 (MSM8992)이 A57 r1p2, 스냅드래곤810 (MSM8994)이 A57 r1p1 입니다.

같은 아키텍처에 다른 결과라면,

스냅드래곤 808/810에서 발생하는 문제의 원인을 ARM 아키텍처로 몰아가는건 그다지 설득력이 없습니다.

변수는 지금 결과가 스마트폰이나 태블릿에 비해 발열처리에 여유가 있는 플랫폼에서의 결과라는겁니다.

현재 결과가 올라오고 있는 쉴드 포터블도 전작의 예를 봤을 때 쿨링팬을 사용했을 가능성이 높기때문에 스냅드래곤810과 동등한 조건에서의 비교로 보기 힘듭니다.

결국 테그라X1 탑재 태블릿의 CPU 벤치마크의 결과가 나와봐야 스냅드래곤808/810의 문제가 제조사의 역량으로 감당할 수 없는 아키텍처의 한계때문인지, 퀄컴의 기술력 부족, 개발시간 부족때문인지 밝혀질듯 합니다.

 

사실 아키텍처 문제라고 보는게 웃긴겁니다.

그렇게되면 삼성이 한건 마개조에 가까운 커스텀인데, 그걸 퀄컴은 해내지 못 했다는게 됩니다.

결국 퀄컴은 삼성보다 AP 개발역량이 떨어진다는게 되거든요.

퀄컴을 쉴드를 쳐주는건지, 까는건지 알 수가 없네요.

 

 

- 긱벤치3 결과

비교군은 엑시노스7420

엑시노스 7420 : http://browser.primatelabs.com/geekbench3/2130688

테그라 X1 : http://browser.primatelabs.com/geekbench3/2649016

 

긱벤치3 정수 싱글 클럭당점수.

항목별로 우위가 다른데 종합적으로 2% 정도 높습니다.

테스트 제품이 스마트폰보다 TDP 여유가 있기때문이거나, 클러스터 마이그레이션때문에 풀클럭 동작에 유리한게 아닐까 싶은데,

그렇다고 보기에 항목별로 밀리는 부분이 있어서 추가 결과가 나와봐야 확실해질듯 합니다.

 

긱벤치3 부동소수점 싱글 클럭당점수.

성능차이는 다르지만 정수와 비슷한 모습입니다.

 

메모리 점수.

점수가 오차범위 동급인걸로 봐서 LPDDR4-1600 쓰는듯 합니다.

 

클럭당점수를 %차이로만 보면 오차범위 동급입니다.

 

실제 점수.

싱글코어 점수는 비슷합니다만, 멀티코어 점수에서 확 벌어집니다.

HMP 지원 여부의 영향이겠지요.

 

결론만 말하면, Cortex-A57, LPDDR4, HMP 미지원 사양만큼 점수가 나왔습니다.

점수가 나와야될만큼 나와준거지요.

 

 

- GPU : 테그라K1 대비 2배

엔비디아 발표로는 맥스웰 기반 256코어-16TMU-16ROP-1.0GHz

(링크 : 엔비디아 테그라 X1 발표. (2) GPU (Tegra X1, Maxwell))

 

GFX벤치를 보면 역시나 CPU는 쿼드코어로 나옵니다.

이 부분은 위에서 얘기했으니 패스.

 

결과는 이렇습니다.

 

전작인 테그라K1과 비교해보면,

Tegra K1 : https://gfxbench.com/device.jsp?benchmark=gfx30&os=Android&api=gl&D=Google+Nexus+9&testgroup=overall

Tegra X1 : https://gfxbench.com/device.jsp?benchmark=gfx30&os=Android&api=gl&D=NVIDIA+Shield+Android+TV&testgroup=overall

 

Manhattan off

T-Rex off

ALU

Texel fillrate

Tegra X1

64.9

122.7

466.9

14711

Tegra K1

32.4

67.2

282.1

6136

 

1. 텍셀필레이트

이론성능은 16000 MTex/s 입니다.

14711 이 나왔으니 나올만큼 나왔습니다.

텍셀필레이트 결과 기준으로 클럭을 계산하면 14711 / 16 = 919MHz

 

2. ALU

+66% 증가했습니다.

클럭차이(950MHz -> 1.0GHz)를 반영해도 동클럭에서 +57% 증가입니다.

코어 수 증가(192 -> 256)가 그대로 반영되었다면 +33% 증가일텐데 이보다 큽니다.

이 테스트는 연산성능을 반영하는데, 테그라X1에서 gpu 아키텍처는 바뀌었지만 쿠다코어의 연산성능이 근본적으로 바뀌지 않은 상황에서 성능 상승의 원인으로 아키텍처를 지목하기는 힘듭니다.

 

ALU 테스트에서 클럭이 최대 클럭이 아닐 가능성이 있습니다.

텍셀 필레이트 결과를 근거로 한 클럭이 ALU 테스트시 클럭이라고 가정하고 계산해보면 이렇습니다.

 

테그라 X1 : 256코어-919MHz

ALU 결과는 코어 수와 클럭이 비례하기때문에 ALU 결과를 코어수와 클럭으로 나눠보면 코어당 클럭당 프레임이 나옵니다.

466.9 / 256 / 919 = 0.001984

 

테그라K1 : 192코어-767MHz

같은 식으로 하면,

282.1 / 192 / 767 = 0.001916

 

둘의 차이가 거의 없습니다.

%로 보면 3.6% 차이이고, 기준 클럭이 가정값이기때문에 사실상 동급이라고 봐야 합니다.

 

엔비디아의 발표를 보면 맥스웰에서 FP16 연산 성능이 두 배로 올라갔는데 ALU 결과는 같습니다.

(링크 : 엔비디아 테그라 X1 발표. (2) GPU (Tegra X1, Maxwell))

ALU에서 테스트하는 항목이 FP32 이거나, 이전에 언급한대로 FP16 Mul 에 한정되기때문인 것으로 보입니다.

(링크 : Adreno330 vs Mali-T628 GFXBench Manhattan 성능 차이 분석.)

 

3. 맨해튼, 티렉스

테그라K1 대비 2배입니다.

표면적으로 보이는 코어 수/TMU/ROP 증가 외에 백엔드 단의 성능향상도 상당하고 아키텍처 변화까지 겹친 결과로 보입니다.

예전 예측에서는 사양 증가 +33%, 아키텍처에 의한 향상 +35% 로 봤습니다.

(링크 : 맥스웰 GPU 탑재 테그라, 에리스타 GPU 사양/성능 추정.(Maxwell, Erista))

 

 

- 정리

1. CPU

Cortex-A57 r1p1 2.014GHz 쿼드 + Cortex-A53 쿼드

HMP 미지원 : 클러스터 마이그레이션으로 알려짐.

LPDDR4-1600 (25.6GB/s)

긱벤치3 점수는 사양만큼 나와줌

 

2. GPU

테그라K1 대비 2배.

 

 

 

댓글24