본문 바로가기
스마트폰/퀄컴 Qualcomm

퀄컴 스냅드래곤800 Adreno330 분석.

by gamma0burst 2013. 6. 21.
반응형



(
http://www.anandtech.com/show/7082/snapdragon-800-msm8974-performance-preview-qualcomm-mobile-development-tablet)

스냅드래곤800의 CPU에 대해 다뤘던 지난 포스팅에 이어 GPU를 다뤄보겠습니다.
(
퀄컴 스냅드래곤800 Krait400 성능비교.)

아직까지 GFX벤치마크 등에서 스냅드래곤800 탑재 제품의 상세한 벤치마크가 올라오지 않은 상황이기때문에 MDP로 몇 가지 벤치마크를 상세하게 다룬 아난드텍의 자료를 근거로 하겠습니다.
(
http://www.anandtech.com/show/7082/snapdragon-800-msm8974-performance-preview-qualcomm-mobile-development-tablet)

우선 기존에 알려진 Adreno 330 에 대한 정보는 다음과 같습니다.

-
퀄컴이 발표한 바에 따르면 Adreno 320 대비 그래픽 성능 50% 향상, 연산성능 2배.
성능 향상치를 토대로 128ALU, 6TMU, 400MHz 일 것이라 추측했습니다.

(
퀄컴 CES2013 - 차세대 스냅드래곤 라인업.)
그리고 이전에 유출된 벤치마크 자료를 토대로 128ALU, 4TMU, 450MHz 로 추정했습니다.
(
스냅드래곤800 (Adreno330) GLBenchmark 결과 분석.)
-

아난드텍의 자료를 근거로 했기때문에 이후에 추가되는 테스트 결과에 따라 이번 해석이 틀린 것이 될 수도
있습니다.



- 3D Mark
그래픽 테스트의 프레임, 그래픽 점수 모두 아드레노320 대비 2배 가까운 값을 보이고 있습니다.
정확히는 평균 88% 향상.
3D마크의 그래픽 테스트는 쉐이더 프로세서 수(ALU 수)에 의존적인 성향을 보입니다.
따라서 아드레노330의 그래픽 점수가 아드레노320의 2배라는건 아드레노330의 연산 성능이 아드레노320의
2배에 가깝다는 얘기가 됩니다. (연산성능은 쉐이더 수에 비례하기때문.)

즉, 아드레노330의 ALU 수는 아드레노320의 두 배이고, 클럭은 400~500MHz의 범위를 갖는다고 볼 수 있습니다.


- GLBenchmark 2.7

- 텍셀 필레이트.
Adreno 320 400MHz : 975 MTexels/s
Adreno 330 : 1512 MTexels/s

이전에 유출된 벤치마크에서는 1025 MTexels/s에 불과했고, 이 수치를 근거로 4TMU, 450MHz라는 추측을 했습니다.
하지만 이번에 정식으로 나온 결과는 1.5배 수준으로 향상되었습니다.
해석의 방향은 크게 3가지입니다.
TMU의 변화 여부, 클럭의 변화 여부, 효율의 향상 여부.

아드레노320과 같은 4TMU 라면 가능성은 두 가지 입니다.
클럭이 올라갔거나 효율이 올라갔거나.

클럭이 올라갔다면 클럭은 620MHz 입니다.
하지만 앞서 3D마크 결과를 통해 클럭이 400~500MHz 수준이라는걸 확인했고,
실제 아드레노330의 GPU 클럭이 450MHz로 알려져 있습니다.

클럭 상승의 가능성은 없습니다.

효율 측면은 어떨까요.
아드레노320은 최대 효율(실성능/이론성능)은 60% 수준입니다.
아드레노330이 4TMU, 450MHz에서 1512 MTexels/s이 나오면, 효율은 84%입니다.
굉장히 높은 수치로 안드로이드에서는 거의 찾아볼 수 없는 수준의 효율이고,
아드레노에서는 더더욱 없습니다.

(아드레노 계열의 일반적인 효율이 40~50% 입니다.)
따라서 저 정도의 효율 상승이 있을 가능성은 거의 없습니다.
최근 테스트 결과를 보면 65~70% 이상의 결과를 보이고 있습니다.
안드로이드 제품에서 84%는 거의 찾아볼 수 없는 수치이긴 합니다만 최신 Adreno 계열의 효율이 높게 나타나는 점을 생각한다면 불가능한 효율이라고 단정할 순 없습니다.
그런 측면을 봤을 때, 4TMU 450MHz라는 가정은 여전히 유효해 보입니다.
(가장 결정적인건 실제 퀄컴에서 발표하는 스펙이 4TMU일 가능성이 높은 것으로 추측하게 합니다.)

클럭도 아니고 효율도 아니라면 TMU 수가 늘어났다고 해석할 수 밖에 없습니다.
6TMU 450MHz라면 효율은 56%이고, 8TMU 450MHz라면 42% 입니다.
아난드텍이 무성의하게 테스트를 하지 않았다면 6TMU쪽이 가능성이 높습니다.
뒤에서 다룰 프레임 결과도 6TMU라는 가정을 뒷받침하는 증거가 된다고 봅니다.


- 트라이앵글.
Adreno 320 500MHz : 52 72 MTriangels/s
Adreno 330 : 81 MTriangels/s

Adreno330의 클럭을 생각하면 Adreno320에 비해 많이 올라간 결과입니다.
트라이앵글 관련 유닛이 늘었다고 생각할 수 밖에 없습니다.
트라이앵글 관련 유닛이 늘었다는건 연산유닛(ALU)가 증가했다는 것도 같은 의미이기도 합니다.

트라이앵글 성능 역시 텍셀 성능과 비슷한 향상을 보입니다.
텍셀과 같은 식의 관련 유닛 수 증가, 클럭 상승이 있었다고 볼 수 있습니다.


- T-Rex offscreen 프레임.
Adreno 320 400MHz : 15 fps
Adreno 330 : 26 fps

초기 유출 결과가 21.6 fps 였는데 이보다 높은 결과입니다.
아난드텍 외에도 몇 군데의 테스트 결과가 모두 26 fps 수준인 것으로 보아 테스트 결과 자체는 신뢰할만
합니다.
테스트 결과를 보면 연산유닛(ALU)이 증가한 것으로 보입니다.
아드레노320과 비교해서 프레임이 1.73배 증가했는데 클럭이 1.125배이니 ALU는 1.54배.
오차범위를 고려하면 1.5배 증가했다고 볼 수 있습니다.
이 해석대로면 Adreno330은 128ALU이고, Adreno320은 96ALU입니다.
GL벤치마크 2.7은 생각보다 쉐이더 수과 클럭에 의존적인 벤치마크인지도 모르겠습니다.

테스트 결과를 보면 텍스처 유닛 증가와 클럭 상승이 거의 그대로 반영되었습니다.
아드레노320과 비교해서 클럭이 1.125배, 텍스처 유닛이 1.5배 증가했으니 합치면 1.69배인데,
프레임이 1.73배.

사실 GL벤치마크에서 텍셀 성능 향상이 프레임에 그대로 반영되는 경우가 드물기때문에 이런 산술적인 일치만으로 텍셀성능과 프레임 간의 관계를 단정할 수는 없습니다.
하지만 최소한 아웃풋단 스펙 향상으로 인해 성능이 향상되었다는 해석은 가능하다고 봅니다.



- 정리.
Adreno 330
코어 : 128 ALU (추정)
TMU : 4 TMU (추정)
클럭 : 450MHz
연산성능 : 129.6 GFLOPS (추정, 스냅드래곤600 Adreno320 400MHz가 86.4 GFLOPS)
Adreno320 대비 70% 이상 향상된 성능.


- 2013.12.18 내용 대폭 수정.




반응형

댓글