본문 바로가기
스마트폰/mobile GPU

스냅드래곤 S4 MSM8960(Adreno225) 그래픽 성능 분석 & 예측.

by gamma0burst 2011. 11. 26.
반응형

스냅드래곤은 S1 ~ S4 의 4개의 라인업으로 구성되어 있습니다.


이 중 S4는 지난 10월 7일 발표되었습니다.
특징을 몇 가지 짚어보면 다음과 같습니다.

- Scorpion 아키텍처에서 Krait 아키텍처로 변경.

클럭당 성능이 60% 향상.
2.1DMIPS 에서 3.3DMIPS 로 성능이 증가한겁니다.
참고로,
Cortex-A8 : 2.0 DMIPS/MHz
Cortex-A9 : 2.5 DMIPS/MHz
Cortex-A15 : 3.5 DMIPS/MHz (추정)

- 28nm 공정
- 3G/LTE 통신기능 내장

- GPU : Adreno225

 

통합 쉐이더 아키텍처(USA)을 사용하여 그래픽 자원을 효율적으로 활용할 수 있습니다.
성능은 이전 세대인 Adreno200 의 6배, Adreno205 의 3배, Adreno220 의 1.5배.

통합 쉐이더 구조는 현재 SGX5 계열에서도 사용하고 있습니다.
엑시노스의 Mali-400 과 테그라의 ULP Geforce 버텍스쉐이더와 픽셀쉐이더가 분리되어 있는 구조입니다.
Mali의 경우, 다음 세대인 T604 부터 통합 쉐이더 구조를 사용한다고 합니다.

현재 S4 칩은 샘플이 각 제조사에서 테스트 중이라고 합니다.


성능은 퀄컴에서 공개한 자료를 근거로 하기때문에 실제 성능은 실제 제품이 나와봐야합니다.
(
http://www.qualcomm.com/documents/snapdragon-s4-architecture)
이론상 Cortex-A8 과 맞먹는 scorpion 아키텍처였지만 실제로는 성능이 떨어졌습니다.
그 때문에 스냅드래곤은 뻥스펙의 상징으로 지금까지 남아있지요. (스냅드레기의 전설)
이론성능과 실제성능이 달랐던건,
메모리 대역폭 부족(싱글채널)에 따른 총체적인 성능병목이 가장 큰 원인이었고,
gpu의 경우 TMU 부족에 의한 병목도 한 몫했습니다.
거기에 소비전력, 발열이 상대적으로 있고요.

1세대가 말아먹은 이미지를 본격적으로 회복하게되는 것이 3세대부터입니다.
2세대에서 65nm이던 공정을 45nm로 낮춰서 소비전력과 발열 문제를 어느 정도 해결하고,
3세대부터는 그래픽 강화와 클럭 상승으로 성능을 끌어올린 것이지요.

부족한 메모리 대역폭은 여전하지만요. (싱글채널을 고집)

이렇게 써놓으면 무지하게 까이기만 한 것처럼 보이지만, 안드로이드 레퍼런스 폰인 넥서스원에 탑재된 덕에 호환성에서 상당히 좋은 평가를 받기도 합니다. 통신 기능이 타사의 칩보다 좋기도 하고요.
쓰는 사람보다는 개발자들이 더 좋아하는거 같더군요.


얘기가 옆으로 샜는데, 그럼 진짜 그래픽 성능이 얼마나 향상되었는지 확인해보겠습니다.

http://www.glbenchmark.com/phonedetails.jsp?D=Asus+Padfone&benchmark=glpro21
GLbenchmark 사이트에 올라온 MSM8960 의 벤치마크 결과입니다.
얼마 전에 결과가 삭제되었습니다.
이유는 모르겠지만, 아무래도 정보 통제인듯 합니다. 잘못 올라왔을 가능성도 없지는 않습니다.

하지만 이걸 지운다고 못 구하는건 아니지요.
구글에게 불가능은 없습니다.ㅋㅋㅋ
저장된 페이지로 확인해보면 다음과 같습니다.

제품은 Asus Padfone 이네요.
보니까, 태블릿과 스마트폰이 합쳐진듯한 방식이더군요.
스마트폰을 쓰다가, 그걸 태블릿 내부에 장착하면 태블릿으로 쓰는 구조인듯.

 
 
 

(클릭하면 커집니다.)

정보에는 Adreno 220 으로 나옵니다.
아난드텍에서는 Adreno 225 가 구조적으로는 Adreno 220 과 큰 차이가 없으며,
50%의 성능향상은 클럭상승 (266MHz -> 400MHz) , 혹은 드라이버를 통해서 이루었을 것으로 추정합니다.
Adreno 220 으로 뜰 수도 있다는거지요.

시스템 정보입니다.
MSM8960으로 도배되어있습니다.
이 정도면 MSM8960 탑재가 맞겠지요.

성능을 보기전에 일단 MSM8960의 스펙을 간단히 보겠습니다.

 

(클릭하면 커집니다.)

- MSM8960
28nm 공정
cpu - Krait 아키텍처, 1.5~1.7GHz 듀얼코어.
메모리 - LPDDR2 2 x 500MHz (듀얼채널)
gpu - Adreno 225
(메모리 대역폭 부족이 해결될 것으로 보입니다.)

Adreno 225 는 Adreno 200 의 6배의 성능이라고 했는데, 실제 그런지 확인하려면 Adreno 200 의 성능을 먼저 알아봐야겠지요.
GLbenchmark 에서 offscreen 720p 테스트가 된 제품들의 평균 프레임을 확인해보면 다음과 같습니다.

 
  

 
 

프레임이 안 나와서 그런건지, 나온지 오래되서 그런건지...
원인을 모르겠지만 offscreen 720p 테스트를 한 스냅드래곤 탑재 제품이 굉장히 적습니다.
평균내보면,

- Adreno 200
GLBenchmark 2.1 offscreen 720p 이집트 - 6.5 프레임
GLBenchmark 2.1 offscreen 720p 프로 - 5.1 프레임
(좀 심하네요...)

- Adreno 225
GLBenchmark 2.1 offscreen 720p 이집트 - 35.4 프레임
GLBenchmark 2.1 offscreen 720p 프로 - 52.0 프레임


GLBenchmark 2.1 offscreen 720p 이집트는 6배,
GLBenchmark 2.1 offscreen 720p 프로는 10배로 프레임이 상승했습니다.

그런데 표본이 너무 적지요.
Asus Padfone 와 동일 해상도 (960 x 540) 이면서 스냅드래곤을 탑재한 제품들의
이집트, 프로의 High, Standard 프레임을 모아서,
그 평균값과 Asus Padfone 의 프레임을 비교해보겠습니다.

- Adreno 205
 
 

GLBenchmark 2.1 이집트 High - 7.3 프레임
GLBenchmark 2.1 이집트 Standard - 14.6 프레임
GLBenchmark 2.1 프로 High - 9.6 프레임
GLBenchmark 2.1 프로 Standard - 17.5 프레임

- Adreno 220

 
 

 
 

 
 

GLBenchmark 2.1 이집트 High - 14.2 프레임
GLBenchmark 2.1 이집트 Standard - 28 프레임
GLBenchmark 2.1 프로 High - 31.4 프레임
GLBenchmark 2.1 프로 Standard - 50.3 프레임

모든 결과를 모아보지요.



- Adreno 225
GLBenchmark 2.1 offscreen 720p 이집트 - 35.4 프레임
GLBenchmark 2.1 offscreen 720p 프로 - 52.0 프레임

GLBenchmark 2.1 이집트 High - 16 프레임
GLBenchmark 2.1 이집트 Standard - 30.6 프레임
GLBenchmark 2.1 프로 High - 29.5 프레임
GLBenchmark 2.1 프로 Standard - 43.9 프레임

(벤치마크 종류 - 프레임 : 해당 gpu 대비 Adreno 225 에서의 프레임 증가비율)
- Adreno 200
GLBenchmark 2.1 offscreen 720p 이집트 - 6.5 프레임 : 6배
GLBenchmark 2.1 offscreen 720p 프로 - 5.1 프레임 : 10배
(좀 심하네요...)
Adreno 225 가 Adreno 200 대비 6배 성능향상

- Adreno 205
GLBenchmark 2.1 이집트 High - 7.3 프레임 : 2배
GLBenchmark 2.1 이집트 Standard - 14.6 프레임 : 2배
GLBenchmark 2.1 프로 High - 9.6 프레임 : 3배
GLBenchmark 2.1 프로 Standard - 17.5 프레임 : 2.5배
Adreno 225 가 Adreno 205 대비 2~3배 성능향상

- Adreno 220
GLBenchmark 2.1 이집트 High - 14.2 프레임 : 1배
GLBenchmark 2.1 이집트 Standard - 28 프레임 : 1배
GLBenchmark 2.1 프로 High - 31.4 프레임 : 1배
GLBenchmark 2.1 프로 Standard - 50.3 프레임 : 0.9배
Adreno 225 가 Adreno 220 대비 성능향상 없음.


Adreno 225는,
Adreno 200, Adreno 205 와 비교해서는 퀄컴이 공개한 자료와 유사한 성능향상이 있었는데,
Adreno 220 과 비교해서는 차이가 없습니다.
구조적으로 Adreno 220 과 Adreno 225 가 큰 차이가 없다는 반증이라고 볼 수 있고,
클럭이나 드라이버 등에서 이전의 설정이 그대로 적용되었기때문에 성능향상이 없다는 추측도 가능합니다.
정확한 성능은 실제로 제품이 출시되어야 확실한 것이니 두고봐야겠습니다.

-
다른 AP의 그래픽 성능과 비교해볼까요.

Adreno 225 가 35.4 프레임이였지요.
엑시노스 4210 의 Mali-400MP 보다 23% 낮은 성능입니다.
(엑시노스 4210 의 Mali-400MP 의 최신 결과는 45.7 프레임)
현재 Adreno 220 과 성능이 같은 Adreno 225 의 결과이니,
만약, 퀄컴의 주장대로 50% 성능 향상이 있다면 약 53 프레임정도 나오겠지요.
(오차가 있을텐데 무작정 1.5배 하는게 약간 무리이긴합니다.)
그렇게 된다면, Mali-400MP 보다 동급~10% 앞서는 수준입니다.


Adreno 225 가 52 프레임
엑시노스 4210 의 Mali-400MP 보다 23% 낮은 성능입니다.
현재 Adreno 220 과 성능이 같은 Adreno 225 의 결과이니,
만약, 퀄컴의 주장대로 50% 성능 향상이 있다면 약 78 프레임정도 나오겠지요.
(역시나 약간 무리가 있는 계산)
그렇게 된다면, Mali-400MP 보다 16% 정도 앞서는 수준입니다.

종합하면,
현재로는 엑시노스 4210 의 Mali-400MP 보다 20% 정도 낮은 성능으로 보이지만,
퀄컴의 주장대로 실제 제품에서 현재의 50% 의 성능향상이 있다면, 10%정도 높은 성능을 보일 것으로 생각됩니다.

사실 엑시노스 이겼다고 좋아할건 아닙니다.
28nm 제품이 이제 45nm 제품이겼다고 좋아하는건 보는 사람 부끄럽게 만드는거지요. -_-ㅋㅋ


반응형

댓글