http://www.anandtech.com/show/5559/qualcomm-snapdragon-s4-krait-performance-preview-msm8960-adreno-225-benchmarks
출처는 아난드텍의 프리뷰입니다.
다양한 제품 사진과 제가 중점적으로 보는 것 이외의 벤치마크 결과들이 있으니,
그 부분은 링크를 통해서 확인하시기바랍니다.


대상 제품은 퀄컴의 모바일 개발 플랫폼(MDP) 입니다.
개발 테스트용 제품이라고 보면 되겠습니다.

좌측은 MSM 8660 탑재 MDP 입니다.
예전에 다룬 적이 있지요.
(베가레이서 탑재, 퀄컴 MSM8660 성능.)

우측은 이번에 다룰 MSM 8960 탑재 MDP

전면 비교.

- MDP MSM 8960 스펙
MSM 8960
4.03 인치 LCD (1024x600)
안드로이드 4.0.3 (ICS)

- MSM 8960
CPU : Krait 아키텍처 기반 1.5GHz 듀얼코어
GPU : Adreno 225
RAM : 듀얼채널 1GB LPDDR2 (500MHz x2 로 알려져있음.)
공정 : 28nm

Krait 아키텍처는 퀄컴이 Scorpion 아키텍처 이후 3년만에 내놓은 신규 아키텍처입니다.
Scorpion 아키텍처와 비교해서,
듀얼코어 기준, L2 캐시가 두배인 1MB 이고,
Out or Order (OoO, 비순차실행) 방식,
FPU (부동소수점 연산 유닛) 이 VFPv3 에서 VFPv4 로 바뀌었습니다.
멍령어 처리 능력은 3.3 DMIPS 로 알려져 있습니다.
(Scorpion : 2.1 , Cortex-A9 : 2.5 , Cortex-A15 : 3.5 (추정))

이하 테스트는 퍼포먼스 모드로 이루어졌다고합니다.
스냅드래곤은 멀티코어가 비동기식이라 로드에 따라 클럭이 변화하는데,
퍼포먼스 모드에서는 1.5GHz 로 클럭이 고정된다고 합니다.
제품의 최대성능을 볼 수 있는겁니다.


- CPU 성능


린팩 성능입니다.
부동소수점 연산성능을 확인할 수 있습니다.
(참고로 린팩은 NEON 안 씁니다.)

압도적인 성능입니다.
(멀티스레드 성능이 너무 높아서, 그래프가 커지는 바람에 가독성이 안 좋네요.)
동클럭 Scorpion 의 두배에 달하는 성능입니다.
이는 NEON/FPU 가 병렬화되었기때문인 것으로 보입니다. 연산 유닛이 두배로 증가한거지요.

Cortex-A15 도 NEON/FPU 가 병렬화될 것으로 알려져 있습니다.

1GHz 로 정규화한 것입니다.
이전 아키텍처인 Scorpion의 두배입니다.

멀티스레드 정규화 결과는 Scorpion 의 두배 이상을 보여주는데,
이는 비동기식 상태가 아닌 1.5GHz 고정 상태로 테스트하였기때문으로 보입니다.
실제 적용되는 상태인 비동기식 조건에서는 저 정도까지 높은 수치를 보이지않을 것으로 생각됩니다.

멀티코어 효율입니다.
고정클럭인 덕에 듀얼코어스러운 수치가 나옵니다.

하지만, Scorpion 이 비동기식 멀티코어의 극악의 효율을 보여줬기때문에,
실제 판매 제품에 탑재되었을 때, 어떤 모습을 보일지는 두고볼 일입니다.

비동기식이기때문에 무조건적으로 효율이 낮을 것이라 단정할 수 없는 것은,
아키텍처의 변화로 인해 멀티코어 효율이 크게 향상되었을지도 모르기때문입니다.



- GPU 성능

다음은 그래픽 성능입니다.



퀄컴은 Adreno225 가 이전의 Adreno220 에 비해 50% 성능이 향상되었다고 밝혔습니다.
GLBenchmark 결과를 봐서는 그 말이 허언은 아닌듯합니다.
더불어 기존에 GLBenchmark 사이트에 있었던 Adreno225 (MSM8960) 탑재 제품들의 테스트 결과는,
최적화가 덜 된 상태에서 이루어졌거나, Adreno 225 의 최고성능을 보일 수 있는 셋팅 상태(다운클럭 등등)가 아니었던 것으로 보입니다.


-
CPU 성능은 엄청나게 향상되었습니다.
강화된 연산 유닛과 이를 통해 향상된 정수, 실수 연산 성능은 어떤 형태로든 장점이 될겁니다.
하지만 Krait 의 경쟁 상대는 Cortex-A9 가 아니라 Cortex-A15 입니다.

부동소수점 연산 유닛 같은 경우는 Cortex-A15 도 비슷한 구조를 갖는 것으로 알려져 있습니다.

이 때문에 Krait 의 높은 성능은 Cortex-A15 의 성능도 기대를 하게 만듭니다.
둘의 경쟁이 어떨지 궁금해집니다.


GPU 성능은 애매합니다.
Adreno 225 자체가 Adreno 220 의 오버클럭 버전 정도로 알려있습니다. (266MHz -> 400MHz)
진정한 다음 세대 GPU 는 Adreno 300 계열인 것이지요.
하지만, 저 정도 성능이면 다음 세대로 넘어가는데 충분한 다리 역할은 할 것으로 보입니다.

결정적인 문제는 호환성일겁니다.
호환성 부분은 사실 SGX 계열을 제외한 모든 GPU가 안고 있는 숙제이기때문에,
특별히 Adreno 계열만 꼬집어 말하기 애매한 면이 있습니다만,
아무래도 Adreno 계열이 제일 호환성이 부족해보이는 것도 사실입니다.

벤치마크에 보이는 역량이 실제 앱에서는 보여주지 못하는 경우가 다반사이니까요.

안드로이드도 ICS 부터 본격적으로 GPU 가속을 사용한다고 하니, 호환성이라는걸 신경써줬으면 합니다.


- 2012.02.27 아난드텍 자료 갱신에 따른 GPU 그래프 수정.


Posted by gamma0burst Trackback 0 : Comment 10

댓글을 달아 주세요

  1. addr | edit/del | reply lightspirit3 2012.02.22 12:31

    부동소수점 연산 성능은 입이 떡벌어지네요..ㄷㄷ

    굳이 쿼드코어까지 갈 필요가 안보이네요.. 윈도우8 WOA 태블릿이 아니라면..

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2012.02.23 03:33 신고

      아톰 듀얼코어 1.6GHz 가 700~800 MFLOPS 를 보이는데,
      위 수준대로면 Cortex-A15 나 Krait 아키텍처 기반으로는 쿼드코어 2GHz 이상은 되야 비슷해질겁니다.

  2. addr | edit/del | reply lightspirit3 2012.02.22 23:11

    뭐, 역시 윈8 woa 태블릿에서는 쿼드코어가 필요하기는 하겠네요..

    그런데, 아톰 듀얼코어의 부동소수점 성능이 생각보다는 괜찮네요..?
    희미한 기억으로는 cortex a15와 클럭당 성능비가 비슷하다고 했던 것 같은데, 잘못된 것이었나 보네요..

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2012.02.22 23:18 신고

      아톰이 순차실행 구조라서 체감성능이 떨어져서 그렇지,
      벤치마크 성능은 제법 나옵니다.
      클럭당 성능으로 경쟁하기에는 ARM이 아직도 많이 부족한게 사실이고요.

      ARM은 아직까지 전력당 성능이 압도적으로 좋을뿐, 순수 성능 경쟁에서는 아톰상대로도 어렵습니다.
      (리눅스나 우분투쪽에서는 아톰 vs ARM 벤치마크 자료가 몇개있는데, 보면 성능으로는 ARM이 아직 멀었습니다.)

      2GHz 라고 대충써서 그렇지 700MFLOPS 찍으려면 2.4GHz 찍어야됩니다.
      물론 가능은 하겠지만, 이 경우 소비전력에서 경쟁력이 있을지 의문입니다.

  3. addr | edit/del | reply 페인터 2012.03.04 21:45

    좋은 비교정보 잘 보고 갑니다.^ㅅ^
    정말 티스토리에 좋은정보를 잘 비교해주셔 감사합니다~(_ _)

  4. addr | edit/del | reply Favicon of http://naeast.tistory.com BlogIcon naeast 2012.06.22 12:37 신고

    우아...이렇게 정리가 깔끔한 사이트를 오늘에야 찾았네요...
    좋은 정보 많이 얻어가겠습니다.

  5. addr | edit/del | reply 이대로나왔습니다. 2012.09.01 06:47

    krait의 상대는 cortex 15의 상대였으면 좋았겟지만 지금 예정된 타사의 cortex 15에 해당하는 ap들 모두 4개월정도의 차이를 두고있습니다. 동급으로 보고 cortex15와 싸웠으면 좋겠지만 모바일 시장의 상당히 빠른 싸이클로인해 4개월이나 선점할수있게 되어버렸네요. 과거 글을 보며 많은걸 배우네요. 시간이 중요하다는것을 알게 되었습니다. 과거 원칩이나 코어클럭에서 선두주자 노릇을 했으나. 모두 차기시즌오기전 현재완료 시점에서 가장 강력한 ap를 가졌던건 매번 엑시노스였고 당대 최고하드웨어는 삼성이라는 인식을 가져오게 했고 후발주자이지만 업계의 괴물로 치고나가던 삼성에게 한단계 빠른 아키텍처로 실성능에서 앞서면서 실제 빠르긴 했으나 분기 자체에서 최고의 모바일 ap는 초기뿐 없었던 퀄컴이 이번에 s4pro에서 기가막힌 한수를 내놨습니다. 정말 재밌네요. 6개월전과 달라진건 얼마 없지만 다른 사업자들이 지지부진하네요. 거기서 다른 한수를 보여준 퀄컴의 저력이 대단합니다..

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2012.09.01 17:05 신고

      퀄컴이 시기상 앞섰던건 스콜피온 때도 그랬습니다.
      하지만 결국 시간이 지나니 다른 업체에 따라잡혀버렸지요.

      과거와 비유하자면 지금은 딱 스냅드래곤S1 이 나온 이후, 허밍버드가 나오기 이전 상태입니다.
      최종 승자가 어떻게 될지는 시간이 지나야 결론 낼 수 있을겁니다.

      Cortex-A15 기반의 차기 AP 들과 경쟁하기에 Adreno320 의 성능이 그렇게 특출나지 않다는건 결국 약점으로 작용하게 될 것으로 보입니다.
      빨리 나와서 시장은 선점하는데에는, 성능이라는 부분이 약화되었다는 부작용이 따르기 나름이니까요.