추가 - 중간의 gpu 스펙, 성능 부분은 오류가 있으므로 다음의 수정 포스팅을 참고하세요.
(아난드텍 리뷰를 통한 갤럭시S2, Mali-400MP4 의 성능.)


http://www.anandtech.com/show/4177/samsungs-galaxy-s-ii-preliminary-performance-mali400-benchmarked/1

삼성 오리온 듀얼코어 ARM Cortex-A9 칩 정보.


- 삼성 Exynos 4210
Cortex-A9 MP2 1GHz (코어당 2.5 DMIPS/MHz)
삼성 45nm 공정.
L1 캐시 32KB 명령어 + 32KB 데이터, L2 캐시 1MB.
1
080P 30fps 디코딩
네이티브 트리플 디스플레이 컨트롤러 아키텍쳐 온보드
(두개의 디스플레이로의 출력과 HDMI를 통한 세번째 디스플레이 지원)
HDMI 1.3a
임베디드 GPS
Mali-400 쿼드코어 gpu

이론 267 million triangle/s, 1600 million pixel/s (fillrate)
(
허밍버드는 이론 90 million triangle/s, 실성능 20~28 million triangle/s)

삼성의 갤럭시S2 사이트에서는 3200M pixel/s 라고 하네요.




- 메모리
K3PE7E700N-XGC1
듀얼채널
LPDDR2 800Mhz 1GB

K3PE7E700N-XGC1 에서
K : memory
3 : mobile memory stack
P : MDDR2-P + MDDR2-P
E7 : MDDR2-P, 4Gb(=512MB), 1.2V (추정)
E7 : MDDR2-P, 4Gb(=512MB), 1.2V (추정)

X : FBGA
X : -25 ~ 105도씨
C1 : 2.5ns, 800Mbps


- Mali-400 MP
30 million triangle/s, 275 ~ 1100 million pixel/s (@275MHz)
성능이 이렇게 알려져있고,
1코어 : 275M pixel/s, 4코어 : 1100M pixel/s(@275MHz) 이렇게 해석이되는데,
Exynos 4210은 1600M pixel/s으로 알려져있어서, 클럭이 400MHz라고 해석을 했었습니다.
그런데 3200M pixel/s 이라니.
-이 부분에 뒤에서 다시 다루겠습니다.-



물론 끼워맞춰보면, 1코어 : 1100M pixel/s, 4코어 : 4400M pixel/s(@275MHz)이고,
4코어에 클럭을 200MHz로 하였다라고 해석해볼 수 있습니다.

하지만 ARM의 자료에서는 엄연히 코어당 275M pixel/s라고 하고 있습니다.
대체 3200M pixel/s 이란 수치는 무엇을 근거로 한건지.
클럭이 800MHz되는 것도 아닐텐데 말이지요.
차기 제품인 Mali-400MP보다 최대 5배의 성능이라는 Mali-T604라도 되는건가요.
-이 부분에 뒤에서 다시 다루겠습니다.-

아직 제품 출시전이지만, 아난드텍에 벤치마크가 올라왔네요.
제품 출시 전이니 그냥 참고만 하는게 맞을듯.


GUIMark는 웹브라우저를 많이 타서, 객관적인 비교는 어렵지만 참고는 될듯.


넥서스S와의 비교에서 허밍버드와의 차이를 짐작할 수 있습니다.
타사제품과의 비교에서는 테그라2랑 비슷.


넥서스S에는 크게 앞서는데, 테그라2에는 좀 밀리네요.

여기까지만 보면 허밍버드 대비 1.5배정도, 테그라2와는 비슷한 정도입니다.


넥서스S(허밍버드)보다 밀립니다.
최적화의 문제인지, 벤치 특성인지 모르겠네요. 해상도가 옵티머스X2와 다르지도 않은데 말이지요.


이건 좀 괜찮네요.
허밍버드보다 좀 앞서고, 테그라랑 비슷하고.



아래 성능 추정부분은 틀린 부분이 한두군데가 아니니 다음의 수정 포스팅을 참고하세요.
(아난드텍 리뷰를 통한 갤럭시S2, Mali-400MP4 의 성능.)


아키텍처를 보면 나오지만, 멀티코어화되어도 픽셀프로세서만 증가하지, 지오메트리 프로세서는 계속 하나입니다.

코어 개수와 관계없이 30M triangle/s 라고 고정된 수치를 표시한 이유가 이겁니다.
만약 클럭이 400MHz라면, 44M triangle/s 정도겠네요.
허밍버드에 탑재된 PowerVR SGX540이 28M triangle/s로 알려져있습니다.

지오메트리 프로세서 1개, 픽셀 프로세서 4개의 단위가 코어 하나인 것으로 보입니다.
쿼드 gpu이니 저런 코어가 4개가 병렬 연결된 것이고요.

Exynos 4210의 성능으로 기존에 알려진게,
267M tri/s, 1600M pixel/s이고, 최근에 변경치를 반영하면, 267M tri/s, 3200M pixel/s 입니다.
ARM의 자료를 보면 코어당 성능이 30M tri/s, 1100M pixel/s(@275MHz) 입니다.

픽셀성능 기준으로 맞추면,
4코어에서 88M tri/s, 3200M pixel/s(@200MHz)가 됩니다.
개인적으로는 이 수치가 현실성있다고 봅니다. 공식사이트에 픽셀성능만 표시한 것도 그렇고요.
(gpu클럭과 cpu클럭은 별개입니다. Exynos4210이 1GHz 제품이라고 gpu도 1GHz 작동하는건 아닙니다.)

그런데 지오메트리 성능에서 차이가 너무 심하지요.
지오메트리 프로세서 개수가 코어당 1개 이상이고 픽셀 프로세서 개수를 코어당 4개이하로, 클럭을 올리면 비슷하게는 맞출 수 있지만, 알려진 수치와 여전히 차이가 큽니다.
가능성이 낮다고 밖에 볼 수가 없는데, 다른 방법이 있는건지.

벤치결과만 놓고보면, 클럭은 대부분의 모바일제품에서 통용되는 200MHz가 적용되었을 것으로 생각됩니다.
거기에 4개의 코어 중 하나만 사용했을 가능성이 높습니다.

그렇지 않다면, 허밍버드에 밀리는건 도저히 납득이 안 갑니다.
200MHz면 22M triangle/s정도가 나오고, 이 수치는 GL벤치마크 - 이집트의 프레임결과와도 들어맞습니다.

일부 벤치마크에서 허밍버드에도 못 미치는 결과를 보인 것은 이것으로 어느정도 설명이 가능하다고 봅니다.



테그라2가 600MHz LPDDR2 메모리를 사용하는데, 갤럭시S는 LPDDR1(아마도 400MHz)이고,
갤럭시S2는 LPDDR2를 사용하는 것으로 알려졌습니다.
6.4GB/s까지 메모리대역폭을 지원하고, DDR3, DDR2 메모리를 지원한다는데,
모바일인 이상 최대 800MHz LPDDR2를 지원할 것으로 보입니다.  
만족스럽지 않은 성능은, 메모리 대역폭이 문제일지도 모르겠는데, 아래 자료가 해석이 애매합니다.



위 자료는 코어증가에 따라 프레임이 거의 정비례로 증가하고,
아래 자료는 코어가 증가해도 프레임당 메모리대역폭이 일정하다고 합니다.
이를 종합하면, 코어가 증가할수록 요구되는 메모리대역폭이 정비례로 증가한다는 얘기가 되는데, 이게 맞는 얘기인건지.
이 해석이 맞다면 메모리대역폭 부족으로인한 병목으로 실성능이 낮게 나왔다라는 말이 성립을 합니다.

어느 쪽이건 실망스러운 성능이긴한데,(기대가 원체컸던 탓이겠지요.) 최적화를 거쳐서 조금이라도 나아진 모습을 보였으면 합니다.


Posted by gamma0burst Trackback 0 : Comment 5

댓글을 달아 주세요

  1. addr | edit/del | reply 번즈 2011.02.16 00:29

    어디에선 벤치프로그램이 1코어 밖에 인식을 못해서 4코어인 오리온의 성능이 제대로 나오지 않았다고 하더군요..

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2011.02.16 03:03 신고

      말이 쿼드코어지 그렇다고 테그라2와 넘사벽 수준으로 성능차이가 나는 것도 아닙니다.
      그런 식으로 따지면 테그라2는 8코어 제품이니까요.

      그래픽 유닛의 멀티코어화는 오래된 얘기인데, 테그라의 멀티코어는 인식하는데, 이건 못한다는건 좀 이해하기 어렵지만, 진실은 제품이 출시되면 확실해지겠지요.

  2. addr | edit/del | reply 번즈 2011.02.16 11:03

    죄송하지만 테그라2는 8코어가아니고 1코어입니다
    엔디비아가 과장이 좀 심했죠
    http://www.cdpkorea.com/zboard4/zboard.php?id=freeboard&page=10&sn1=&divpage=42&sn=off&ss=on&sc=off&select_arrange=headnum&desc=asc&no=245901

  3. addr | edit/del | reply 번즈 2011.02.16 11:04

    아 물론 gpu기준으로..