본문 바로가기
스마트폰/mobile GPU

PowerVR SGX 그래픽 성능 정리.

by gamma0burst 2011. 12. 16.
반응형


이메지네이션(Imagination Technologies)의 SGX 5 시리즈는 현재 스마트폰, 태블릿 AP에서 가장 널리 사용되고 있는 그래픽 칩셋입니다. (정확히는 칩자체를 판매하는게 아니라, 라이센스 판매이지요.)
특히 타사의 제품과 비교해서 게임 성능이 높은데, 이는 호환성이 좋기때문입니다.
단순 스펙 비교에서는 그렇게 뛰어나다고 보기 어렵습니다.

개인적인 추측으로는 아이폰의 영향이 아닌가 싶습니다.
아이폰과 여기서 이어지는 아이폰터치는 그 종류만 바뀌였을뿐 PowerVR의 칩을 꾸준히 써왔습니다.
그리고 대부분의 게임개발자, 개발사들은 모바일용 게임을 제작할 때, 아이폰용을 우선적으로 만들지요.
보급률, 제작 편의성을 생각하면 당연한 선택입니다.
기본적으로 PowerVR SGX 계열에 성능이 최적화되겠지요.
그리고 이걸 안드로이드용으로 컨버팅합니다.
자연스럽게 SGX에 대한 호환성이 그대로 따라가지 않을까 싶습니다.


- 제품 종류
PowerVR의 제품은 1시리즈~ 5시리즈와 5 에서 파생된 5XT 시리즈가 있는데, 
현실적으로 현재 사용되는 5, 5XT 시리즈, 그리고 그 중에서도 실제 제품이 나온 것만 보겠습니다.



SGX 계열은 5 시리즈부터 USSE (Universal Scalable Shader Engine)이라는 일종의 통합쉐이더를 사용합니다.
USSE 내부에는 파이프라인이 있는데, USSE1 은 2개, USSE2 는 4개를 갖습니다.
텍스쳐 유닛은 외부 메모리로 데이터를 출력하는 역할도 합니다.




- 성능 분석
자료는
GLBenchmark 2.1 offscreen 720p 로 했습니다.
해당되는 결과가 51개나 되어서 이전처럼 캡쳐를 붙이지는 않겠습니다.
해당하는 제품의 평균결과를 정리하면 다음과 같습니다.




여기서 몇가지 특이한 점을 확인하고, 그 부분을 보정할 필요가 있습니다.

- 참고사항
1) SGX543 의 경우, 현재 사용 제품은 A5 의 SGX543MP2 뿐입니다. 
싱글코어의 성능을 기준으로 보아야겠기에 그래프 작성시에는 프레임값의 절반을 반영했습니다.
아이폰4S는 아이패드2 와 달리 다운클럭되어있기때문에, 이 둘의 결과는 따로 표시하였습니다.
2) SGX535 는 아이폰 3GS, 4, 아이패드1,  아이팟터치 4세대에서만 사용 중입니다.
3) SGX531 의 결과가 하나있었지만, 스펙과 결과 모두 SGX530과 차이가 없어서 SGX530의 결과에 통합했습니다.
4) SGX530 은 대부분 OMAP3600 계열 제품입니다.



- 이상한 점
1) SGX540 200MHz 를 기준으로 봤을 때, SGX543 의 결과는 너무 높습니다.
동클럭이라면 스펙이 2배이니까 2배정도의 프레임이 나와야하는데, 실제로는 2.56배의 프레임이 나왔습니다.

두 가지정도로 추측해볼 수 있습니다.
① 클럭이 더 높은 경우.
- 30% 정도 높은 클럭(260MHz) 라면 가능합니다.
② USSE2 의 효율이 USSE1 의 효율보다 더 높은 경우. (역시나 30%정도)
- 제품 중에서 SGX543 은 유일하게 USSE2 인 제품인데, USSE1 에 비해 단순히 스펙만 향상된게 아니라 효율도 올랐다면 스펙 이상의 추가적인 성능향상도 이상한게 아닙니다.

개인적인 생각으로는 1번의 가능성이 높아보입니다.
일단 USSE2 가 USSE1 과 비교해서 스펙을 제외하고, 아키텍처 측면에서는 크게 달라진 것이 없는걸로 아는데, 그것만으로 효율이 30%씩이나 향상될 가능성은 없습니다.
그리고 아이패드2 에 비해 20% 다운클럭된 아이폰4S 의 결과가 SGX540 200MHz 의 결과에 2배한 것과 유사합니다.
종합해보면 아이폰4S 에서 SGX543 의 클럭은 200MHz 이고, 아이패드2 에서는 20% 높은 240MHz 라고 봅니다. 모자라는 6%는 미미한 효율향상이나 오차가 원인이겠고요.

2) SGX540 200MHz 와 비교해서 SGX540 304MHz 의 결과는 클럭상승치(1.5배)가 그대로 잘 반영되어있는데, SGX540 384MHz 의 결과는 전혀 그렇지 않습니다.
클럭대로면 1.9배정도가 되어야하는데, 실제로는 1.6배 정도.

텍스처 유닛 병목이나 메모리 대역폭 부족으로 볼 수 있는데, 그게 애매합니다.
OMAP4460 과 A5 의 메모리대역폭, 텍스쳐 유닛수는 같은데, A5가 더 높은 성능에서도 스펙대로 결과를 뽑아주고 있으니까요.

5XT 시리즈에서 멀티코어화를 염두한 설계가 이루어졌는데, 이 덕에 5시리즈에 비해 요구되는 메모리 대역폭이 감소하거나 텍스쳐 유닛의 효율이 향상되었을 가능성이 있습니다.
그래서 같은 스펙이라도, 5시리즈에서는 병목이 발생할 처리량을, 감당할 수 있었던 것이다...라는 식의 끼워맞추기 해석을 개인적으로 해봅니다.

하여튼 SGX540 에서의 지나친 고클럭은 성능향상에 도움이 안 된다는건 분명해보입니다.

-
2012.02.04 추가
OMAP 4460 의 SGX540 클럭은 307MHz 로 확인되었습니다.
384MHz 는 최대가능한 클럭으로 보입니다.
-

3) Pro에서 SGX530 이 SGX535 보다 높은 성능을 보입니다.
찾아본 바로는 이집트는 OpenGL ES 2.0 을 테스트하고, 프로는 OpenGL ES 1.1 을 테스트한다고 합니다.
이집트쪽이 신뢰도가 더 높다고 봐야할듯 합니다.

텍스처 유닛이 하나 추가되었다고 프레임이 30% 이상 상승하는거보면 SGX530에서 텍스쳐 유닛 부족에 의한 성능병목이 제법 심각한가봅니다.
참고로 말하자면, 메모리 대역폭은 오히려 SGX530 을 탑재한 OMAP3600 계열이 더 낮습니다.
(A4 - 싱글채널 LPDDR 333MHz, OMAP3600 - 싱글채널 LPDDR 200MHz)
메모리 대역폭 부족은 아니란거지요.


- 결론




사실 가장 이상적인건 동일조건에서 성능을 비교하는겁니다.
하지만 일단 메모리대역폭 등 외부조건을 일치시킨다는건 AP 에서는 불가능한 조건입니다.
그리고 사용자가 쓰는건 결국 제조사가 설정한 스펙대로고요.
이상적인 조건에서의 성능을 알수도 없을뿐더러, 설령 알수 있다고하더라도 현실에서 만나는 성능과 동떨어져있다면 의미가 없습니다.
위 그래프가 현재 상황에서 가장 현실적인 결론인 이유입니다.

반응형

댓글