이메지네이션(Imagination Technologies)의 SGX 5 시리즈는 현재 스마트폰, 태블릿 AP에서 가장 널리 사용되고 있는 그래픽 칩셋입니다. (정확히는 칩자체를 판매하는게 아니라, 라이센스 판매이지요.)
특히 타사의 제품과 비교해서 게임 성능이 높은데, 이는 호환성이 좋기때문입니다.
단순 스펙 비교에서는 그렇게 뛰어나다고 보기 어렵습니다.

개인적인 추측으로는 아이폰의 영향이 아닌가 싶습니다.
아이폰과 여기서 이어지는 아이폰터치는 그 종류만 바뀌였을뿐 PowerVR의 칩을 꾸준히 써왔습니다.
그리고 대부분의 게임개발자, 개발사들은 모바일용 게임을 제작할 때, 아이폰용을 우선적으로 만들지요.
보급률, 제작 편의성을 생각하면 당연한 선택입니다.
기본적으로 PowerVR SGX 계열에 성능이 최적화되겠지요.
그리고 이걸 안드로이드용으로 컨버팅합니다.
자연스럽게 SGX에 대한 호환성이 그대로 따라가지 않을까 싶습니다.


- 제품 종류
PowerVR의 제품은 1시리즈~ 5시리즈와 5 에서 파생된 5XT 시리즈가 있는데, 
현실적으로 현재 사용되는 5, 5XT 시리즈, 그리고 그 중에서도 실제 제품이 나온 것만 보겠습니다.



SGX 계열은 5 시리즈부터 USSE (Universal Scalable Shader Engine)이라는 일종의 통합쉐이더를 사용합니다.
USSE 내부에는 파이프라인이 있는데, USSE1 은 2개, USSE2 는 4개를 갖습니다.
텍스쳐 유닛은 외부 메모리로 데이터를 출력하는 역할도 합니다.




- 성능 분석
자료는
GLBenchmark 2.1 offscreen 720p 로 했습니다.
해당되는 결과가 51개나 되어서 이전처럼 캡쳐를 붙이지는 않겠습니다.
해당하는 제품의 평균결과를 정리하면 다음과 같습니다.




여기서 몇가지 특이한 점을 확인하고, 그 부분을 보정할 필요가 있습니다.

- 참고사항
1) SGX543 의 경우, 현재 사용 제품은 A5 의 SGX543MP2 뿐입니다. 
싱글코어의 성능을 기준으로 보아야겠기에 그래프 작성시에는 프레임값의 절반을 반영했습니다.
아이폰4S는 아이패드2 와 달리 다운클럭되어있기때문에, 이 둘의 결과는 따로 표시하였습니다.
2) SGX535 는 아이폰 3GS, 4, 아이패드1,  아이팟터치 4세대에서만 사용 중입니다.
3) SGX531 의 결과가 하나있었지만, 스펙과 결과 모두 SGX530과 차이가 없어서 SGX530의 결과에 통합했습니다.
4) SGX530 은 대부분 OMAP3600 계열 제품입니다.



- 이상한 점
1) SGX540 200MHz 를 기준으로 봤을 때, SGX543 의 결과는 너무 높습니다.
동클럭이라면 스펙이 2배이니까 2배정도의 프레임이 나와야하는데, 실제로는 2.56배의 프레임이 나왔습니다.

두 가지정도로 추측해볼 수 있습니다.
① 클럭이 더 높은 경우.
- 30% 정도 높은 클럭(260MHz) 라면 가능합니다.
② USSE2 의 효율이 USSE1 의 효율보다 더 높은 경우. (역시나 30%정도)
- 제품 중에서 SGX543 은 유일하게 USSE2 인 제품인데, USSE1 에 비해 단순히 스펙만 향상된게 아니라 효율도 올랐다면 스펙 이상의 추가적인 성능향상도 이상한게 아닙니다.

개인적인 생각으로는 1번의 가능성이 높아보입니다.
일단 USSE2 가 USSE1 과 비교해서 스펙을 제외하고, 아키텍처 측면에서는 크게 달라진 것이 없는걸로 아는데, 그것만으로 효율이 30%씩이나 향상될 가능성은 없습니다.
그리고 아이패드2 에 비해 20% 다운클럭된 아이폰4S 의 결과가 SGX540 200MHz 의 결과에 2배한 것과 유사합니다.
종합해보면 아이폰4S 에서 SGX543 의 클럭은 200MHz 이고, 아이패드2 에서는 20% 높은 240MHz 라고 봅니다. 모자라는 6%는 미미한 효율향상이나 오차가 원인이겠고요.

2) SGX540 200MHz 와 비교해서 SGX540 304MHz 의 결과는 클럭상승치(1.5배)가 그대로 잘 반영되어있는데, SGX540 384MHz 의 결과는 전혀 그렇지 않습니다.
클럭대로면 1.9배정도가 되어야하는데, 실제로는 1.6배 정도.

텍스처 유닛 병목이나 메모리 대역폭 부족으로 볼 수 있는데, 그게 애매합니다.
OMAP4460 과 A5 의 메모리대역폭, 텍스쳐 유닛수는 같은데, A5가 더 높은 성능에서도 스펙대로 결과를 뽑아주고 있으니까요.

5XT 시리즈에서 멀티코어화를 염두한 설계가 이루어졌는데, 이 덕에 5시리즈에 비해 요구되는 메모리 대역폭이 감소하거나 텍스쳐 유닛의 효율이 향상되었을 가능성이 있습니다.
그래서 같은 스펙이라도, 5시리즈에서는 병목이 발생할 처리량을, 감당할 수 있었던 것이다...라는 식의 끼워맞추기 해석을 개인적으로 해봅니다.

하여튼 SGX540 에서의 지나친 고클럭은 성능향상에 도움이 안 된다는건 분명해보입니다.

-
2012.02.04 추가
OMAP 4460 의 SGX540 클럭은 307MHz 로 확인되었습니다.
384MHz 는 최대가능한 클럭으로 보입니다.
-

3) Pro에서 SGX530 이 SGX535 보다 높은 성능을 보입니다.
찾아본 바로는 이집트는 OpenGL ES 2.0 을 테스트하고, 프로는 OpenGL ES 1.1 을 테스트한다고 합니다.
이집트쪽이 신뢰도가 더 높다고 봐야할듯 합니다.

텍스처 유닛이 하나 추가되었다고 프레임이 30% 이상 상승하는거보면 SGX530에서 텍스쳐 유닛 부족에 의한 성능병목이 제법 심각한가봅니다.
참고로 말하자면, 메모리 대역폭은 오히려 SGX530 을 탑재한 OMAP3600 계열이 더 낮습니다.
(A4 - 싱글채널 LPDDR 333MHz, OMAP3600 - 싱글채널 LPDDR 200MHz)
메모리 대역폭 부족은 아니란거지요.


- 결론




사실 가장 이상적인건 동일조건에서 성능을 비교하는겁니다.
하지만 일단 메모리대역폭 등 외부조건을 일치시킨다는건 AP 에서는 불가능한 조건입니다.
그리고 사용자가 쓰는건 결국 제조사가 설정한 스펙대로고요.
이상적인 조건에서의 성능을 알수도 없을뿐더러, 설령 알수 있다고하더라도 현실에서 만나는 성능과 동떨어져있다면 의미가 없습니다.
위 그래프가 현재 상황에서 가장 현실적인 결론인 이유입니다.

Posted by gamma0burst Trackback 0 : Comment 14

댓글을 달아 주세요

  1. addr | edit/del | reply gammazzang 2011.12.17 01:46

    저랑 아이디가 비슷하시네요! 글 잘 읽었습니다. 역시 543이 최강아닌가요? 역시 클럭이 중요한것 같군요! 그렇다면 칩셋의 channel을 줄이는 일이 중요하겠군요?

  2. addr | edit/del | reply Favicon of http://naver.com BlogIcon zzang 2011.12.27 18:20

    갤럭시넥서스에 오맵4470을 썻더라면...
    오맵4470이 sgx544라던데 sgx543보다 높은스펙이 됬었을듯...
    암튼 a5칩이 진리죠... 엑시노스따위 ㅠㅠ...

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2011.12.27 20:39 신고

      4470이 2012년 2분기 출시 예정이던데, 그러면 애매한 경쟁력일겁니다.
      SGX544 라고해도 듀얼도 아니고요.

      그동안처럼 중간정도의 성능으로 갈듯.

  3. addr | edit/del | reply Favicon of http://cafe.naver.com/nxss BlogIcon 흑집사 2012.02.04 02:44

    포스팅 잘 읽어봤습니다~!!

    그런대 한가지 의문점이 생기네요~

    2번 문항에서 오맵에 들어간 SGX 540의 클럭이

    허밍의 클럭보다 1.9배가 높은대 성능이 1.6배밖에 안좋다고 적혀있었죠...

    그게 단순히 설계의 문제인지 궁금합니다

    넥서스S 의 경우 현제 GPU 오버클럭이 가능한대 SGX 540의 문제인지

    TI의 문제인지 궁금하네요~

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2012.02.04 03:01 신고

      그게 Ti 에서 발표한 384MHz 라는건 최대가능클럭이고,
      실제로 갤럭시 넥서스에는 307MHz 로 탑재되었습니다.

      OMAP4460 탑재 제품들이 5개정도 있고, 이 중에 벤치마크가 결과가 있는건 3개인데, 전부 다 결과를 봐서는 실제 384MHz가 적용된 것 같진 않더군요.

      gpu비교 최신버전은 다음 포스팅 참고하세요.
      http://gamma0burst.tistory.com/396

  4. addr | edit/del | reply Favicon of http://cafe.naver.com/nxss BlogIcon 흑집사 2012.02.04 04:57

    아아.... 그래서 그런건가요?? ㅎㅎ

    제가 이해를 조금 잘못했나 보네요~

    전 설계에 문제가 있어서 클럭이 낮게 나왔다 이런건지 알았습니다

    역시 그냥 클럭 올리는 만큼 올라가는게 맞는가 봅니다~

    답글 감사드려요~^^

  5. addr | edit/del | reply 아이유님 2012.06.27 21:32

    sgx540이 싱글코어 프로세서인가요?........

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2012.06.27 21:50 신고

      굳이 표현하자면 싱글코어가 맞습니다만, GPU의 경우 코어라는 포현 자체가 쓰기 애매합니다.

  6. addr | edit/del | reply 아이유님 2012.06.27 21:53

    저도 gpu에서 코어를나누는 기준이 에메한데

    sgx540버텍스파이프라인과 픽셀파이프라인이 각각 1개씩으로 알고잇는데 아닌가요?

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2012.06.27 22:58 신고

      SGX5 계열은 버텍스쉐이더와 픽셀쉐이더가 분리된 방식이 아니고, 하나의 쉐이더에서 픽셀, 버텍스 둘 다 처리할 수 있는 통합쉐이더 방식입니다.

      통합쉐이더 유닛을 늘리는 식으로 성능을 올리는데,
      SGX540이 통합쉐이더유닛이 8개
      SGX543 이 8개,
      SGX543MP2 가 16개,
      SGX543MP4 가 32개, 이런 식입니다.

      그런데 통합쉐이더유닛 하나를 코어라고 보기가 어렵기때문에 멀티프로세서계열(MP2, MP4 이러는 것들)이 아닌 이상은 굳이 표현하면 싱글코어라고 불러야 맞겠지요.

  7. addr | edit/del | reply BlogIcon A TNT 2016.02.10 13:06

    이 링크(http://www.anandtech.com/show/2798/7)에서 본건데 어떻게 하면 SGX 535 @ 200Mhz의 필레이트가 250M이 될수 있나요?

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2016.02.10 14:05 신고

      엄한 내용 써놓은거지요.
      아무래도 돌아다니는 정보나 애매하게 표현된 발표치를 그대로 인용한듯 합니다.
      (여기 본문도 썩 잘 쓴거 같지는 않지만요.)
      검색해보니까 당시 GL벤치마크는 텍셀필레이트를 제대로 측정하지 못 했었네요.