본문 바로가기
스마트폰/애플 APPLE

애플 A9, A9X GPU 성능/사양 정리.

by gamma0burst 2015. 12. 4.

 

- 애플 A9, A9X GPU 성능/사양 정리입니다.

다이 이미지 다 나오고 이매지네이션에서 사양 다 공개해버렸고, 벤치마크는 다 나왔는데 이런 결과론적 끼워맞추기를 분석이라고 말할 수가 없네요.

그냥 결과 정리입니다.

 

 

- 다이

다이 이미지는 다 나왔습니다.

A9는 이미 애플이 공개해서 6클러스터로 결론 났고, A9X는 이번에 나왔네요.

(링크 : 애플 A9 논란에 관하여. (2) 그래도 삼성?)

 

듀얼코어, 12클러스터입니다.

메모리 인터페이스는 128bit 입니다.

이건 전작에서 예상할 수도 있고 벤치마크 결과로도 알 수 있는 부분이니 특별한건 아니고.

A9와 다르게 L3 캐시가 없습니다.

메모리 인터페이스(=대역폭)이 넓어서 성능 영향이 낮아서 뺐다는 애기도 있습니다.

 

다이사이즈는 147mm2로 전작인 A8X의 128mm2보다 약간 커졌습니다.

A5X~A9X 중 두번째로 큽니다. TSMC 16nm 공정인데도 말이지요.

전체 면적 중 절반이 GPU일 정도로 때려넣었습니다.

 

 

- 이매지네이션 자료

PowerVR 시리즈8 자료에서 애플 제품 GPU 리스트가 나왔습니다.

이것과 다이 이미지로 GPU 사양은 확정됐다고 봐야 합니다.

 

하이엔드 스마트폰 = 아이폰, 하이엔드 태블릿 = 아이패드

PowerVR 쓰는 하이엔드 제품은 애플 제품 밖에 없으니까요.

아이폰 : SGX544MP3 (SGX543MP3) - G6400 - GX6450 - GT7600

아이패드 : SGX544MP4 (SGX554MP4) - G6430 - GX6850 - GT7800+

첫 번째 것들이 약간 틀린건 넘어가줍시다.

 

8클러스터 제품은 GT7800 이라고 했는데, 12클러스터 제품은 GT7800+ 로 표기했습니다.

8클러스터-16클러스터 중간 제품이 딱히 없어서 그런가 봅니다.

이거갖고 애플이 커스텀을 했느니 하는 소리가 나올지도 모르겠으나 그렇지 않습니다.

다양한 클러스터 구성은 이미 이매지네이션의 라인업 상에서 공언되고 고객이 원하면 나올 수 있는 조합이니까요.

Mali-T880MP4는 ARM걸 그대로 쓴거지만 Mali-T880MP14는 커스텀이라고 하는거랑 같은 소리입니다.

 

 

- 벤치마크 결과

 

결과입니다.

 

사양당 클럭당 성능 비교입니다.

 

1. 클럭

12클러스터이니 24Texel/cycle 입니다.

텍셀 필레이트 결과로 보면 666MHz로 보입니다.

A8에서 클럭 차이가 10.5% (475/430)나오는데 A9와 A9X 차이는 11% (666/600) 입니다.

애플은 11% 정도의 클럭 차이를 둔다는 패턴을 생각해 볼 수 있겠네요.

 

2. ALU/ALU2

A9 결과를 보면 GX6x50 계열보다 사양당 성능이 높습니다. 15% 정도

결과론적인 해석이지만 아키텍처가 다르다는 근거로 볼 수 있습니다.

A9X가 그보다 낮게 나온건 클러스터 수 증가에 비해 성능이 비례해서 증가하지 않기때문일 것이고,

절대적인 결과값 자체가 높아서 내부 대역폭의 병목으로 추측할 수도 있습니다.

이는 GX6450 - GX6850 결과 사이에서도 나타나는데 그 정도가 A9-A9X보다 작은걸 봐서는 절대 프레임값이 큰 영향이 더 큰듯 합니다.

 

3. 맨해튼/티렉스 오프스크린

이 쪽도 ALU와 상황이 크게 다르지 않습니다.

문제는 GX6x50하고 사양당 성능차이가 없다는겁니다.

35%니 61%니 하던건 다 없습니다.

(링크 : 이매지네이션 PowerVR 시리즈7 발표. (Imagination PowerVR serise7) (update 2014.11.21))

뭐하자는건지 모르겠습니다.

 

사양당성능 차이를 보면

A8-A8X : 맨해튼 0%, 티렉스 18%

A9-A9X : 맨해튼 8%, 티렉스 6%

당연한 얘기지만 사양이 높은 쪽이 사양당성능이 떨어집니다.

 

보면 효율 저하의 영향성이 대략 보입니다.

절대 프레임이 높을수록 높은데 내부 병목이겠지요.

그리고 시리즈7로 오면서 효율저하가 개선됐습니다.

겉보기에는 별반 달라진게 없는 것 같지만 그래도 나아진게 있긴합니다.

최대 8클러스터 밖에 안 되던 최대 사양이 16클러스터까지 늘어날 수 있던 이유겠지요.

 

4. 3DMark Sling Shot Unlimited

일단 시리즈6 대비 사양당성능 향상 보입니다.

GFX벤치의 ALU 결과와 비슷한 수준이네요.

 

클러스터 차이간 사양당성능 차이를 보면

A8-A8X : 20%

A9-A9X : 20%

여기에 표기하지는 않았지만 피직스 점수를 봐서는 3DMark에서 여전히 싱글코어만 쓰고 있는듯 합니다.

(이전 벤치와 다르게 아키텍처간 점수차이는 확실히 나옵니다.)

(A9-A9X 피직스 점수 차이가 48% 정도인데 클럭차이가 22%. 나머지 21% 차이는 A9 쓰로틀링때문인듯.

21% 차이로 평균클럭을 내보면 1.5GHz 정도인데 쓰로틀링 테스트 결과와 비슷.)

 

A9X 결과를 보면 그래픽 테스트 프레임이 48 fps, 42 fps인데 GFX벤치 맨해튼 3.1보다도 프레임이 높습니다.

안드로이드 결과를 봐도 Sling Shot 3.1 이라고 특별히 프레임이 더 낮아지지 않습니다.

Sling Shot 테스트 자체가 그렇게 고부하는 아닌듯.

그렇다해도 프레임을 보면 병목이 생길만한 수준은 아닌듯 한데 클러스터 증가에 따라 효율이 떨어지는걸 봐서는 ALU(쉐이더)에 부하가 집중되는 형태는 아닌듯 합니다.

 

 

- 애플 GPU 사양 추정 패턴

다음 번에 적용된다는 보장은 없지만 이번 제품에서 나타난 패턴은 2가지 정도.

A8 시점에서도 나타났으니 2회 반복됐습니다.

 

아이폰, 아이패드 GPU 아키텍처는 동일하게 가져감.

사양 차이는 2배.

클럭 차이가 발생한다면 10% 내외.

 

하지만 좋게말하면 상황에 따라 가는거고, 나쁘게 말하면 제 멋대로 사양 정하는 애플이니 저게 다음에도 적용되리라 장담하기는 힘들겠지요.

 

 

- 정리

1. A9

GT7600 6클러스터 600MHz

FP32 230.4 GFLOPS

맨해튼 오프스크린 40.1 fps

티렉스 오프스크린 80.5 fps

Sling Shot 그래픽 점수 4599

 

2. A9X

GT7800+ 12클러스터 666MHz

FP32 511.5 GFLOPS

맨해튼 오프스크린 80.5 fps

티렉스 오프스크린 164.2 fps

Sling Shot 그래픽 점수 8226

 

 

드디어 A9 얘기 끝났다.

 

 

 

태그

, , , , ,

댓글12