본문 바로가기
스마트폰/애플 APPLE

애플 A9 GPU 성능분석/사양추정.

by gamma0burst 2015. 10. 6.
반응형

 

- 아이폰6S/6S 플러스 탑재 애플 A9 GPU 성능분석, 사양추정입니다.

링크

https://gfxbench.com/device.jsp?benchmark=gfx31&os=iOS&api=metal&D=Apple+iPhone+6S&testgroup=overall

http://www.futuremark.com/hardware/mobile/Apple+iPhone+6+Plus/review

등등

 

- GFX벤치

OpenGL , Metal 결과 분리해서 확인.

 

 

 

애플이 스스로 A9 다이를 공개했고, chipworks에서 확인해줬으니 GPU는 6클러스터가 거의 확정적입니다.

물론 chipworks에서 확인없이 성급하게 얘기했을 가능성도 배제할 수 없지만 가능성은 낮겠지요.

(링크 : 애플 발표 근거 A9 CPU 사양/긱벤치3 결과 추정. (update 2015.09.12))

(링크 : http://www.chipworks.com/about-chipworks/overview/blog/inside-the-iphone-6s)

 

1. 텍셀 필레이트

6클러스터로 가정하고 텍셀필레이트로 클럭을 계산해보면 600MHz가 나옵니다.

(링크 : 애플 AP GPU 클럭 재검토.)

 

2. 맨해튼

40.6 fps로 아이폰6 플러스 대비 1.87입니다.

사양이 4클러스터 -> 6클러스터로 1.5배, 클럭이 475MHz -> 600MHz로 1.26배

합치면 1.5 x 1.26 = 1.89배

성능 향상치와 사양 증가가 일치합니다.

GX6450과 같은 계열이라는 증거가 됩니다.

GX6650 이라는거지요.

 

아이폰6과 비교하면 클럭당성능이 낮은데 이는 아이폰6 플러스, 아이패드 에어에서도 보였던 현상으로 고클럭에서의 효율저하가 있는게 아닌가 하는 추측을 하게 합니다.

아니면 최대클럭 유지의 한계 혹은 의도적인 클럭 셋팅의 가능성도 있습니다.

 

3. 티렉스

83.9 fps로 아이폰6 플러스 대비 1.72입니다.

앞서 계산한대로 사양증가치는 1.89배인데 이보다는 성능향상이 낮습니다.

비슷한 현상이 아이패드 에어에서도 있었습니다.

GPU 사양은 아이폰6 플러스의 두 배였지만 티렉스 결과는 1.6배에 그쳤습니다.

 

절대적인 프레임이 60 fps을 넘어서면서 내부 인터페이스에서 병목이 있는게 아닌가 하는 추측.

현실적으로 봐서 디바이스 해상도에서 60 fps를 유지할 수준만 되면 충분할 것이고, 이 이상에 대해 완벽한 지원 사양을 갖출 필요가 없었을지도 모르겠습니다.

 

애플이 말한 전작대비 1.9배의 성능이라는건 맨해튼 기준이 더 들어맞네요.

 

4. ALU

앞선 결과들이 GX6650이라는 가정을 지지하지만 ALU 결과가 걸림돌입니다.

아이폰6 플러스와 비교하면 결과가 무려 2.2배입니다.

클럭상승의 결과라면 700MHz가 나와야 합니다.

 

그렇다면 앞서 계산한 600MHz가 틀렸고 사실은 700MHz 일까요.

아니면 뭔가 다른 이유가 있어서 ALU 결과가 높아진걸까요.

 

전작들의 클럭 추정 방식과 그 결과가 보이는 일관성, GFX벤치 하이레벨 결과를 고려하면 후자의 가능성이 높다고 볼 수 밖에 없습니다.

그렇다면 대체 무슨 변화가 있었기에 ALU 결과가 예상치보다 16% 높게 나왔을까요.

정확한 원인을 모른다면 최소한 GX6650이 맞다는, GT7600이 아니라는 근거라도 있어야겠지요.

 

5. 만약 GT7600이라면?

-> 클럭은 600MHz가 아님.

이매지네이션의 자료를 보면 PowerVR 7XT는 같은 사양에서 6XT 대비 맨해튼 1.35배, 티렉스 1.61배라고 합니다.

(링크 : 이매지네이션 PowerVR 시리즈7 발표. (Imagination PowerVR serise7) (update 2014.11.21))

그런데 전작의 성능을 기준으로 600MHz라고 가정하면 GX6650이라는 결론이 나왔습니다.

GT7600에서 저 성능이 나오려면 맨해튼 기준으로보면 600 / 1.35 = 444MHz 가 나와야 합니다.

 

-> 하지만 텍셀필레이트 값은 변하지 않음.

아키텍처가 변한다해도 이론적인 텍셀필레이트 값은 변하지 않습니다.

같은 텍셀필레이트 값을 기준으로 계산되는 클럭을 낮추려면 클럭당 텍스처 성능이 높다고 가정해야겠네요.

444MHz가 나오려면 7137 / 444 = 16 Tex/cycle 로 계산됩니다.

 

-> 16 Tex/cycle 이 가능한가.

PowerVR 7XT는 6XT와 마찬가지로 2클러스터가 하나의 텍스처 유닛을 공유합니다.

GT7600은 3TMU라는거지요.

3TMU로 16 Tex/cycle의 성능을 내려면 1TMU당 16/3 = 5.33 Tex/cycle이 나와야 됩니다.

정수가 아닌 값을 선택하리가 보기 힘듭니다.

3TMU로는 15 Tex/cycle, 18 Tex/cycle 이 나와야겠지만 어느 쪽도 클럭이 맞지 않습니다.

사실 1TMU당 4 Tex/cycle 에서 더 늘어난다는 가정부터 무리가 있습니다.

 

-> 티렉스와 성능 차이.

PowerVR 7XT라고 가정하면 티렉스에서의 성능 향상이 더 커야합니다. (1.61 / 1.35 = 1.19)

아이폰6, 6S를 비교하면 맨해튼, 티렉스 성능차이가 비슷합니다.

이매지네이션의 성능향상 자료가 맞다면 7XT로 보기 힘듭니다.

 

 

- 3DMark

Icestorm unlimited에서 64비트를 제대로 대응하지 못해서 피직스 점수 향상이 적고, 그 때문에 병목이 발생하는 것으로 보입니다.

이 점을 염두하고 3DMark는 참고로만 보겠습니다.

 

 

그래픽 점수를 보면 A8 -> A8X에서 1.31배입니다.

사양대로 2배가 나왔던 GFX벤치와는 다른 모습니다. (그래서 병목으로 추정.)

 

A8 -> A9 에서는 1.75배입니다.

GFX벤치 티렉스와 비슷한 수준의 성능 증가를 보입니다.

티렉스처럼 내부 병목(추정)인건지, CPU 성능이 올라가니 CPU 성능 병목이 어느 정도 해소되면서 성능이 올라간건지.

 

 

- 정리

애플 A9 GPU

GX6650 600MHz

 

연산성능

FP32 : 230.4 GFLOPS

FP16 : 460.8 GFLOPS

텍셀필레이트 : 7.2 GTex/s

픽셀필레이트 : 7.2 GPix/s

 

A8 대비 (아이폰6 플러스)

GFX벤치 기준

맨해튼 1.87배

티렉스 1.72배

 

애플 발표치 A8 대비 1.9배 - GFX벤치 맨해튼 결과와 일치.

 

 

반응형

댓글