본문 바로가기
스마트폰/애플 APPLE

애플 A8 사양/성능 분석. (2) GPU

by gamma0burst 2014. 9. 26.
반응형

 

- GPU 결과 분석.

애플 A8 GPU는 GX6450으로 나오고 있고 벤치마크 결과를 봐도 그렇습니다.

(링크 : 애플 A8 사양/성능 분석. (1) CPU)

 

GX6450

4클러스터.

8 Tex/cycle

1 USC(클러스터) = 16 파이프라인 = FP32 ALU x32 + FP16 ALU x64 + SFU(Special Function Unit) x16
FP32 ALU : 2 Flops/cycle
FP16 ALU : 2 Flops/cycle

(링크 : 이매지네이션 PowerVR 시리즈6 코어 구성. (Imagination, Rogue))

 

4클러스터니까

FP32 x128 : 256 Flops/cycle

FP16 x256 : 512 Flops/cycle

 

 

- 테스트 결과 정리.

링크 :

http://gfxbench.com/device.jsp?benchmark=gfx30&os=iOS&api=gl&D=Apple%20iPhone%206%20Plus

http://gfxbench.com/device.jsp?benchmark=gfx30&os=iOS&api=gl&D=Apple%20iPhone%206

http://www.anandtech.com/show/8559/iphone-6-and-iphone-6-plus-preliminary-results

 

 

Manhattan off

(fps)

T-Rex off

(fps)

ALU off

(fps)

Fillrate off

(MTex/s)

3DMark Unlimited

Graphics (score)

iPhone 6+

19.2

45.2

94.3

3765

24061

iPhone 6

18.2

43.0

85.9

3423

22907

iPhone 5S

13.2

28.8

78.6

2938

19611

 

아이폰5S의 G6430 클럭부터 정해야하는데 450MHz로 보는게 맞을듯 합니다.

400MHz 정도로 보는 경우도 있는듯한데, GFX벤치 2.7 결과를 보면 텍셀필레이트가 3450MTex/s

(링크 : http://gfxbench.com/device.jsp?benchmark=gfx27&os=iOS&api=gl&D=Apple%20iPhone%205S)

산술적으로 431MHz 입니다.

 

텍셀필레이트 테스트가 잘 되면 이론치보다 잘 나오는 경우가 있긴한데 그래봤자 오차는 2% 정도.

(링크 : Hisilicon 기린920 그래픽 성능/T-Rex, Manhattan 클럭 설정 추정.)

클럭을 낮게 잡아도 422MHz

400MHz로 보기는 힘듭니다.

그럴바에 차라리 높여서 450MHz로 잡는게 합리적.

 

 

- 테스트 결과 분석(인지 숫자놀음인지......)

1. 텍셀

5s : 2938MTex/s -> 367MHz -> 450MHz

450MHz 결과가 367MHz로 나오니까 같은 비율로 계산해보면, (옛날엔 이걸 효율이라 했는데...)

: 3423MTex/s -> 428MHz -> 524MHz

6+ : 3765MTex/s -> 471MHz -> 577MHz

 

2. ALU

G6430, GX6450는 기본적으로 구조가 비슷하니 ALU 결과로 단순 비교해볼만 합니다.

5s : 78.6 -> 450MHz

6 : 85.9 -> 492MHz

6+ : 94.3 -> 540MHz

 

3. 3DMark

3D마크 그래픽 점수는 연산유닛에 비례하는 경향이 있으니 이걸 이용.

FP32 비중이 기준이 된다면,

5s : 19611 -> 450MHz

6 : 22907 -> 526MHz

6+ : 24061 -> 552MHz

 

FP16 연산성능까지 포함된다면 6, 6+ 에 20% 가산. 클럭은 20% 떨어짐.

5s : 19611 -> 450MHz

6 : 22907 -> 526MHz -> 438MHz

6+ : 24061 -> 552MHz -> 460MHz

이건 오히려 클럭이 낮게 나오네요. 아닌듯.

 

4. GFX벤치 맨해튼/티렉스

6과 6+ 결과 차이는

맨해튼 : 19.2/18.2 = 1.055 -> 5.5% 높음.

티렉스 : 45.2/43.0 = 1.051 -> 5.1% 높음.

 

5. 결과를 보면,

6 : 524MHz, 492MHz, 526MHz

6+ : 577MHz, 540MHz, 552MHz

차이를 보면 각각 10%, 9.8%, 5%

 

 

- 클럭은?

텍셀 결과는 소위말하는 효율이 다를 수 있으니 6, 6+ 비율만 따라오면 되겠고,

ALU, 3D마크는 클럭 값을 그대로 볼 수 있겠네요.

 

문제는 6, 6+ 사이의 클럭 차이를 어떻게 볼 것인가 하는겁니다.

텍셀 기준이면 10%이고, 맨해튼/티렉스 기준이면 5% 입니다.

 

아무래도 맨해튼/티렉스를 기준으로 잡는게 맞을듯 합니다.

텍셀은 테스트시 로드가 상당하고 그에 따라 (쓰로틀링 등으로 인해) 이론값에 가깝게 결과를 내기가 힘들테니까요.

6의 결과가 클럭대비 못 나왔을 가능성이 있는겁니다.

 

6, 6+의 클럭 차이를 5%로 본다면,

아이폰6+는 550MHz 정도, 아이폰6은 520MHz 정도로 볼 수 있습니다.

 

 

- 맨해튼/티렉스 성능 향상.

맨해튼/티렉스의 클럭당 성능을 계산해보면 다음과 같습니다.

 

1. 맨해튼

5s : 13.2 fps/450MHz = 0.0293

6+ : 19.2 fps/550MHz = 0.0349

-> 1.19배. 20% 상승.

 

2. 티렉스

5s : 28.8 fps/450MHz = 0.064

6+ : 45.2 fps/550MHz = 0.0822

-> 1.28배. 30% 상승.

 

가정한 클럭이 맞다면 텍셀 효율은 82 % -> 86% 지만 이건 테스트 중 클럭 변동의 영향이 많아서 이것만으로 텍스처 유닛 효율 상승은 얘기하기는 어렵습니다.

역시 GX6450과 G6430의 가장 큰 차이인 FP16 연산 성능 증가를 성능향상의 원인으로 지목할 수 밖에 없습니다.

 

 

- 아이폰5S 대비 +50% ?

맨해튼 : 13.2 fps -> 19.2 fps, +45%

티렉스 : 28.8 fps -> 45.2 fps, +57%

(CPU와는 다르게) 이건 애플 말대로 나오네요.

 

 

- 정리

Apple A8 GPU GX6450

아이폰6 : 520MHz로 추정.

아이폰6+ : 550MHz로 추정.

애플이 언급한대로 아이폰5S 대비 +50% 향상.

 

G6430 대비 클럭당성능 향상 - 맨해튼 20%, 티렉스 30%

늘어난 FP16 연상성능의 영향으로 추정.

 

 

 

반응형

댓글