본문 바로가기
스마트폰/애플 APPLE

애플 A11 Bionic GFX벤치 분석. (GPU 성능.)

by gamma0burst 2017. 10. 14.
반응형

- 애플 A11 Bionic GFX벤치 분석입니다.

(링크 : https://gfxbench.com/device.jsp?benchmark=gfx40&os=iOS&api=metal&D=Apple+iPhone+8+Plus&testgroup=overall)

 

 

- 발표치

애플 디자인 GPU (자체 설계?)

A10 대비 성능 +30%

A10 성능에서 전력 절반.

 

 

- GPU 다이

 

(왼쪽 A11 링크 : http://www.techinsights.com/about-techinsights/overview/blog/apple-iphone-8-teardown/)

(오른쪽 A10 링크 : http://www.techinsights.com/about-techinsights/overview/blog/apple-iphone-7-teardown/)

GPU 코어는 A10과 비슷한 구성입니다.

3개의 클러스터와 공통 영역으로 구성되어 있습니다.

공통 영역은 A10보다 작습니다.

 

전체 면적와 이미지로 GPU 클러스터 면적을 구해보면 A10 5.23mm^2, A11 4.15mm^2 로 20% 정도 줄어들었습니다.

클러스터 비율은 둘 다 가로 : 세로 = 2 : 1 로 같습니다.

TSMC 16nm -> 10nm에서 면적 -48%인데 반해 면적 감소치가 적은데, GPU 전체 면적은 40%가 감소했다하니 공통 부분이 작아진 영향이 큰 것으로 보입니다.

 

A10, A10X의 GPU 클러스터 이미지가 거의 같았던데 비해 A11에서는 이미지상 유사한 점이 보이지 않습니다.

(링크 : 애플 A10X GFX벤치 분석.)

이미지만으로는 단순 배치 변화인지 근본부터 설계가 달라졌는지는 불명.

 

 

- GFX벤치 결과

GFX벤치 결과는 다음과 같습니다.

A10 대비 1440p 맨해튼 3.1 +52% / 맨해튼3.1 +44% / 맨해튼3.0 +39% / 티렉스 +42% / ALU2 +40% / 텍스처링 +74%

하이레벨 테스트 결과가 최소 +40% 이상이어서 A10 대비 +30%라는 애플 발표치와 맞지 않습니다.

A10X의 경우 하이레벨 테스트의 기하평균 값과 발표치가 잘 맞았는데 이번엔 다르네요.

(링크 : 애플 A10X GFX벤치 분석.)

 

텍스처링 결과는 17002 MTex/s인데 3클러스터이기때문에 클럭당 텍스처 성능은 3의 배수를 따를 수 밖에 없습니다.

A10과 같은 12 Tex/cycle이라면 클럭이 1.4GHz가 나오는데 이는 A10 대비 +56% 높은 클럭이고, 전력 여유가 더 큰 A10X조차도 (10nm 공정임에도) 1GHz를 넘지는 않았습니다.

16FF+ -> 10FF 에서의 성능 게인이 10%라고 해도 클럭이 +56%가 되려면 +41%가 더 올라가야 됩니다.

애플 발표에서 A10과 같은 성능에서 전력이 절반, -50%라고 했는데 이건 아무래도 최대 전력효율(전성비)를 보이는 구간에 해당할 가능성이 높습니다.

A11 최대 성능이 A10보다 40% 이상 높은데 최대 성능 영역에서 전력효율은 상대적으로 떨어질 수 밖에 없습니다.

최대성능일 때 전력효율이 A10보다 40% 이상 (전력 -30%) 높아야 1.4GHz를 만들기위한 나머 41%를 채울 수 있는데 과연 그게 가능할지 의문입니다.

여러모로 봤을 때 1.4GHz의 가능성이 완전히 0은 아니지만 24Tex/cycle일 가능성이 높아보입니다.

단순 계산으로는 710MHz 내외입니다만, A10 사례를 보면 텍스처링 테스트에서 최대 성능이 나오지 않았을 가능성도 있는데 그런 경우를 가정하면 클럭은 780MHz 내외가 됩니다.

 

 

- 자체 설계 GPU인가?

애플은 자체 디자인 GPU라고 발표했는데 이 문구만으로 완전히 새로 설계된 제품이란 의미인지, 기존 제품을 베이스로 커스텀한건지 알 수 없습니다.

(업계에서 쓰는 표현상 어떻다.라는 추측은 가능하겠지만 애플 발표가 그런 느슨한 기준까지 철저하게 지켜줄거 같지는 않네요.)

 

GFX벤치 테스트 결과 간의 비율을 각 GPU별로 정리한 결과입니다.

맨해튼3.0 결과를 기준으로 다른 테스트 결과 비율이 어떤지를 나타낸겁니다.

 

Mali, Adreno 계열 GPU 간의 비교, GX6000 - GT7000 계열 간의 비교를 보면 서로 다른 GPU 간에 성능 특성이 다르게 나타남을 알 수 있습니다.

Mali 계열에서는 티렉스, ALU2 성능 차이가 크고, GX6000 - GT7000 간에서는 맨해튼3.1 성능 차이가 크게 보입니다.

A11 결과를 보면 오차는 약간씩 있지만 GT7000 계열과 거의 같은 추세를 보입니다.

 

비슷한 클러스터를 갖는 제품끼리 동클럭 성능을 비교하면 아래와 같습니다.

 780MHz라고 본다면 동클럭에서 ALU2 성능(연산성능)이 1.5배입니다.

(PowerVR 7XT의 FP32 연상성능이 파이프라인 1개당 연산성능이 4 or 5FLOPS/cycle이기때문에 1.6~1.7배보다 1.5배인 쪽이 앞뒤가 맞습니다.)

 

24Tex/cycle로 보인다는 가정이 맞다면 기존 이매지네이션 GPU에 비해 텍스처 성능이 2배로 높아진 것이고, 일반적인 사양의 패턴이라면 렌더링(ROP) 성능도 함께 2배로 올랐을겁니다.

(링크 : https://www.anandtech.com/show/11364/imagination-announces-furian-pvr-8xt-gt8525)

 

연산성능과 텍스처, 렌더링 성능을 얘기하는건 이 성능 증가치가 PowerVR 8XT(Furian)의 발표치와 같기때문입니다.

(링크 : 이매지네이션 PowerVR 시리즈7 발표. (Imagination PowerVR serise7) (update 2014.11.21))

(링크 : 이매지네이션 PowerVR Furian 아키텍처 발표. (Imagination PowerVR Furian))

 

PowerVR 7XT 대비 Furian 아키텍처에서 텍스처, 렌더링 성능은 동일 사양에서 2배로 증가했습니다.

(7XT 2USC당 4Tex,Pix/cycle, 8XT 1SPU당 8Tex,Pix/cycle)

 

연산성능을 보면 A10, A11 모두 다이 이미지상 3개의 유닛이 있습니다.

7XT 기준이면 6USC, 8XT 기준이면 3SPU=6USC가 됩니다.

(8XT에는 1SPU당 3USC인 버전도 있지만 특별히 연산성능에 치중한 제품이 아닌 이상 그렇게까지 사양을 올리지는 않을겁니다.)

6USC는 총 96 pipeline이며 special function을 제외하면 1pipeline당 FP32 기준 4FLOPS/cycle 입니다.

6USC는 FP32 기준 384FLOPS/cycle 가 되는겁니다.

3SPU는 총 192 pipeline이며 special function을 제외하면 1pipeline당 FP32 기준 3FLOPS/cycle 입니다.

3SPU는 FP32 기준 576FLOPS/cycle로 7XT 대비 1.5배가 되는데, ALU2 결과와 일치하지요.

 

이매지네이션 발표에서 7XT -> 8XT에서 게이밍 성능이 +70~+90% / 연산성능 +35% / 필레이트 +80%라고 했는데, (동일 공정, 동일 클럭, 비슷한 면적)

동클럭에서 A10 대비 A11은

하이레벨 테스트 결과 +65~+70% / 텍스처링 결과 +74% / 연산성능 +52% 입니다.

연산성능은 다소 차이가 있으나 그 외 부분은 얼추 맞아들어갑니다.

 

물론 텍스처, 렌더링 성능을 2배 올리는 것, 연산성능을 1.5배로 올리는 것이 이매지네이션만 할 수 있는 사양 변동은 아니기때문에 이것만으로 8XT라고 단정할 수는 없습니다.

하지만 7XT와 유사한 성능 특성을 갖고 있으면서 8XT의 사양 특성을 갖고 있다면 8XT의 가능성을 배제할 순 없을겁니다.

 

 

- 정리 : 애플 A11 Bionic GPU

1. GFX벤치 기준 A10 대비 +40~+50% 성능.

 

2. 추정

클럭 780MHz

24 Tex,Pix/cycle (A10 대비 클럭당 성능 2배)

PowerVR 8XT (Furian 아키텍처) 계열 혹은 8XT 기반 커스텀일 가능성 있음.

 

 

 

 

반응형

댓글