- 애플 A11 Bionic GFX벤치 분석입니다.

(링크 : https://gfxbench.com/device.jsp?benchmark=gfx40&os=iOS&api=metal&D=Apple+iPhone+8+Plus&testgroup=overall)

 

 

- 발표치

애플 디자인 GPU (자체 설계?)

A10 대비 성능 +30%

A10 성능에서 전력 절반.

 

 

- GPU 다이

 

(왼쪽 A11 링크 : http://www.techinsights.com/about-techinsights/overview/blog/apple-iphone-8-teardown/)

(오른쪽 A10 링크 : http://www.techinsights.com/about-techinsights/overview/blog/apple-iphone-7-teardown/)

GPU 코어는 A10과 비슷한 구성입니다.

3개의 클러스터와 공통 영역으로 구성되어 있습니다.

공통 영역은 A10보다 작습니다.

 

전체 면적와 이미지로 GPU 클러스터 면적을 구해보면 A10 5.23mm^2, A11 4.15mm^2 로 20% 정도 줄어들었습니다.

클러스터 비율은 둘 다 가로 : 세로 = 2 : 1 로 같습니다.

TSMC 16nm -> 10nm에서 면적 -48%인데 반해 면적 감소치가 적은데, GPU 전체 면적은 40%가 감소했다하니 공통 부분이 작아진 영향이 큰 것으로 보입니다.

 

A10, A10X의 GPU 클러스터 이미지가 거의 같았던데 비해 A11에서는 이미지상 유사한 점이 보이지 않습니다.

(링크 : 애플 A10X GFX벤치 분석.)

이미지만으로는 단순 배치 변화인지 근본부터 설계가 달라졌는지는 불명.

 

 

- GFX벤치 결과

GFX벤치 결과는 다음과 같습니다.

A10 대비 1440p 맨해튼 3.1 +52% / 맨해튼3.1 +44% / 맨해튼3.0 +39% / 티렉스 +42% / ALU2 +40% / 텍스처링 +74%

하이레벨 테스트 결과가 최소 +40% 이상이어서 A10 대비 +30%라는 애플 발표치와 맞지 않습니다.

A10X의 경우 하이레벨 테스트의 기하평균 값과 발표치가 잘 맞았는데 이번엔 다르네요.

(링크 : 애플 A10X GFX벤치 분석.)

 

텍스처링 결과는 17002 MTex/s인데 3클러스터이기때문에 클럭당 텍스처 성능은 3의 배수를 따를 수 밖에 없습니다.

A10과 같은 12 Tex/cycle이라면 클럭이 1.4GHz가 나오는데 이는 A10 대비 +56% 높은 클럭이고, 전력 여유가 더 큰 A10X조차도 (10nm 공정임에도) 1GHz를 넘지는 않았습니다.

16FF+ -> 10FF 에서의 성능 게인이 10%라고 해도 클럭이 +56%가 되려면 +41%가 더 올라가야 됩니다.

애플 발표에서 A10과 같은 성능에서 전력이 절반, -50%라고 했는데 이건 아무래도 최대 전력효율(전성비)를 보이는 구간에 해당할 가능성이 높습니다.

A11 최대 성능이 A10보다 40% 이상 높은데 최대 성능 영역에서 전력효율은 상대적으로 떨어질 수 밖에 없습니다.

최대성능일 때 전력효율이 A10보다 40% 이상 (전력 -30%) 높아야 1.4GHz를 만들기위한 나머 41%를 채울 수 있는데 과연 그게 가능할지 의문입니다.

여러모로 봤을 때 1.4GHz의 가능성이 완전히 0은 아니지만 24Tex/cycle일 가능성이 높아보입니다.

단순 계산으로는 710MHz 내외입니다만, A10 사례를 보면 텍스처링 테스트에서 최대 성능이 나오지 않았을 가능성도 있는데 그런 경우를 가정하면 클럭은 780MHz 내외가 됩니다.

 

 

- 자체 설계 GPU인가?

애플은 자체 디자인 GPU라고 발표했는데 이 문구만으로 완전히 새로 설계된 제품이란 의미인지, 기존 제품을 베이스로 커스텀한건지 알 수 없습니다.

(업계에서 쓰는 표현상 어떻다.라는 추측은 가능하겠지만 애플 발표가 그런 느슨한 기준까지 철저하게 지켜줄거 같지는 않네요.)

 

GFX벤치 테스트 결과 간의 비율을 각 GPU별로 정리한 결과입니다.

맨해튼3.0 결과를 기준으로 다른 테스트 결과 비율이 어떤지를 나타낸겁니다.

 

Mali, Adreno 계열 GPU 간의 비교, GX6000 - GT7000 계열 간의 비교를 보면 서로 다른 GPU 간에 성능 특성이 다르게 나타남을 알 수 있습니다.

Mali 계열에서는 티렉스, ALU2 성능 차이가 크고, GX6000 - GT7000 간에서는 맨해튼3.1 성능 차이가 크게 보입니다.

A11 결과를 보면 오차는 약간씩 있지만 GT7000 계열과 거의 같은 추세를 보입니다.

 

비슷한 클러스터를 갖는 제품끼리 동클럭 성능을 비교하면 아래와 같습니다.

 780MHz라고 본다면 동클럭에서 ALU2 성능(연산성능)이 1.5배입니다.

(PowerVR 7XT의 FP32 연상성능이 파이프라인 1개당 연산성능이 4 or 5FLOPS/cycle이기때문에 1.6~1.7배보다 1.5배인 쪽이 앞뒤가 맞습니다.)

 

24Tex/cycle로 보인다는 가정이 맞다면 기존 이매지네이션 GPU에 비해 텍스처 성능이 2배로 높아진 것이고, 일반적인 사양의 패턴이라면 렌더링(ROP) 성능도 함께 2배로 올랐을겁니다.

(링크 : https://www.anandtech.com/show/11364/imagination-announces-furian-pvr-8xt-gt8525)

 

연산성능과 텍스처, 렌더링 성능을 얘기하는건 이 성능 증가치가 PowerVR 8XT(Furian)의 발표치와 같기때문입니다.

(링크 : 이매지네이션 PowerVR 시리즈7 발표. (Imagination PowerVR serise7) (update 2014.11.21))

(링크 : 이매지네이션 PowerVR Furian 아키텍처 발표. (Imagination PowerVR Furian))

 

PowerVR 7XT 대비 Furian 아키텍처에서 텍스처, 렌더링 성능은 동일 사양에서 2배로 증가했습니다.

(7XT 2USC당 4Tex,Pix/cycle, 8XT 1SPU당 8Tex,Pix/cycle)

 

연산성능을 보면 A10, A11 모두 다이 이미지상 3개의 유닛이 있습니다.

7XT 기준이면 6USC, 8XT 기준이면 3SPU=6USC가 됩니다.

(8XT에는 1SPU당 3USC인 버전도 있지만 특별히 연산성능에 치중한 제품이 아닌 이상 그렇게까지 사양을 올리지는 않을겁니다.)

6USC는 총 96 pipeline이며 special function을 제외하면 1pipeline당 FP32 기준 4FLOPS/cycle 입니다.

6USC는 FP32 기준 384FLOPS/cycle 가 되는겁니다.

3SPU는 총 192 pipeline이며 special function을 제외하면 1pipeline당 FP32 기준 3FLOPS/cycle 입니다.

3SPU는 FP32 기준 576FLOPS/cycle로 7XT 대비 1.5배가 되는데, ALU2 결과와 일치하지요.

 

이매지네이션 발표에서 7XT -> 8XT에서 게이밍 성능이 +70~+90% / 연산성능 +35% / 필레이트 +80%라고 했는데, (동일 공정, 동일 클럭, 비슷한 면적)

동클럭에서 A10 대비 A11은

하이레벨 테스트 결과 +65~+70% / 텍스처링 결과 +74% / 연산성능 +52% 입니다.

연산성능은 다소 차이가 있으나 그 외 부분은 얼추 맞아들어갑니다.

 

물론 텍스처, 렌더링 성능을 2배 올리는 것, 연산성능을 1.5배로 올리는 것이 이매지네이션만 할 수 있는 사양 변동은 아니기때문에 이것만으로 8XT라고 단정할 수는 없습니다.

하지만 7XT와 유사한 성능 특성을 갖고 있으면서 8XT의 사양 특성을 갖고 있다면 8XT의 가능성을 배제할 순 없을겁니다.

 

 

- 정리 : 애플 A11 Bionic GPU

1. GFX벤치 기준 A10 대비 +40~+50% 성능.

 

2. 추정

클럭 780MHz

24 Tex,Pix/cycle (A10 대비 클럭당 성능 2배)

PowerVR 8XT (Furian 아키텍처) 계열 혹은 8XT 기반 커스텀일 가능성 있음.

 

 

 

 

Posted by gamma0burst Trackback 0 : Comment 24

댓글을 달아 주세요

  1. addr | edit/del | reply ㅇㅇ 2017.10.16 01:59 신고

    같은 성능 특성을 보이는건 PowerVR 중진이 죄다 애플로 이직했기 때문일 가능성이 있습니다

    흠... 성능보다도 전성비가 인성적이네요
    이래저래 경쟁사들은 좀 힘내야겠습니다

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2017.10.16 05:30 신고

      몇년 전부터 개발 이러고 있는데 최근 영입 인력하고 연관성을 찾을 수 있을까요.

  2. addr | edit/del | reply BlogIcon 웰벙시코 2017.10.16 16:27 신고

    좋은 글 항상 감사합니다.

    그런데 오타 있네요
    "최대성능일 때 전력효율이 A10보다 40% 이상 (전력 -30%) 높아야 1.4GHz를 만들기위한 나머 41%를 채울 수 있는데 과연 그게 가능할지 의문입니다."

    여기 '나머지' 라고 적으셔야 하는데 '지'가 빠졌군요

  3. addr | edit/del | reply 흡혈귀왕 2017.10.17 00:21 신고

    PowerVR도 감안 할수도 있는게
    GPU 피처레벨에 PVRTC가 포함되어있더군요

    순수 자체 개발 GPU라 치고
    라이센스 무시하고 썼기도 만무하고...
    애매하긴 하네요

  4. addr | edit/del | reply ㅁㅁ 2017.10.18 18:29 신고

    근데 자체제작 GPU라 그런지 호환성 문제가 있는거 같아요

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2017.10.19 16:07 신고

      실사 얘기인가요, 추측인가요?

    • addr | edit/del 애플은 2017.10.19 18:08 신고

      그건 자체제작이라 문제있는게 아니라 그냥 최신기기 나와서 최적화 안된거예요.. 애플기기는 좀지나면 알아서 최적화 해줘요
      점유율낮으면 안해주는 안드로이드쪽이랑은 다르죠
      참고로 아드레노랑 다르게 말리는 작업 자체도 어렵다고함. 효율도 안좋고

  5. addr | edit/del | reply A TNT 2017.10.22 15:51 신고

    뜬금없는 질문이긴 한데 피나클 릿지를 생산하게 될 GF의 12LP는 14LPP에 비해 어느정도의 성능 게인, 전력소모 감소가 있을지 궁금합니다. 시기상 내후년에 전역을 하게되면 피나클 릿지가 탑재될 컴퓨터를 맞추게 될거 같아서 이런 쪽이 궁금해지네요.

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2017.10.22 16:36 신고

      업체들 발표치대로면 14LPP-> 12LP에서 성능 게인은 11% 정도입니다.
      12LP 성능이 삼성 11LPP보다 4.5% 정도 낮고 TSMC 12FFC보다 4.5% 정도 높습니다.
      전력 관련된 내용은 없었고요.

  6. addr | edit/del | reply 질문입니다 2017.10.28 00:02 신고

    해상도를 1080p로 두고서

    단순히 그래픽 성능이

    A10X>>>>>A11>A9X>>A10>>>A9>>A8X>>>>>A8>>>A7

    인것인가요? 64비트칩세대전부 생각했을때요

    아!여기서 A9X칩은 12.9인치 모델에 탑재된것이고

    A9은 아이폰6s/아이폰6s+ 탑재된것 기준

    A8은 아이폰6/아이폰6+ 탑재된것 기준입니다

  7. addr | edit/del | reply 3세대아이패드프로는 2017.10.28 00:04 신고

    아마도 A12X칩이 탑재되겠죠?? 발매텀이 1년반정도로 생각되니.... A11X라는 AP칩은 없을것 같아요

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2017.10.28 08:54 신고

      A9 때도 아이패드에 A9 들어가면서 Axx 한 번 쉬고 넘어갔지만 다음에 나온건 A10X가 아니라 A9X였지요.
      A11X 넘버링 건너뛰지는 않을겁니다.

  8. addr | edit/del | reply 2017.10.28 12:44 신고

    A8X의 GPU성능이 A9보다 강력한가요??

    제가 수많은 벤치마크 자료들을 봤을때

    A9이 A8X보다 점수가 높던데.... 다시한번

    확인 부탁 드려요 물론 CPU에서는

    geekbench3기준 A8X가 4500점정도

    A9이 4200점정도 나온걸로 기억하는데

    또 geekbench4에서는

    미세하게 A9쪽이 높게 나오는것 같던데

    geekbench3와4간의 점수 산출방식이

    달라진것인가요?

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2017.10.28 15:07 신고

      A8X, A9 GPU 성능 우위는 기준따라 다릅니다.
      GFX벤치를 예로 들면 맨해튼3.0, 티렉스에서는 동급이고, 맨해튼3.1, 카 체이스에서는 A9가 높습니다.
      저는 맨해튼3.0 기준으로 잡은거고요.

      긱벤치는 버전 바뀌면서 테스트도 바뀌고 점수 체계도 바뀌었습니다.
      4.x처럼 마이너 버전 업에서는 유의미한 점수 변경있기도 하고 없기도 하고요.

  9. addr | edit/del | reply 2017.10.28 12:49 신고

    그리고 현재 스냅드래곤 835혹은 엑스노스 8895의

    성능을 데스크탑의 CPU성능으로 치환하면

    어느정도 나올까요??

    예전 펜티엄4(2001년)정도는 나오겠죠??

    ARM과 X86의 비교가 무의미하다고 하는데

    미래에는 유의미하게 바뀌지 않을까 싶네요....

    i9 7980XE에다가 iOS를 설치하고 geekbench4를

    실행한다면 최소 멀티코어 점수에서 100만점 이상

    나오지 않을까하는 재밌는 상상을 하곤합니다 ㅋㅋ

  10. addr | edit/del | reply ㅋㅋ 2017.11.04 16:54 신고

    삼성 진짜 아무것도 아니네요 기술력이 딸리는건지...

  11. addr | edit/del | reply lee 2018.05.22 16:24 신고

    안녕하세요 감마버스트님
    애플의 AP 관련 분석 잘봤습니다.
    저도 이번에 아이패드에 A11X가 장착될 것이라 예상하는데 혹시 성능은 어느정도로 생각하시는지요?
    직벤치 기준으로요.
    저는 개인적으로 멀티 14000-16000
    사이를 예상하는데
    전문가의 의견을 한번들어보고 싶네요 ㅎㅎ

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2018.05.22 18:53 신고

      A11X가 나온다는 가정 하에서 예상하는건데 애플은 아키텍처나 사양 변화에 경향성이 잘 안 보여서 예측하기가 힘듭니다.
      공정과 면적, 원가 측면에서 경향성이 있다고 볼 수 있겠으나 인터넷에 공개된 수준의 정보로는 써먹는게 거의 불가능하고요.

      어쨌든 나온다고 가정하고 예상해보면,
      (아이패드 프로 정도는 돼야 AxX 성능이 필요하겠지요.)
      CPU, GPU 아키텍처는 A11하고 같고 코어 수만 증가한다고 봐야겠지요.
      A11이 CPU 2+4코어, GPU MP3

      공정이 10nm냐 7nm가 관건인데 흐름성 7nm 일거 같네요.
      TSMC 7nm(non EUV)면 면적 감소 효과가 크니 사양은 크게 늘릴 수 있지만 성능 향상은 크지 않아서 클럭은 크게 오르기 어려울겁니다. 최대 10% 정도?

      이거저거 다 따져보면 GPU는 MP6에 성능은 A11 2.2배 정도?
      CPU는 HMP 적용된 김에 최대 4+4코어까지 예상할 수도 있을거 같네요.
      리틀코어를 4개에서 더 늘리는건 의미가 없어보이고 빅코어 3개는 일 하다만거 같은 느낌이지요.
      코어 수가 늘어난대신 클럭은 A11에서 더 올리기 힘들거 같네요.
      빅코어 4코어, A11하고 동클럭으로 가정해서 계산해보면 긱벤치 멀티코어 총점이 18000점 나오네요.
      물론 이건 이상적인 경우이고 클럭이 더 낮아지든가, 고성능 코어가 3코어 이상으로 늘어날수록 성능 스케일링 효율이 떨어지는 것 등을 고려하면 16000점 내외이지 않을까 싶습니다.

  12. addr | edit/del | reply lee 2018.05.23 00:25 신고

    감마버스터님 의견 감사합니다.
    리플 보면서 전문적이면서 친절하고 쉬운 설명에 감탄했네요.

    개인적으로 애플의 전략이 A10x부터
    바뀌었던 생각입니다.
    전에는 Ap의 차이가 이렇게 크지 않았는데
    (a9->a9x, a10 정도 차이가, 천점-천오백 정도였는데
    A10x에서 거의 1.8배, A11 성능도 2베정도의 성능을 뽑아내면서 하드웨어 성능으로 부족하던 태블릿 수요 창출 및 컴퓨터 수요를 뺏어 오려는 생각으로 보이네요 (arm과 x86을 비교할순 없지만, 벤치숫자만으로라도 우선 대부분의 중간급 노트북은 제압했으니)
    (ios도 컴퓨터의 생산성을 얻기위해 업그레이드가 많이 되겠죠?)

    감마버스터님 생각에는 혹시 이런 극단적(?) 성능 업그레이드가 한동안 지속되리라고 보십니까? 매년 마다 거의 1.7배씩 업그레이드되는 흐름 말이지요. (안드로이드는 몇세대 뒤쳐짐에도 불구하고)
    답변해주신것처럼, 예측하기가 어렵긴 하지만요.

    그리고 고성능 코어 4개의 가능성을 얘기해주셨는데 배터리가 괜찮을까요? (A11이 그많큼 괜찮은 AP인가요?)
    아이패드 에어2 쓸때는, 트리플 코어라 배터리가 빨리달았는데
    프로2때는 코어가 3개임에도 어느정도 잘 견뎠던걸로 생각합니다.
    그런데 이번 프로3에는, face id가 적용될 가능성 루머가 많은데, 베젤이 줄어들다보면 배터리 용량도 줄어들지 않을까하는 생각입니다. 배터리 용량과 배터리 관리 능력이 괜찮을까요? 고성능 4 코어 정도를요? a11를 써보지 않아서 궁금하네요.


    또 하나 마지막 질문은
    인터넷 찾아보니
    a11이 다른 ap들과 유독 다른 이유가
    hmp, 그리고 뉴럴엔진에 있다고 보던데
    x86 cpu 계열이 샌디브릿지 이전과 이후로 나뉘듯
    hmp, 뉴럴엔진이라고 하는게 그만큼 ap 역사상 혁명적인 정도인가요?

    그리고 현재 프로2를 가지고 있는데
    프로2를 팔고, 프로3를 기다리는게 나을까요?
    (9월에 아이폰과 함께 A12과 나올껄 생각하면, 6월 wwdc때 A11x와 함께 아이패드가 나올껏 같은데 감마님은 시기와 가격은 어느정도 되리라고 보시나요?)
    (9천점 vs 최소 16000 이면 정말 어마어마하단 생각이 드네요)

    cpu를 잘 모르다보니 전문가에게 질문이 많네요 ^^ㅎㅎ
    의견 부탁드립니다!

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2018.05.23 20:01 신고

      -
      A10X, A11 세대에서 성능 폭증은 여러가지 이유가 있는데 일단 빅리틀 적용으로 최대 클럭을 더 끌어올린게 큽니다.
      (물론 기본적으로 높은 아키텍처 성능이 뒷받침되었고요.)
      A11은 HMP 들어가면서 멀티코어 점수에서 득을 보기도 했습니다. (리틀코어 영향)

      이런 식의 (일종의) 성능 쥐어짜기는 이미 안드로이드 제품에 들어갔던 AP에서 먼저 쓰고 있던 것들이고, 당연한 얘기지만 전력, TDP 제한 문제를 근본적으로 돌파한 방법이 아니기때문에 한계가 있습니다.
      안드로이드에서는 이미 그 상황이 온지 오래이고 이것조차 극복하겠다고 터보부스트 개념까지 적용하고 있지요.

      결국 특별한 변수없이 싱글코어에서 말씀하신 수준의 향상은 어렵고, 멀티코어에서도 마찬가지입니다.
      그나마 멀티코어는 가능성이 있는데 그게 가능하려면 아키텍처 개선은 기본이고 거기에 공정 개선으로 확보된 면적, 전력으로 코어 수를 적극적으로 늘리는 방법이 필요할겁니다.

      -
      4코어는 7nm로 공정이 전환된다는 가정 하에서 가능합니다.
      CPU 면적을 늘릴 수 있는 마진이 확보되는데, 전력은 클럭 조정으로 커버할 수 있을거고요.
      만약 A11과 같은 아키텍처이면서 코어 증가로 클럭이 더 낮아지면 싱글스레드 성능은 줄어드는게 되는데 포장할 방법은 충분히 있습니다.
      긱벤치를 성능 기준으로 삼는다면 A11X는 메모리 대역폭이 A11의 2배라서 메모리 점수가 더 높을 것이고 클럭에 비례하는 다른 항목 점수가 떨어지는건 상쇄해서 총점에서 큰 차이가 없게 만들 수도 있을겁니다.
      비교군을 아예 A10X로 잡는다면 싱글코어 점수 차이는 확실히 낼 수 있고요.
      그런데 이런 얘기는 사실 4코어를 넣을 수 있다는 관점에서 하는 얘기이지, 꼭 4코어가 들어가야하는 당위성을 제시하는건 아닙니다.
      3+4코어 구성도 이론상 충분히 가능하니까요.

      -
      HMP는 앞서 말씀드린대로 기존 안드로이드 제품에 들어갔던 AP(엑시노스, 기린, 스냅드래곤 등등)에 이미 적용돼있던 기술입니다.
      오히려 애플이 늦었던 부분이라서 차별점이라 보기는 어렵습니다.
      뉴럴엔진은 최근 트랜드인데 들어갔다는거 자체보다는 어떻게 활용하느냐가 더 중요할거 같네요.
      (사견입니다만) ARM 계열 제품 역사에 한 획을 그을만한 혁명적인 요소로 보기 힘듭니다.

      -
      아이패드 프로 3세대가 이번에 나오느냐, 출시 시기나 가격은 마케팅 요소에 달린 문제라서 저는 잘 모르겠네요.
      (그 시기에 어느 기술을 어떻게 활용하면 최대 성능/가성비를 얻을 수 있느냐에 대한게 기술적인 논의겠고요.)
      이런저런 정보나 찌라시 받아보는 분들이 더 잘 알겁니다.

  13. addr | edit/del | reply lee 2018.05.24 13:39 신고

    답변을 듣고나니 예측하기 어렵던 애플의 행보가 조금은 보이는 느낌입니다. a11x가 장착될 아이패드 프로3가 너무 기대되네요 전문적이면서 구체적으로 쉽게 설명해주셔서 감사합니다

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2018.05.24 19:53 신고

      오늘 나온 찌라시보니 3+5코어라는 얘기가 있네요.
      일반적인 HMP라면 1클러스터에 최대 4코어까지 가능해서 6코어도 아닌 5코어는 굳이 해야할 필요가 있을까 싶은 애매한 구성.

  14. addr | edit/del | reply lee 2018.05.25 09:55 신고

    그렇군요 단순히 hmp되서 빅3리틀5 풀가동! 생각했는데 답변주신대로 정말 1클러스터에 최대 4코어리면 나머지 1코어는 무엇인지...어리둥절 하네요;