- 애플 A10X GFX벤치 결과입니다.

발표 후에 결과들이 올라왔었는데 지금은 왜 인지 다 내려갔더군요.

올라왔던 결과 적어놨던거니 다시 결과가 올라왔을 때 달라질 수도 있습니다.



- A10X 공정 / GPU 아키텍처

12코어(12클러스터)라고 애플이 사양만 공개했을뿐 (늘 그렇듯이) 자세한 종류는 밝혀지지 않았습니다.

Techinsight가 공개한 이미지를 보면

(링크 : http://www.techinsights.com/about-techinsights/overview/blog/10nm-rollout-marching-right-along/)


공정은 TSMC 10nm 공정입니다.

덕분에 CPU 사양이 증가했음에도 면적은 줄어들었습니다.

오른쪽 아래 CPU 코어 사이에 L2 캐시가 보이는데 규모로 보아 L3 캐시없이 L2 캐시만 8MB인게 맞는듯 합니다.


GPU 클러스터를 보면 면적이 51%로 줄었다고 했는데 이는 TSMC가 언급했던 16FF+ -> 10nm 에서 면적 -48%라는 수치와 일치합니다.

(A9X는 16FF 공정이지만 면적에서 16FF와 16FF+는 차이가 없음.)


링크의 글을 보면 삼성이 14LPP -> 10LPE에서 면적감소가 36%라고 하는데

20nm 기준으로보면 TSMC는 20 -> 16에서 면적감소가 거의 없었고 16->10에서 52%로 줄었으니 20->10nm에서 52%(보다 약간 더 높은 수준?)로 감소한거고, (-48%)

삼성은 20->14에서 면적감소가 -15%, 14->10에서 -32% 감소해서 20->10nm에서 총 58%로 감소했습니다.

(-32%는 로직 50%, 메모리 30%, 아날로그 10%, IO 10% 구성일 경우, 단순 백엔드 사양 기준으로는 -38%로 이걸 기준으로 20->10nm 면적 감소를 계산하면 -48%)

(링크 : http://pc.watch.impress.co.jp/img/pcw/docs/1033/152/html/387.jpg.html)

절대 면적은 모르겠지만 면적 감소 비율은 차이없다는거. (조삼모사?)


GPU 클러스터 이미지 레벨을 조정해서 세부 구조가 더 잘 보이게하면 메모리 셀을 비롯한 전반적인 구조가 거의 같습니다.

뒤에서 성능도 언급하겠지만 일단 A9X와 같은 GT7800+라고 생각해도 될 듯 합니다.



- GFX벤치 결과

테스트 결과를 보면

텍스처링 +38% / ALU2 +38%

맨해튼3.1 +44% / 맨해튼 +37% / 티렉스 +34%


클러스터 수가 같고 텍스처링, ALU2 결과 향상치가 같은 것으로 보아 클럭은 A9X 대비 +38% 오른 920MHz 정도로 추측됩니다.


참고로 맨해튼3.1, 맨해튼, 티렉스 결과를 기하평균 낸 값을 보면 A9X가 92.73, A10X가 130.3 으로 A10X가  40.5% 높습니다.

애플이 밝힌 GPU 성능 향상치가 40%였는데 이런 식으로 값을 뽑아낸게 아닌가 싶기도 합니다.

(맨해튼3.1 1440p값까지 포함했을듯 한데 적어놓은게 없어서 지금은 비교할 수가 없네요.)


동일 클러스터 수/동클럭 결과로 환산해서 성능 비율을 계산해보면 위와 같습니다.

다른 결과는 A9X와 비슷한데 맨해튼3.1만 A9X 대비 3.9% 정도 올랐습니다.


GPU 아키텍처 변경이 원인일 수도 있겠으나 그렇다고 보기에 다른 테스트 항목 간 차이가 너무 없고,

A9-A10간에 아키텍처 차이가 없음에도 맨해튼3.1 1440p가 7.3%, 맨해튼3.1이 2.3% 차이가 났다는걸 고려하면 아키텍처 외에 드라이버같은 다른 원인으로 성능 차이가 발생했다고 보는게 타당할듯 합니다.

(A10X 공정 예상이 틀렸듯이 정말 아키텍처가 바뀌었을 가능성도 완전히 배제할 수는 없겠지만요.)



- 정리

A10X 공정 : TSMC 10nm

GPU : GT7800+ 920MHz 추정 (12클러스터)

GPU 성능 : A9X 대비 +40%




신고
Posted by gamma0burst Trackback 0 : Comment 13

댓글을 달아 주세요

  1. addr | edit/del | reply ㅎㅎ 2017.07.03 05:39 신고

    근2년 만에 나온것치곤 좀 아쉽네요.. 이러다가 3개월만에 아이폰8한테 잡히는거 아닌지 ㅋㅋ

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2017.07.05 00:06 신고

      성능향상 추세로 보면 A11이 맨해튼3.0 기준으로 86 fps 정도 나올거 같은데, 그렇다면 잡힐 정도는 아닐거 같네요.

  2. addr | edit/del | reply ㅁㄴㅇ 2017.07.03 17:31 신고

    A11x도 10nm이라는 가정하에 일부러 포텐셜도 아끼면서 원가절감도 좀 한거같다는 느낌이..

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2017.07.05 00:11 신고

      결과론적인 얘기지만, 아무리 16nm라도 A9X 이상으로 키우기에는 다이 사이즈가 부담러우니 10nm로 갈 수 밖에 없고, 그렇다고 무작정 사양을 늘리자니 최신 공정이라 수율이 좋지는 않아서 성능 늘리기에 한계가 있었나 봅니다.

      공정이 바뀐거에 비해 클럭이 많이 올라가지 않은 것도 초기 수율 문제와 연관이 있을 가능성이 있고요.

      이건 약간 억측이지만 이매지네이션과 관계가 틀어지면서 바뀐 공정에 맞춰 타겟 클럭을 높인 설계를 못 하고, 기존 설계 재탕하면서 클럭 올리는데 한계가 있지 않았나 싶기도 합니다.

  3. addr | edit/del | reply ㅇㅇ 2017.07.03 19:44 신고

    그래도 강력하긴 하네요

  4. addr | edit/del | reply asdf 2017.07.08 18:50 신고

    수율문제와더불어 어거지로 성능향상이 낮은걸 끼워맞춰보자면 애플이 스마트폰도아닌 태블릿에서 스로틀링이 오는걸 원하지않았을수도있고 메모리대역폭이 발목잡혀서 클럭을더높혀봤자 성능향상폭이 크지않아서 그랬을수도 있을거같습니다.

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2017.07.09 00:02 신고

      화면주사율 120Hz 지원 영향도 있을듯 합니다.
      메모리 압축 기술을 쓰겠지만 기본적으로 주사율이 2배면 필요한 메모리 대역폭이 2배로 올라갑니다.
      3D에서 120Hz로 돌리지는 않겠지만 2D 등 기능이 요구하는 메모리 대역폭은 올라가는데 총 메모리 대역폭은 그대로이니 3D에 할당되는 대역폭이 줄어들거고, 그로 인해 성능 향상에 제한이 안 걸리는 정도로 클럭 상승을 억제한걸지도 모르겠습니다.
      (아이패드 프로 9.7보면 12와 비교해서 GPU 클럭은 같은데 메모리 대역폭이 절반이라 하이레벨 테스트 결과가 30%정도 내려갔지요.)

  5. addr | edit/del | reply BlogIcon ㅇㅇ 2017.07.10 12:58 신고

    생각보다 아쉬운 성능이네요

    A11은 A10X보다 성능이 분명히 낮을거고 엑시노스 9810한테 따라잡히는건 시간문제겠네요

    성능은 애플 애플 하더니 삼성이랑 뭐 그렇게 차이나는것도 아니네요 ㅋㅋ

  6. addr | edit/del | reply 댓글 2017.07.15 01:53 신고

    댓글 너무 더럽네요
    삭제 안되나여 저런건

  7. addr | edit/del | reply 피노키오 2017.08.08 21:39 신고

    패드12.9도 엑원 성능의 6할에 준하는데, 10.5의 A10x이면 거의 9할정도로 엇비슷해졌군요.
    엑원정도면 아직까진 현역콘솔인데 그런걸 간단히 휴대하는시대가 됐네요

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2017.08.09 23:56 신고

      콘솔과 비교하려면 결국 연산성능 비교로 귀결될 수 밖에 없는데 (텍스처링이나 렌더링은 같은 벤치마크라도 돌리지 않는 이상 비교하기 힘들지요.)
      엑박 원이 1.31 TFLOPS고, A10X가 700 GFLOPS 정도로 추측됩니다. (FP32 기준)
      여전히 차이가 많이 나지요.

  8. addr | edit/del | reply 여쭤볼게 있습니다 2017.09.15 21:00 신고

    새로 a11에 대해서 글 쓰시면 거기다가 리플을 써서 여쭤볼까 했습니다만
    아직 안 쓰셔서 여기다가 리플을 적습니다. 죄송합니다.
    폴락의 법칙에 대해 한가지 여쭤봐도 될까요

    기린 920 - 2billion, 기린 950 - 3billion : 성능 2배~3배 가량 증가
    애플 a6 - 1billion under, 애플a7 - 1billion over : 성능 2배 증가
    애플 a9 - 2billion around 애플 a10 - 3.3billion : 성능 40% 증가
    로 보면 폴락의 법칙이 깨졌다 혹은 반례가 있다고 생각합니다. (근래에는 a10 -3.3billion, a11 - 4.3billion)

    하지만 다른 유저의 말로는 전력, 공정, 아키텍처, 클럭이 다르니 폴락의 법칙이 깨진 것은 아니다라고 하는데
    이런 요소들을 동일하게 해서 비교해야 하나요?

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2017.09.15 23:26 신고

      우선 제 생각이란걸 전제로 하고 말씀드리면......

      폴락의 법칙 자체는 멀티코어 시대가 오면서 이미 깨졌습니다.

      폴락의 법칙이란게,
      '성능은 면적(TR수)의 제곱근에 비례한다.' 는겁니다.
      면적이 2배가 되면 성능은 1.4배가 되는거지요.

      먼저 아키텍처가 다르니 제대로 된 비교가 아니라는 관점을 보면,
      폴락의 법칙을 검증하려면 서로 다른 면적을 가진 제품을 비교해야하는데 이런 제품들이 과연 같은 아키텍처일까요.
      예를 들면 싱글코어 CPU가 있다고 하면 같은 아키텍처로 면적이 2~3배 차이나는 제품이라는게 존재할 수 있을까요.
      당연히 그건 다른 아키텍처가 될 수 밖에 없겠지요.
      아키텍처 차이는 변수가 될 수 없습니다.

      공정, 전력, 클럭은 통제변수에 포함되어야하는게 맞습니다.
      전력, 클럭을 결정하는건 공정이니 공정을 통제하면 나머지는 따라오게 되겠고요.
      공정이 통제되어야하는건 면적에 영향을 끼치기때문입니다.
      같은 TR수라도 면적이 달라지고, 면적이 아닌 TR수로 비교를 한다해도 전력이 바뀌고 그에 따라 클럭(=성능)이 바뀌니 성능이 바뀌어서 제대로 된 비교가 안 됩니다.

      데스크탑용 CPU처럼 CPU만 있는 구조이거나, CPU 부분만의 TR 규모와 성능을 비교한다면 모를까
      AP 전체 TR 규모를 통해서 폴락의 법칙이 성립하는지를 입증하려는건 의미없는 시도라고 생각합니다.
      앞서 얘기했듯이 이미 멀티코어 시대로 들어서면서 폴락의 법칙은 깨졌고요.
      1코어의 TR 규모와 성능으로 비교하는 방법도 생각해볼 수 있겠지만, 공정도 전력 특성도 다른 제품 간의 비교에서 얼마나 의미있는 결과를 얻을 수 있을지 의문입니다.