- 얼마 전 올라왔던 (가칭) 아이폰8 긱벤치4 결과에 대한 분석입니다.

일단 이 내용이 상당히 신빙성이 있다는 전제하에 얘기를 진행할겁니다.

예전 A10 긱벤치 결과가 유출된 적이 있었는데 긱벤치 운영자가 fake라고 얘기까지 했지만 결국 사실인 것으로 결론났었던걸 생각하면 더더욱 그렇습니다.

(링크 : 애플 A10 긱벤치3 유출 결과에 대하여.)

이번 유출에 대해서도 이런저런 근거를 들어가면 fake라고 주장하는듯 한데 저런 전적이 있어서 상당히 신뢰도가 떨어지는 주장으로 보입니다.



- 유출 결과


긱벤치 4.0 결과

싱글코어 총점 4537 / 멀티코어 총점 8975

S58AP

A11 4코어 2.74GHz

L1 명령어 캐시 128KB



- 스크린샷 비율

(참고로 보면) 원본인지는 모르겠지만 캡쳐 스크린샷 크기는 690 x 1556 으로 화면비는 대략 2.255 : 1 입니다.

아이폰 관련된 유출 내용 중 이와 비슷한 내용이 있긴합니다.


5.8인치 아이폰 해상도가 2800 x 1242 라는건데 이 화면비가 2.254 : 1로 스크린샷 비율과 같습니다.

(리사이즈 오차도 생각해야겠지요.)



- 시스템 정보 분석

A11 4코어로 표기됐는데 점수로 봐서는 빅코어는 듀얼코어 구성입니다.

클러스터 마이그레이션 방식이 적용되었던 A10과 달리 HMP 방식이 적용된 것으로 보입니다.

빅코어 x2 + 리틀코어 x2 구성이 된듯.


클럭은 2.74GHz인데 이건 A10 2.34GHz보다 +17% 오른 클럭입니다.

시기상 TSMC 10nm 공정으로 생산될듯 한데, 16FF+ -> 10nm 공정에서의 성능 게인은 10% 정도로 알려져 있습니다.

(링크  :삼성, TSMC 공정 비교. (2017.03.28.))

산술적으로 A11 클럭은 2.34 x1.1 = 2.57GHz가 되어야 하는거지요.

2.74GHz는 여기서 +6.4% 더 오른 값입니다.

다른 여러가지 가능성이 있을 수 있겠습니다만 현재로는 HMP 방식 적용으로 피크 클럭을 더 끌어올릴 수 있는 여지가 생겼다고 해석하는게 타당할듯 합니다.


L1 명령어 캐시는 128KB로 A10의 64KB의 2배입니다.


보드는 S58AP로 나오는데 A10 긱벤치 유출 전례를 보면 유출본에서는 D01AP로 나왔으나 실제 제품은 D10AP로 나왔습니다.

(링크 : 애플 A10 긱벤치3 유출 결과에 대하여.)

A11 탑재 아이폰 실제 제품은 S85AP로 나올지도 모르겠네요.



- 테스트 결과 분석

싱글코어 총점 4537 / 멀티코어 총점 8975

이전같았으면 싱글코어, 멀티코어 점수로 메모리 점수를 역산할텐데 이번 경우에는 HMP 방식떄문에 멀티코어 점수에 리틀코어 성능이 영향을 끼쳐서 코어 수를 활용한 역산이 불가능합니다.

싱글코어 점수로 대략적인 점수 향상을 맞춰보는 수준에 만족해야할듯.


A10 싱글코어 총점이 3507점 정도였습니다. (긱벤치 4.0 기준)

Crypto : 2425 / INT : 3875 / FP : 3342 / MEM : 3197

단순히 클럭만 2.34 -> 2.74GHz로 올랐다고 가정해서 계산하면,

Crypto : 2840 / INT : 4538 / FP : 3913 / MEM : 3197 -> 총점 3997점이 나옵니다.

아직 부족하지요.


A8~A10에서의 메모리 점수 상승률을 보면 메모리 사양의 변화가 있었지만 한 세대에 35~40% 정도의 점수 향상이 있었습니다.

(A7 : 1477 , A8 : 1665 , A9 : 2257, A10 : 3197)

A11에서도 이와 같은 성능향상이 있다고 가정하면 A11의 메모리 점수는 3197 x1.4 = 4476

앞서 계산에 이 메모리 점수를 반영하면

Crypto : 2840 / INT : 4538 / FP : 3913 / MEM : 4476 -> 총점 4253점이 나옵니다.

300점 정도 빠지는 부분은 아키텍처 개선으로 맞춰야할겁니다.


A9 -> A10의 경우를 보면 동클럭점수가 정수 +7.4%, 부동소수점 +5.2% 였습니다. (작은 편이지요.)

사실 Crypto 항목까지 해서 각 항목의 성능 향상률을 특정할 수 없기때문에 일괄적으로 어느 정도 올라가야 유출점수가 나오는지 맞추는게 최선입니다.

숫자를 맞춰보면 10% 정도 올라가면 비슷한 점수가 나옵니다.

Crypto : 3123 / INT : 4991 / FP : 4304 / MEM : 4476 -> 총점 4589점이 나옵니다.


애플칩의 L1 캐시를 보면 A6 -> A7에서 2배가 되면서 명령어 64KB/데이터 64KB된 이래 A10까지 크기가 유지되어 왔습니다.

그랬던게 A11로 오면서 2배로 증가했습니다. (DATA 캐시는 2배가 아닐 수도 있습니다.)

대규모의 아키텍처 변화를 보여주는 증거이고, 그렇다면 그런 큰 변화에 비해서 성능향상이 작다는 생각도 듭니다만,

L1 캐시가 증가했던 A6 -> A7의 경우를 보면 메모리 점수 상승은 5% 미만으로 미미한 수준이었습니다.

32비트 -> 64비트 전환, L3 캐시 추가, 메모리 대역폭 2배라는 사양 증가에도 말이지요.

대신 그 외 항목에서는 엄청난 성능 향상이 있었습니다.

(64비트 효과를 빼더라도 동클럭성능 +50%에 육박했습니다.)


이런 전례를 봤을 때, 앞서 했던 가정이 틀릴 수도 있습니다.

메모리 점수 상승은 거의 없고 그 외 항목들의 동클럭점수 향상으로 총점이 올라갔을 가능성도 있는거지요.

이런 가정하에서 메모리 점수 상승은 +10% 정도로 낮춰잡고 그 외 항목의 성능 향상치를 계산해보면 +15% 정도가 나옵니다.

(Crypto : 3265 / INT : 5218 / FP : 4500 / MEM : 3516 -> 총점 4565점)

A6 -> A7 만큼의 폭발적인 향상은 아니지만 A8 -> A9 정도의 성능 향상은 나옵니다. (+15~20%)

(동클럭점수는 A6->A7 때 제일 많이 올랐고, 그 다음이 A8->A9, 그 외에는 10% 이하 수준이었습니다.)




신고
Posted by gamma0burst Trackback 0 : Comment 15

댓글을 달아 주세요

  1. addr | edit/del | reply 2017.05.04 05:14

    비밀댓글입니다

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2017.05.04 13:43 신고

      기술적으로 안 되는건 아니지만 현실성까지 포함해서 따져보면 HMP가 아닌데 2+4 구성은 가능성이 낮을겁니다.

      만약 클러스터 마이그레이션으로 2+4 구성이고 저 점수가 싱글, 멀티 모두 빅코어만 동작한 점수라고 가정한다면 멀티코어 총점이 싱글코어 총점의 2배보다 낮아야됩니다. (메모리 점수를 뺀 점수가 2배가 되어야하니...)
      그런데 이미 총점이 1.98배여서 가정을 그대로 밀어붙이면 메모리 점수가 거의 없는 점수 구성이라는 결론이 나옵니다.
      가정이 틀렸다는거고, 멀티코어 점수에 빅코어 외에 점수를 더 올린 것이 있다는건데 이건 HMP에 의한 리틀코어 개입이라고 보는게 현실적이겠지요.
      (물론 저 점수가 맞다는 가정하에서 나온 추론이지만요.)

      만약 말씀하신대로 멀티가 8400 정도고 싱글-멀티 점수로 메모리 멀티점수를 정말 긍정적으로 역산하면 4000점 정도로 나오네요.

      이런저런 얘기나오는데 어떻게든 fake로 묻으려는 시도가 아닌가 의심되는게 사실입니다.

    • addr | edit/del 2017.05.05 18:31

      비밀댓글입니다

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2017.05.06 14:50 신고

      퀄컴은 ARM 레퍼런스로 갈아타서 더 이상 CPU 성능에서 경쟁이라고 보기 힘들다면 다음 목표는 애플일텐데 좀 낮아보이긴하네요.

  2. addr | edit/del | reply Favicon of http://rubp.tistory.com BlogIcon RuBisCO 2017.05.04 06:04 신고

    격차가 이젠 너무 크게 벌어지는지라 건너가야 하나 고민중입니다. 그래도 전전세대까진 노선 차이정도였던게 이젠 격차가 너무 심해지네요.

  3. addr | edit/del | reply ㅇㅇ 2017.05.07 23:01 신고

    뭐 X86 이랑 직접적인 비교는 불가능 할 것 같지만 이정도면

    인텔에 코어M 시리즈랑 비벼볼만 하지 않나요?

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2017.05.08 00:52 신고

      제 생각이지만 코어M이랑 비벼보려면 싱글 6000점 이상은 나와야할거 같네요.

  4. addr | edit/del | reply BlogIcon ㅇㅇ 2017.05.08 01:24 신고

    이거 뭐.. 성능으로는 끝판왕이 되겠네요...;;;

    멀티가 9000에 육박하는 성능인 데다가
    싱글코어 성능도 높고 총 코어수도 4코어밖에 안되니 실제 성능도 엄청나겠군요....

    L1 캐시도 128KB로 고용량이고요...


    애플의 설계능력이 매우 대단하긴 하지만
    말씀하신 대로 메모리 성능 향상은 거의 없이
    코어 성능이 폭발적으로 올라서 저정도 성능이 되었다는 가정이 맞다고 친다면 새삼 정말 놀랍겠습니다..

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2017.05.08 02:52 신고

      본문대로면 성능 향상에서 제일 비중이 큰건 클럭 상승이지요.
      피크 클럭 올리는 것도 마냥 쉬운건 아니니 저평가 받을건 아니지만요.

    • addr | edit/del ㅇㅇ 2017.05.08 04:09 신고

      뭐 저정도 점수도 놀랍지만
      보통 긱벤치 점수 올리는데 메모리성능도 기여를 많이 하는것과는 다르게
      아키텍처 개선으로든 클럭 상승으로든 코어 성능만 많이 올라서 저 정도면 더욱 놀라울 것 같다는 것이죠

  5. addr | edit/del | reply ㅇㅇ 2017.05.13 00:59 신고

    애플이 무슨 짓을 한 지는 잘 모르겠지만

    싱글 4500 / 멀티 9000 은 엥간한 X86데스크 탑 에서도 간단한 작업이면 빠릿하게 굴러 갈 것 같은 사양인데요..

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2017.05.13 11:45 신고

      ARM과 x86은 긱벤치 점수로 성능 비교하면 실제랑 잘 안 맞습니다.
      (이건 제 추측입니다만) 실제 성능에 비해 x86이 arm계열보다 점수가 반정도 나오는걸로 보고 있습니다.
      arm이 x86과 같은 수준의 성능이라고 말하려면 긱벤치 점수 기준으로 x86보다 점수가 2배는 나와야된다고 보는거지요.

      좀 된 자료지만 참고하세요.
      http://gamma0burst.tistory.com/875

      타겟이 실버몬트~골드몬트 정도면 x86급은 된다고 말할 수 있겠지만 m계열이 타겟이라면 아직 멀어보입니다.

  6. addr | edit/del | reply ㅂㅈㄷ 2017.05.13 13:11 신고

    변수로 10nm 1세대공정이아니라 lpp같은 2세대공정이라면 충분하지않을까싶습니다.. 뭐 tsmc가 10nm 2세대공정을 올해 아이폰에 대량납품할만큼 양산이 가능할거같진않지만요..

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2017.05.13 14:16 신고

      엔비디아 봍타가 12nm로 양산됐는데 이건 나름 탑티어급인 엔비디아에 물량 배정조차 안 될정도로 10nm capa가 부족하다는겁니다.
      애플에 다 몰아주느라요.

      TSMC가 EUV없이 7nm 가는 로드맵을 짰을 정도로 7nm 전환에 집중하고 있고요.

      종합하면 tsmc 10nm는 20nm같은 징검다리 느낌의 공정이 될 가능성이 높습니다.
      2세대 공정이 나올수가 없지요.



티스토리 툴바