- 앞서 CPU 사양을 추정해봤습니다. 이번엔 GPU 성능/사양 입니다.

(링크 : 애플 A9 긱벤치 찌라시 결과 분석.)

 

- CPU 사양 추정에 첨언하자면

기존에 나왔던 중국발 찌라시를 종합하면 이렇습니다.

1. 성능 10~20% 향상.

2. 코어M 맥북에어 12인치와 비슷한 긱벤치 점수 (낮게 잡아도 싱글 2500 / 멀티 4600)

3. 코어가 개선되서 크기가 줄어서 다코어가 가능.

 

이것만 보면 싱글 2200점대가 나왔던 최근 내용이 들어맞는 것처럼 보이기도 합니다.

클럭당성능이 넉넉잡아 10% 정도 증가했고, 점수도 2번 내용과 어느 정도 들어맞고요.

그런게 그렇다고 그대로 믿기도 그런게,

우선 소스의 신뢰도가 찌라시 중에서도 바닥에 가까운 수준이고,

10~20%의 성능향상이라는게 클럭당성능 얘기가 아니라 최종 성능이라면 단순한 클럭향상으로 볼 수 있는데,

공정 변경으로 최대 +20%의 클럭상승이 가능하다고 봤던 것과 일치합니다.

다코어 가능하다는 것도, 모든 성능 찌라시가 듀얼코어를 가르키고 있다는 점에서 설득력이 떨어집니다.

 

사람마다 찌라시를 보고 신뢰하는 정도가 다르겠지만, 현재로는 제가 내릴 수 있는 결론은 이전 포스팅에서 내렸던게 최선입니다.

 

 

- GPU 성능 찌라시.

PowerVR 시리즈 7XT 사용.

맨해튼 : 28.9 fps / 29.7 fps

티렉스 : 65.6 fps / 61.7 fps

 

맨해튼 : 27.2 fps

티렉스 : 61.5 fps

 

갤럭시S6보다 약간 앞 섬.

 

A9X 성능은 테그라X1급 (테그라X1 성능은 맨해튼 : 64.4 fps, 티렉스 : 123.0 fps)

 

 

- 가정

아이폰6 플러스 성능이 맨해튼 : 20.8 fps, 티렉스 : 48.3 fps 입니다.

GX6450 550MHz 결과로 보고 있습니다.

 

찌라시에서 최대값만 취하면 애플 A9는 맨해튼 : 29.7 fps, 티렉스 : 65.6 fps 입니다.

아이폰6 플러스 대비 맨해튼은 1.43배, 티렉스는 1.36배 입니다.

갤럭시S6 가 맨해튼 : 24.9 fps, 티렉스 : 58.7 fps 이니 이보다 약간 앞선다는 것도 일치하네요.

(각각 19%, 18% 높은 결과인데 이게 약간인지 큰건지는 보는 시각에 따라 다를듯.)

 

가정 및 계산은 이전에 했던 방식을 그대로 따를겁니다.

(링크 : 심심풀이로 보는 애플 (가칭) A9 GPU 성능 및 사양 추정)

과정 다 생략하고 가정만 모아놓으면 이렇습니다.

 

PowerVR 시리즈 사용.

4클러스터 -> 6클러스터 성능 향상 : 맨해튼 1.36배, 티렉스 1.3배

4클러스터 -> 8클러스터 성능 향상 : 맨해튼 1.72배, 티렉스 1.6배

동일 사양에서 시리즈6XT -> 7XT 성능 향상 : 맨해튼 1.35배, 티렉스 1.61배

 

그런데 애플이 OpenGL이 아니라 Metal을 쓰면서 상황이 달라졌습니다.

4클러스터 -> 6클러스터 성능 향상 : 맨해튼 1.49배, 티렉스 1.31배

4클러스터 -> 8클러스터 성능 향상 : 맨해튼 1.98배, 티렉스 1.62배

 

 

- 애플 A9 계산1

1. PowerVR 시리즈 6XT 맨해튼

클럭당성능

6XT 4클러스터 : 20.8 fps / 550MHz = 0.0378 fps/MHz

6XT 6클러스터 : 0.0378 fps/MHz x1.49 = 0.0563 fps/MHz

6XT 8클러스터 : 0.0378 fps/MHz x1.98 = 0.0748 fps/MHz

 

29.7 fps가 나오기위한 클럭.

6XT 4클러스터 : 29.7 fps / 0.0378 fps/MHz = 785MHz

6XT 6클러스터 : 29.7 fps / 0.0563 fps/MHz = 528MHz

6XT 8클러스터 : 29.7 fps / 0.0748 fps/MHz = 397MHz

 

2.  PowerVR 시리즈 6XT 티렉스

클럭당성능

6XT 4클러스터 : 48.3 fps / 550MHz = 0.0878 fps/MHz

6XT 6클러스터 : 0.0878 fps/MHz x1.31 = 0.1150 fps/MHz

6XT 8클러스터 : 0.0878 fps/MHz x1.62 = 0.1422 fps/MHz

 

65.6 fps가 나오기위한 클럭.

6XT 4클러스터 : 65.6 fps / 0.0878 fps/MHz = 747MHz

6XT 6클러스터 : 65.6 fps / 0.1150 fps/MHz = 570MHz

6XT 8클러스터 : 65.6 fps / 0.1422 fps/MHz = 461MHz

 

4클러스터는 클럭이 너무 높습니다.

8클러스터는 맨해튼- 티렉스 클럭 차이가 16% 입니다. 제법 크지요.

6클러스터가 그나마 비슷한 클럭이 나왔습니다.

클럭전작과 비슷한 530~570MHz 입니다.

 

3.  PowerVR 시리즈 7XT 맨해튼

클럭당성능

7XT 4클러스터 : 0.0378 fps/MHz x1.35 = 0.0510 fps/MHz

7XT 6클러스터 : 0.0563 fps/MHz x1.35 = 0.0760 fps/MHz

7XT 8클러스터 :  0.0748 fps/MHz x1.35 = 0.1010 fps/MHz

 

29.7 fps가 나오기위한 클럭.

7XT 4클러스터 : 29.7 fps / 0.0510 fps/MHz = 582MHz

7XT 6클러스터 : 29.7 fps / 0.0760 fps/MHz = 391MHz

7XT 8클러스터 : 29.7 fps / 0.1010 fps/MHz = 294MHz

 

4.  PowerVR 시리즈 7XT 티렉스

클럭당성능

7XT 4클러스터 : 0.0878 fps/MHz x1.61 = 0.1414 fps/MHz

7XT 6클러스터 : 0.1150 fps/MHz x1.61 = 0.1852 fps/MHz

7XT 8클러스터 :  0.1422 fps/MHz x1.61 = 0.2289 fps/MHz

 

65.6 fps가 나오기위한 클럭.

7XT 4클러스터 : 65.6 fps / 0.1414 fps/MHz = 463MHz

7XT 6클러스터 : 65.6 fps / 0.1852 fps/MHz = 354MHz

7XT 8클러스터 : 65.6 fps / 0.2289 fps/MHz = 287MHz

 

4클러스터는 맨해튼-티렉스 클럭 간 차이가 26%로 너무 큽니다.

8클러스터는 300MHz도 안 됩니다. 너무 낮습니다.

6클러스터는 400MHz 수준인데 전작인 아이폰6 플러스 클럭이 550MHz 인걸 생각하면 이 역서 너무 낮습니다.

(최적 클럭이라는걸 생각해야겠지요.)

 

PowerVR GX6650 으로 보는게 타당할듯 합니다.

 

 

- 애플 A9 계산2

중간 결론을 내보면,

맨해튼 : 29.7 fps, 티렉스 : 65.6 fps

GX6650 530~570MHz 내외.

 

찌라시 내용을 보면 약간 낮은 값이 하나 더 있습니다.

맨해튼 : 27.2 fps, 티렉스 : 61.7 fps

(가칭) 아이폰6S가 아이폰6 처럼 두 가지 크기로 나온다면 GPU 클럭도 다르게 가져갈 가능성이 높습니다.

아이폰6 에서는 5~6% 정도 차이가 있는 것으로 나왔습니다.

 

찌라시 내용에서 차이는 이렇습니다.

맨해튼 : 29.7 / 27.2 = 9.2%

티렉스 : 65.5 / 61.7 = 6.3%

아이폰6 보다 차이가 좀 더 있네요.

 

이 성능일 때 클럭을 계산해보면,

맨해튼 : 27.2 fps / 29.7 fps x 528MHz = 483MHz

티렉스 : 61.7 fps / 65.6 fps x 570MHz = 536MHz

 

아이폰6처럼 아이폰6S와 아이폰6S 플러스의 성능차이를 5~6% 수준으로 맞췄다면 540MHz 정도가 들어맞습니다.

맨해튼 클럭이 낮게 나온건 클러스터 증가에 따른 성능 향상치가 너무 높게 잡힌게 아닌가 싶습니다.

아이폰-아이패드 간의 비교이니 TDP 차이가 영향을 끼쳤을 수도 있습니다.

 

570MHz, 540MHz는 좀 어중간한 숫자이니 이런저런 오차를 포함한다고 가정하거나 기존 값들을 참조하면 600MHz, 550MHz 정도로 볼 수 있겠네요.

 

 

- 애플 A9X 계산

찌라시대로라면 테그라X1급 성능인 맨해튼 : 64.4 fps, 티렉스 : 123.0 fps

앞서 계산한 값을 활용해서 가능한 사양을 구해보면,

 

1. PowerVR 시리즈 6XT 맨해튼

64.6 fps가 나오기위한 클럭.

6XT 4클러스터 : 64.6 fps / 0.0378 fps/MHz = 1709MHz

6XT 6클러스터 : 64.6 fps / 0.0563 fps/MHz = 1165MHz

6XT 8클러스터 : 64.6 fps / 0.0748 fps/MHz = 877MHz

 

2.  PowerVR 시리즈 6XT 티렉스

123.0 fps가 나오기위한 클럭.

6XT 4클러스터 : 123.0 fps / 0.0878 fps/MHz = 1401MHz

6XT 6클러스터 : 123.0 fps / 0.1150 fps/MHz = 1070MHz

6XT 8클러스터 : 123.0 fps / 0.1422 fps/MHz = 865MHz

 

모두 터무니없이 높은 클럭이 필요합니다.

A8X를 보면 사양을 늘리더라도 클럭은 아이폰과 비슷한 수준으로 유지를 했습니다.

PowerVR 시리즈 6XT로는 찌라시 상의 성능을 얻을 수 없습니다.

 

3.  PowerVR 시리즈 7XT 맨해튼

64.6 fps가 나오기위한 클럭.

7XT 4클러스터 : 64.6 fps / 0.0510 fps/MHz = 1267MHz

7XT 6클러스터 : 64.6 fps / 0.0760 fps/MHz = 850MHz

7XT 8클러스터 : 64.6 fps / 0.1010 fps/MHz = 639MHz

 

4.  PowerVR 시리즈 7XT 티렉스

123.0 fps가 나오기위한 클럭.

7XT 4클러스터 : 123.0 fps / 0.1414 fps/MHz = 870MHz

7XT 6클러스터 : 123.0 fps / 0.1852 fps/MHz = 664MHz

7XT 8클러스터 : 123.0 fps / 0.2289 fps/MHz = 537MHz

 

8클러스터 결과에서 앞서 계산한 A9 GPU 클럭과 비슷한 값이 나왔습니다.

정확한 클럭을 알 수 없으나 GT7800 으로 보입니다.

 

 

- 추정 결과

1. 애플 A9

(가칭) 아이폰6S

PowerVR GX6650 550MHz

맨해튼 : 31.0 fps

티렉스 : 63.3 fps

FP32 연산성능 : 211.2 GFLOPS

 

(가칭) 아이폰6S 플러스

PowerVR GX6650 600MHz

맨해튼 : 33.8 fps

티렉스 : 69.0 fps

FP32 연산성능 : 230.4 GFLOPS

 

2. 애플 A9X

PowerVR GT7800

전작처럼 아이폰과 클럭이 같다고 가정하면,

600MHz

맨해튼 : 60.7 fps

티렉스 : 168.0 fps (너무 높아보이는데 계산상 그렇게 나옵니다.)

FP32 연산성능 : 307.2 GFLOPS

 

 

 

Posted by gamma0burst Trackback 0 : Comment 15

댓글을 달아 주세요

  1. addr | edit/del | reply BlogIcon Sammy 2015.09.09 14:49

    My God!Exynos8890 may be the Samsung Mongoose architecture processor benchmark results, in Geekbench, universal8890,browser.primatelabs.com/geekbench3/search?utf8=%E2%9C%93&q=universal8890

    • addr | edit/del BlogIcon A TNT 2015.09.10 00:18

      아마 저건 초기 벤치마크 결과라서 낮게 나온거 일겁니다. 7420 멀티 결과가 5600점이고 8890(융프라우) 루머상 성능이 싱글 2130 멀티 7490이죠

  2. addr | edit/del | reply 지나가던폰덕 2015.09.09 17:18

    아쉽네요... PowerVR 7XT 시리즈 탑재되기를 기대했는데... 역시나 아직 스마트폰에는 무리였나 보네요...

    그런데 감마님, 너무 낮은 저클럭이라 해도 들어가기가 어려운건가요?? 성능이 괜찮다면 저클럭 탑재도 가능할 것 같은데;;

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2015.09.10 00:49 신고

      다이사이즈 = 수율 = 원가 문제가 있어서 현실적으로 거의 그런 선택을 안 합니다.
      보통 사양과 클럭, 소비전력 사이에서 적절한 지점을 찾지요.

  3. addr | edit/del | reply BlogIcon A TNT 2015.09.10 03:41

    7XT 8클러스터 800mhz인가보네요
    맨해튼 60이 아니라 80찍고 티렉스 200찍을듯요

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2015.09.10 04:33 신고

      발표대로 정말 2배면 클러스터 수가 늘어날 수도 있겠네요.

    • addr | edit/del BlogIcon A TNT 2015.09.10 16:28

      아니면 맨해튼이 아니라 티렉스가 기준일수도 있을거같네요

  4. addr | edit/del | reply BlogIcon 매니아 2015.09.10 10:11

    a8대비 90퍼증가면 7400맞는듯.. a9x에는 7800쓰고 a9엔 6650 쓸리가..

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2015.09.11 04:29 신고

      A8X 두배면 7800 갖고도 빡빡해보이네요.
      A9는 발표보니까 GT7600 쓰는듯.

    • addr | edit/del BlogIcon 매니아 2015.09.11 10:19

      생각해보니 7600이겟네요 7400가지고 90퍼성능향상이몀 클럭증가가 꽤 클텐데 애플이 그런 고클럭은 그닥안좋아하니..

  5. addr | edit/del | reply BlogIcon Sammy 2015.09.10 17:04

    This is Antutu official data, is true, it may be Samsung Galaxy S7 Snapdragon 820 processor performance, single-threaded integer lifting little, but single-threaded floating point lift 1.9 times! here, i冰宇宙 Weibo:weibo.com/5673255066/profile?topnav=1&wvr=6#_rnd1441872102816

  6. addr | edit/del | reply BlogIcon 정주행중에 2015.09.11 03:14

    A8의 1.9배면 7600이 A9에 들어갔단 소리아닌가요?550mhz로요.

  7. addr | edit/del | reply BlogIcon 정주행중에 2015.09.18 17:28

    업뎃이 되어있어서 정독 뒤 댓글남깁니다. 생각보다 6xt-)7xt 기술발전이 크군요.동일 클러스터에서 꽤 성능 차가 나네요. A10은 2배향상이 필요없으니깐 gt7600으로 퉁칠수 있겠네요.
    아무래도 gt7600 넣을수 있는데 A10을 염두해서 gx6650으로 면피하는 것같은 느낌인데 gamma님은 어떻게 보세요?

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2015.09.18 20:37 신고

      사양 선정이 그렇게 간단하게 이루지지 않습니다.
      개발에 들어가는 리소스, 일정, 비용, 요구 성능을 가늠질해서 사양이 선정됩니다.

      라이센스 비용 문제도 있고,
      (단순히 특정 아키텍처 라이센싱했다고 끝나는게 아닙니다. 코어 구성만 바뀌어도 비용 추가됩니다.)
      신규 아키텍처 선정하면 설계도 다시 해야합니다.
      기존걸 유지하면 일종의 재탕이 가능하지요. (그것도 마냥 간단한건 아니지만요.)

      성능이나 전력에서 문제가 없다면 기본적으로 기존 아키텍처 유지하는게 나은 선택입니다.