- 갤럭시S7 탑재 엑시노스8890 긱벤치3 결과 분석입니다.

 

- 사양

엑시노스8890

삼성 14LPP 공정

엑시노스 M1 r1p1 2.6GHz/2.3GHz x4 + Cortex-A53 r0p4 1.6GHz x4

LPDDR4 1866MHz 듀얼채널(32bit x2)

 

몽구스 코어(코드네임)가 대중적으로 Exynos M1으로 불리고 있기때문에 그렇게 표기한 것으로 정확한건 확인이 필요합니다.

커널에 나온 이름이라는 점, 삼성이 AP뿐만 아니라 모뎀에도 엑시노스라는 이름을 붙이는걸 봤을 때 관련 IP, 제품 이름을 엑시노스로 통일할 가능성이 있는 점을 고려한다면 엑시노스 M1 이란 이름이 공식적인 이름일 가능성이 높긴 합니다.

 

메모리 클럭은 최대 지원 클럭이기때문에 실제 제품에 적용된 클럭은 확인이 필요합니다.

통신 주파수나 내부 주파수와의 간섭때문에 실제 클럭을 약간씩 바꾸는 경우가 많습니다.

 

 

- 클럭

(http://www.androidheadlines.com/2016/02/hands-on-samsung-galaxy-s7-with-exynos-8890.html)

CPU-Z 로는 최대 2.6GHz로 표기됩니다.

아키텍처나 제품명같은건 DB가 따로 있겠지만 리비전이나 클럭은 커널을 그대로 읽어왔을 것이기때문에 최대 2.6GHz라는게 실제 설정이라는건 사실일 가능성이 높습니다.

 

여기서 하나 더 확인할 수 있는게 CPU6,7의 코어 오프가 나왔다는겁니다.

그동안 엑시노스는 기본적으로 동기식이며 개별 코어에 대한 오프 동작은 없다고 알려졌으나,

최소한 엑시노스8890부터는 코어 오프가 적용된듯 합니다.

빅코어, 리틀코어 간 클럭이 같게나와서 이걸 비동기식으로 봐야할지 모르겠네요.

 

 

(https://www.youtube.com/watch?v=IZU9U72OU5s)

여담입니다만 갤럭시S7에 히트파이프가 들어갔습니다.

 

 

- 긱벤치3 결과

 

(엑시노스 버전 : http://browser.primatelabs.com/geekbench3/5304549)

(스냅드래곤 버전 : http://browser.primatelabs.com/geekbench3/5450873)

엑시노스8890 버전 결과는 왼쪽입니다.

 

싱글코어 동클럭 점수 비교입니다.

2.6GHz 기준으로 보면 엑시노스M1의 동클럭 정수/부동소수점 점수는 Cortex-A72 수준입니다.

메모리 점수가 크게 올랐습니다.

 

싱글코어 원점수.

크게 오른 메모리 점수.

생각보다 낮은 부동소수점 점수.

스냅드래곤820 상대로 그럭저럭 비슷한 수준은 맞춘 총점.

 

멀티코어 원점수.

Cortex-A72 기반 제품과 큰 차이가 없는 점수.

 

1. 성능 +30% ?

삼성 공식 사이트에서는 엑시노스7 옥타(엑시노스7420) 대비 성능이 +30% 올랐다고 밝혔습니다.

(링크 : http://www.samsung.com/semiconductor/minisite/Exynos/w/mediacenter.html#?v=news_Samsung_Unveils_a_New_Exynos_8_Octa_Processor_based_on_advanced_14-Nanometer_FinFET_Process_Technology)

 

긱벤치가 기준이라면 총점이 기준이 될겁니다.

싱글코어 1584 -> 2220 : +40%

멀티코어 5663 -> 6658 : +18%

 

싱글코어 쪽이 더 들어맞습니다.

그럼 왜 수치가 차이가 나는가.

사이트의 수치가 최신 값이 아닐 가능성이 있습니다.

사이트에서는 전력 효율 +10%라고 했는데, 14LPP에 대한 공정 정보가 기존에 +10% 였다가 최근 +15%로 바뀌었습니다.

(링크 : 삼성, TSMC 공정 비교. (2016.01.18))

그렇다면 +10%와 묶여있는 성능 +30%도 예전 수치일 가능성이 있는거지요.

 

+30%라고 본다면 싱글코어 총점 1584 x1.3 = 2059 입니다.

현재 긱벤치3 점수를 바탕으로 계산해보면,

총점 - 메모리 점수 = 정수+부동소수점 점수 -> 2059 - 3134 x0.2 = 1432

엑시노스8890 2.6GHz 정수+부동소수점 점수 -> (2230 + 1755) x0.4 = 1594

+30% 기준에 맞춘다면 클럭은 2.6GHz의 1432/1594 = 0.9, 90% 정도인 2.3GHz 가 됩니다.

 

2. 생각보다 낮은 멀티코어 점수.

멀티코어/싱글코어 점수 비율을 보면,

 

엑시노스7420

정수 7744 / 1808 = 4.28

부동소수점 5386 / 1280 = 4.21

 

엑시노스8890

정수 8453 / 2230 = 3.79

부동소수점 6517 / 1755 = 3.71

 

쿼드코어의 멀티코어 점수치고 상당히 낮습니다.

비율로 보면 정수 3.79 / 4.28 = 0.886 , 부동소수점 3.71 / 4.21 = 0.881

빅리틀에서 리틀코어 점수 비율이 불분명하니 그대로 대입할 수는 없지만, 단순 계산하면 멀티코어 클럭은 싱글코어 클럭의 88% 수준이라는게 됩니다.

2.6GHz x0.88 = 2.29GHz

위에서 계산된 클럭과 같은건 단순한 우연같은게 아닐거 같은 기분이 듭니다.

 

3. 결국 일종의 터보부스트/터보코어?

위 내용을 종합하면 이런 가설이 가능하지요.

 

엑시노스8890은......

초기 클럭은 2.3GHz

4코어 풀로드를 고려했을 때 전력이 허용하는 한계 클럭일겁니다.

이 클럭을 기준으로 사이트의 성능 +30%라는 수치가 나옵니다.

그런데 싱글코어 점수에서 스냅드래곤820에 밀립니다.

어떻게든 비슷하게 만들어야하지요.

여기서 인텔의 터보부스트 혹은 AMD의 터보코어와 유사한 기술이 적용됩니다.

싱글 혹은 듀얼코어 로드시 발생하는 여유 전력을 추가 클럭 상승으로 돌립니다.

(듀얼코어까지 가능성을 넣은건 터보코어의 경우 코어 절반까지를 대상으로 삼았기때문입니다.)

덕분에 최종적으로 싱글 혹은 듀얼코어 로드시 클럭은 2.6GHz로 올라가고 싱글코어 총점은 스냅드래곤820과 비슷한 수준까지 올라갑니다.

 

추가적인 동작 설정의 가능성도 생각할 수 있습니다.

인텔 방식처럼 1코어와 2코어 로드 간에도 클럭 차이가 있을 수 있습니다.

GPU까지 포함하여 동작하는 개념일 수도 있습니다.

CPU 로드가 낮을 때 발생하는 여유전력을 GPU로 돌리는거지요.

GPU 클럭의 추가 상승이 가능해집니다.

 

 

- (예상이라는게 결과적으로 설레발이 됐지만) 예상에 비해 실망스럽다고 볼 수도 있는 성능입니다.

긱벤치 총점이 크게 오른건 메모리 점수의 엄청난 향상, 최대한 성능을 쥐어짜려는 셋팅의 힘입니다.

그렇기에 부스트 클럭을 사용하지 못 해 클럭차이가 거의 없는 멀티코어에서 Cortex-A72 제품과 점수차이가 크지 않습니다.

Kryo와 비교한다면, Kryo는 빅코어 2코어 구성이기때문에 빅코어 4코어 구성인 엑시노스M1에 비해 전력에 여유가 더 있고 성능이 높은게 당연하다고 볼 수도 있겠으나, Cortex-A72와의 비교는 어쩔 수가 없습니다.

첫 커스텀 코어라는걸 생각하면 이 정도라도 괜찮다고 생각할 수도 있긴한데 그래도 아쉬운건 어쩔 수 없습니다.

 

 

- 이전 결과 분석

제품 발표 전에 올라왔던 결과들을 따져보겠습니다.

부동소수점 중 Mandelbrot가 클럭에 비례해서 점수가 잘 나온다지요.

최종 점수와 이 점을 이용해서 추정클럭, 동클럭 점수를 계산/비교하면 아래와 같습니다.

클럭은 1.56GHz, 1.87GHz, 2.6GHz 정도로 추정됩니다.

 

이렇게보면 아키텍처의 동클럭점수 차이가 명확히 보입니다.

Cortex-A72와 큰 차이가 없다는 것, Kryo와의 차이.

 

 

- 찌라시 결과 계산

이런 찌라시가 있었지요.

 

2.4GHz

싱글 2136

멀티 7497

 

세이빙 모드

싱글 1698

멀티 5263

 

울트라 세이빙 모드

싱글 1323

멀티 3489

(링크 : 엑시노스8890 초기 벤치 분석 / 몽구스(Mongoose) 찌라시 분석.)

 

싱글 2294

멀티 6908

(링크 : 갤럭시S7 긱벤치3 결과 찌라시 분석)

 

싱글 2136점이 나오려면 2.46GHz 입니다.

완전 초기에 2.5GHz까지 고려됐을지도 모르겠습니다.

싱글 1698점이 나오려면 1.75GHz 입니다.

싱글 1323점은 1.14GHz

싱글 2294점은 2.74GHz

 

 

 

신고
Posted by gamma0burst Trackback 0 : Comment 35

댓글을 달아 주세요

  1. addr | edit/del | reply BlogIcon A TNT 2016.03.05 09:31 신고

    스냅드래곤 820의 전력 소모량은 http://www.anandtech.com/show/10088/xiaomi-mi5-hands-on 이수준이라고 하던데 8890 CPU 전력소모량은 어느정도로 예상하셨나요?

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2016.03.05 15:47 신고

      전력 최대치가 어느 정도냐에 따라 달라질거 같습니다.
      링크에도 있지만 엑시노스7420은 5.5W까지 나오고 스냅820은 4.8W까지 나오니 최대 가능 전력을 어느 쪽 기준으로 잡느냐에 따라 수치가 달라지겠지요.

      쉽게 생각해버리면 스냅820에 맞춘다고 보면되는데,
      그렇다면 2코어, 4코어 로드시에 엑시8890, 스냅820 둘의 전력이 비슷하다고 가정할 수 있습니다.
      그러면 엑시M1 2.6GHz 전력 = Kryo 2.15GHz 전력 이 되고,
      엑시M1 2.3GHz 전력 = Kryo 2.15GHz, 1.95GHz 전력의 평균값이 될겁니다.
      이러면 엑시M1 2.6GHz에서 2코어+언코어 전력은 3.5W 내외,
      2.3GHz에서 4코어+언코어 전력은 4.7W 내외라고 갖다 붙일 수 있지요.

      물론 앞서 언급했듯이 엑시7420 처럼 전력 한도가 더 높은 제품이 기준이 되면 전력의 절대값은 올라갈거고, A72 기반 제품처럼 더 낮은 제품이 기준이 된다면 절대값은 내려갈겁니다.
      정확한 언코어 전력이 나오지 않아서 순수 코어 전력도 현재로는 알기 어렵고요.

  2. addr | edit/del | reply 흡혈귀왕 2016.03.05 11:14 신고

    성능자체는 A72정도면 충분한데
    문제는 전력효율이겠네요......전력효율 이점이 A72대비 있다면 확실히 자체 개발한 보람이 있을테니깐요....

    차기 리비전에선 딴거 안건드리고 메모리 컨트롤러쪽을 개선하고
    클럭을 살짝만 올려도 총점이 확 올라갈수도 있겠네요......
    (솔직히 스냅820 메모리 점수 너무높음..ㄷㄷㄷ)

    그리고 GFX벤치마크보니깐 벤치내역에 스냅820버전이든
    엑시8890 버전이든 계속 테스트 로그가 있는듯한데 벤치내역을 등재안되는거보니

    현재 양쪽다 좀더 최적화를 하고있는듯합니다.
    그 하고많은 스냅드래곤820 기기들조차 제대로 올라온게 샤오미미5정도이니...ㄷㄷㄷ
    삼성쪽에서 아직 올리지말라고 요청했을수도 있겠군요.....
    (삼성은 벤치가 유출되면 항상 금방 삭제처리가 됬으니...)

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2016.03.05 16:08 신고

      아난드텍 전력자료보면 A72 전력이 상당히 낮게 나오는데 (아무래도 메모리 점수가 낮은 것도 연관이 있겠지요.)
      메모리 점수를 포함한다면 모를까, 뺀다면 전성비에서 딱히 앞선다고 보기도 힘들듯 합니다.
      (스냅820과 전력을 비슷하게 맞췄다는 가정하에서 입니다.)

      GFX벤치는 어디까지 할 수 있을지 솔직히 예상이 안 됩니다.
      설레발이라고 치부할 수도 있지만 몽구스도 결국 실망으로 끝난 꼴이 됐으니까요.

  3. addr | edit/del | reply 폰충 2016.03.05 13:33 신고

    여쭤볼것이있습니다
    메모리 점수가 높아지면 어떤면에서 좋아지죠 ?

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2016.03.05 15:53 신고

      멀티미디어 기능이 강화되면서(4K라든지..) 메모리 대역폭이 성능에 끼치는 영향이 커지고 있긴 합니다.
      GPU 성능 향상에도 어느 정도 영향이 있고요.
      물론 메모리 점수가 2배 늘었다고 다른 성능이 그대로 2배씩 올라가고 이런건 아닙니다.
      수~10수% 정도 올라가는 식이지요.

      어쨌든 이런 경향때문에 메모리 관련 블록의 소비전력 비중도 커지는 추세입니다.
      (DRAM의 전력뿐 아니라 AP 내의 인터페이스, 파워도메인 등 관련 블록까지 모두 포함한 전력 얘기입니다.)

  4. addr | edit/del | reply BlogIcon ㅁㅁㄴㄹ 2016.03.05 16:10 신고

    gpu는 말리라서 애초에 큰 기대를 안했는데 cpu도 이모양이니 원...

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2016.03.05 16:17 신고

      이 모양이라고 하기에 점수가 많이 높지요?

    • addr | edit/del BlogIcon A TNT 2016.03.05 18:00 신고

      정수나 메모리점수같은 상세점수 무시하고 그냥 단순연산으로 A9의 싱글, 멀티가 각각 100, 100이면 스냅 820은 93, 125이고 8890은 86, 148정도라고 보면 되는데 이정도 성능이 어딜봐서 낮은성능인지...

  5. addr | edit/del | reply 흡혈귀왕 2016.03.05 19:17 신고

    워낙 기대도 높아서 실망스러운 거지 사실 전혀 낮은 결과라곤 생각하지 않습니다.
    어쨌거나 현존 AP중 싱글, 멀티 종합 최고인건 변함 없다고 보거든요...


    근데 딱 지금이 과거 엑시노스5420과 스냅드래곤800의 비교네요...

    1.9GHz ARMv7 Cortex-A15와
    2.3GHz ARMv7 Krai400의

    성능이 비슷비슷(어찌보면 A15가 좀더 높았지만)했던것과
    이번 엑시노스8890과 스냅드래곤820의

    2.6GHz ARMv8 Exynos-M1과
    2.2GHz ARMv8 Kryo도

    비슷하네요...둘다 0.4GHz 클럭인것도 그렇고......

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2016.03.06 23:35 신고

      결국 고클럭과 높은 클럭당성능을 모두 취하는건 불가능하다는게 다시 한 번 확인된거라고 봅니다.
      둘 중 하나를 선택해야되는거.

  6. addr | edit/del | reply 액티브s 2016.03.06 14:01 신고

    근데 스냅 820보다 앞선게 순전히 리틀코어 빨이 되버렸네요....
    근데 CPU 클럭에 따른 점수 변화를 계산할때 메모리점수는 아예 변화되지 않는다고 가정하시던데
    메모리도 싱글/멀티점수 차이가 있는걸 보면 CPU 클럭에 따라서도 아주 조금은 변할텐데요....

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2016.03.06 23:33 신고

      - 누가 스냅820에 리틀코어 넣지 말라고 했는가?
      헬리오X20 처럼 A53 떡칠하면 될걸 왜 안 했답니까.
      애초에 싱글/멀티 점수, 엑시노스8890 싱글/멀티 클럭차이, 스냅820 빅/리틀 코어 클럭차이 고려해서 빅코어 아키텍처만 있을 경우로 계산하면,
      멀티코어 정수+부동소수점 점수가 엑시노스는 14100 나와야하는데 14970 나오고,
      스냅820은 14633 나와야되는데 12050 나왔네요.
      이건 리틀코어 점수 보태기 이전에 스냅이 제 점수도 못 낸겁니다.

      - 멀티코어 점수 계산할 때 멀티코어 메모리 점수 적용한겁니다.
      설마 멀티코어, 싱글코어 메모리 점수가 다른게 메모리 클럭이 달라서 그런거라 생각하나요.

    • addr | edit/del BlogIcon world 2016.03.06 23:36 신고

      그렇게 치자면 820도 멤컨빨이죠 ㅋ

  7. addr | edit/del | reply BlogIcon ㅇㅇ 2016.03.06 23:50 신고

    엑시노스 m1 보다 a72 코어를 쓰는게 더 좋은 선택일수도 있었네요

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2016.03.07 00:08 신고

      A72 썼으면 저 메모리 점수를 못 얻었겠지요.
      정말 끝까지 SoC 장사할거라면 중간에 말아먹는 한이 있더라도 자체 IP는 밀어붙어야된다는게 제 생각입니다.

  8. addr | edit/del | reply 2016.03.07 13:31

    비밀댓글입니다

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2016.03.08 22:11 신고

      메모리 점수가 엄청 높아진걸 놓고 그런 얘기가 나오나 보네요.
      그렇다고 보기에 유의미한 점수 차이가 있어서 진짜일지는 모르겠네요.

  9. addr | edit/del | reply 감수심 2016.03.07 20:16 신고

    이렇게 2016 AP대전이 일단 막을 내리는 건가요?
    처음엔 여유가 있는 듯 하다가 중간엔 손에 땀을 쥐게 할 정도로 흥미진진했는데 마지막은 왠지 조금 아쉽군요.

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2016.03.08 22:13 신고

      이제 1차전 끝난거지요.
      최소 한번, 잘하면 두번 더 있을겁니다.

      이런게 원래 정보가 부족할 때는 흥미진진하다가 나올거 나와버리면 무감각해지는거 같습니다.
      신제품 발표에서 예전같은 흥분이나 충격이 없는거랑 비슷한 느낌인듯.

  10. addr | edit/del | reply BlogIcon 우주소년 2016.03.10 03:04 신고

    결과는 좀 아쉽지만 이 정도면 선방한 것 같네요. 자체설계는 거의 처음으로 나오는 것 같은데 그래도 엄청 뒤지지는 않으니. 근데 보통 자체설계의 경우엔 하나의 아키텍처로 2-3년 이상을 가지고 가던데, 거기서 버틸 수 있을까요. 820이 GPU, AP에서 꽤나 잘 나온지라..

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2016.03.10 20:47 신고

      추세로 봤을 때는 2년 이상 가기는 힘들겁니다.
      그 전에 다른게 또 나오겠지요.

  11. addr | edit/del | reply 흡혈귀왕 2016.03.10 18:53 신고

    3DMark쪽은 어느정도 올라왔는데

    슬링샷으로 가면 일방적으로 발릴정도로 성능이 안나오더군요 엑시노스8890 모델이..

    하.지.만!

    정작 아이스스톰 언리미티드로 가면 둘이 동급이고
    그래픽 스코어나
    그래픽테스트1,2쪽
    결과만 봐도 오히려 8890쪽이 별의미없는 오차범위로 살짝 더 나오는데

    이렇게보면 전혀 쉐이더 성능이 후달리는건 아닌데
    GFX벤치마크도 그렇고 유독 OpenGL ES3.x쪽에서 힘들어하네요...

    뭔가 과거 엑시노스5420이 생각나는 부분입니다.
    Vulkan때 퍼포먼스 체인지로그가 들어가있다면 개선도 될만해보이는데
    어떨지 모르겠네요

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2016.03.10 21:32 신고

      3dmark까지 그러면 opengl3.0 이상에서 상대적으로 떨어지는게 맞긴 하네요.
      GFX벤치 기존 결과로 성능 격차보면 티렉스보다 맨해튼 이상에서 훨씬 차이가 크거든요.
      3dmark가 어차피 쉐이더 성능 몰빵 성향의 벤치이니 아이스스톰만 갖고 쉐이더 성능 부족을 얘기하기는 힘들거 같고요.

      이래저래 다 따져도 사실 T860에 비해 성능 너무 안 나오고는건 맞습니다.
      실제 한계가 어떻고 효율이 어떻고 얘기해봤자, MP16까지 확장되는걸 얘기해놓고 고사양으로 갈수록 효율이 떨어진다는게 변명이 될 수는 없으니까요.
      드라이버 버프든 뭐든 성능 개선이 필요한 상황.

  12. addr | edit/del | reply 흡혈귀왕 2016.03.10 23:41 신고

    http://www.seeko.co.kr/zboard4/zboard.php?id=freeboard&page=1&sn1=&divpage=2&sn=off&ss=on&sc=off&select_arrange=headnum&desc=asc&no=807595

    감마님 갤럭시S7 엣지 수령후 GFX벤치마크
    돌려봤습니다.

    카체이스 = 15fps
    맨하탄3.1 = 29fps
    맨하탄 = 41fps
    T렉스 = 87fps


    연속으로 돌렸는데
    생각보다 그냥저냥 나오네요...
    맨하탄쪽이 여전히 납득이 잘안되지만

    Vulkan 드라이버에 퍼포먼스 향상 체인지 로그가 있다치고
    업뎃되면서 650MHz클럭에서 700MHz으로 오르면 여차저차
    820과 맞을듯하네요

  13. addr | edit/del | reply BlogIcon 흡혈귀왕 2016.03.11 20:43 신고

    최종 결과 올라왔네요

    엑시노스8890
    카체이스 = 15.5fps
    맨하탄3.1 = 29.2fps
    맨하탄 = 41.1fps
    T렉스 = 88.9fps


    스냅드래곤820
    카체이스 = 18.3fps
    맨하탄3.1 = 32.1fps
    맨하탄 = 49fps
    T렉스 = 92.9fps


    나머진 다 납득가는데
    맨하탄 효율이 무지안나오네요....

    뭐가 문제가 있긴있네요..

    그외 부분은
    딱 더도말고 엑시노스5433과 스냅드래곤805 정도
    차이네요....

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2016.03.11 21:46 신고

      맨해튼만 좀 더 나와주면 나올만큼 나오겠네요.
      이미 650MHz로 나온 상황에서 700MHz는 힘들지 않을까 싶고요.
      말 그대로 초기 결과이니 최종 결과는 좀 더 지켜봐야할듯.

  14. addr | edit/del | reply BlogIcon 흡혈귀왕 2016.03.11 21:48 신고

    감마님 원래 효율대로
    카체이스, 맨하탄3.1, 맨하탄이

    제대로 나온다면 몇프레임 정도될까요?
    650MHz 에서 T렉스 88.9fps라 쳤을때...

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2016.03.11 22:15 신고

      650MHz가 최대클럭이라보면 티렉스는 600MHz 이하로 클럭이 잡힐겁니다.
      그렇게보고 600MHz, 88.9 fps면 기린950 대비 효율이 5% 정도 낮습니다.
      멀티코어화에 따른 효율저하라고 감안할 수 있는 수준이지요.

      맨해튼 이상을 650MHz 결과로 본다면 맨해튼3.1을 제외하고는 썩 높다고 보기 힘듭니다.
      기린950과 사양대비성능을 비교해봐도 카체이스는 동급, 맨해튼3.1은 +16%, 맨해튼은 -7% 입니다.

      여기서부터는 추측입니다만 기존과는 다른 식의 셋팅이 가해졌을 가능성이 있어보입니다.
      GPU 클럭 변화의 기준이 예전에는 맨해튼이었지만 이번에는 맨해튼3.1 일 수 있는거지요.
      맨해튼 결과를 600MHz로 결과로 보면 기린950과 오차범위에서 동급의 효율을 보입니다.
      맨해튼3.1, 카체이스의 높은 효율은 r9p0 드라이버의 영향이라고 생각할 수 있고요. (화웨이 메이트8은 r7p0)

      이런 식의 가정이면 티렉스 클럭이 600MHz 일거라는 생각도 틀린 것일 수 있습니다.
      맨해튼보다 더 낮은 550MHz 결과로 본다면 T860 대비 7% 정도 높은 결과가 되어서 T880 치고 납득할만한 성능 향상이라고 볼 수 있게되지요.

  15. addr | edit/del | reply 흡혈귀왕 2016.03.11 22:47 신고

    자세한건 갤럭시S7 시리즈의 펌웨어가 올라온뒤
    DVFS 테이블을 봐야지 알수 있겠군요...

    답변감사합니다. 굉장히 미묘하게 나온듯합니다.
    애플 A9보다는 유의미한 차이로 살짝 높고
    스냅드래곤820보단 떨어지고...


    어찌됬던 현재 OpenGL ES3.0 기반에서 맥아리를 못추고있는듯해서요...

    아이스스톰이나 T렉스에선 충분히 스냅드래곤820에 비빌만큼인데


    현재 후달린답시고 나온 GPU벤치들보면 죄다 OpenGL ES3.x기반이거든요~
    안투투6.0도 6.0부터 OpenGL ES3.x로 바뀌었고
    3DMark에서 슬링샷도 OpenGL ES3.x
    GFX벤치마크에서도 떨어지는 맨하탄도 OpenGL ES3.x


    엑시노스5420 사례가있으니
    개선 여지는 충분히 있어보이긴합니다...


    엑시노스5420땐 지금보다 더 심각하게 차이났었죠ㅎㅎㅎㅎ

    당시 5420 초창기

    맨하탄=5.2fps
    T렉스=23fps

    나왔다가

    롤리팝에서 r4p0 드라이버 업뎃후

    맨하탄=10.8fps
    T렉스=25.8fps
    로 향상됬죠ㅋㅋ

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2016.03.13 20:35 신고

      vulkan 효과라고 해도 많아야 10% 정도이지 않을까요.
      롤리팝때처럼 최악의 발적화 시절도 아니고요.

  16. addr | edit/del | reply 흡혈귀왕 2016.03.11 23:01 신고

    아~ 감마님 다른건 아니고
    제 갤럭시S7 엣지로 돌린 OpenCL-Z에서 연산 퍼포먼스 결과인데
    이게 지표가 될순없지만 나중에 분석해주실때 연산성능쪽 참고되시게 투척해드립니다~

    ========================================

    650MHz ARM Mali-T880MP12
    OpenCL1.2 FULL_FROFILE_r9p0

    <GPU Arithmetic Logic Unit>
    single-precision float = 23.16GFLOPs
    single-precision float vec4 = 170.02GFLOPs
    32-bit int scalar = 33.02GFLOPs
    32-bit int vec4 = 170.03GFLOPs
    24-bit int scalar = 33.55GFLOPs
    24-bit int vec4 = 170.06GFLOPs

    <Memory Copy Operation>
    Host to Device = 4.29GB/s
    Device to Host = 4.08GB/s
    Device to Device = 9.38GB/s

    ========================================

    정도로 나오네요...
    성능만큼 나오는걸까요?

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2016.03.13 20:33 신고

      1ALU 유닛이 이론적으로는 17 flops/cycle인데, 이 중에 vec4만 따지면 8 flops/cycle 이거든요.
      스칼라면 모으면 2 flops/cycle 이고요.
      이걸로 MP12 650MHz 32bit 기준 연산성능 계산하면,
      vec4 : 8 x 12 x 3 x 0.65 = 187.2 GFLOPS
      scalar : 2 x 12 x 3 x0.65 = 46.8 GFLOPS
      결과와 차이가 있으니 테스트 클럭이 좀 낮다고 보고 역산하면,
      170.06 / 187.2 = 90.8% -> 590MHz
      33.02 / 46.8 = 70.5% -> 458MHz

      vec4는 600MHz 정도로 보면 어느 정도 맞는거 같고, 스칼라가 잘 안 맞네요.
      single-precision float = 23.16GFLOPs 이건 스칼라 결과같은데 이론치의 딱 절반이 나왔고요.

  17. addr | edit/del | reply 흡혈귀왕 2016.03.13 19:20 신고

    https://browser.primatelabs.com/geekbench3/5627081

    결국 멀티 7000점 넘겼네요ㅋㅋㅋ
    실내에서 정상적인 측정은 아닌듯하지만
    풀빠워는 찌라시대로 나온듯합니다.

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2016.03.13 20:38 신고

      GS7 커널 올라왔습니다.
      이것저것 볼만한게 있긴한데 예전만큼 많지는 않네요.