- 캐나다판 갤럭시S7 결과로 추정되는 긱벤치3 결과가 올라왔습니다.

(링크 : http://browser.primatelabs.com/geekbench3/4968211)

엑시노스8890 결과가 있어서 참고가 될거 같은데......

사실 이전 엑시노스8890 결과와 차이가 있는데 해석하기 애매해 추가 결과가 나올 때까지 기다릴까 했는데,

이것저것 해본게 아까워서 그냥 올립니다.

 

- 시스템 정보

 

SM-G930W8 : 뒤에 W8이 붙은건 캐나다판 제품으로 알려져있고 SM-G930 이라고하면 갤럭시S7 으로 보는게 맞을듯.

universal8890 : 엑시노스8890

8코어 1.59GHz

프로세서 ID로 보아 리비전은 r1p1 입니다. 이전 결과는 r0p0

램 4GB

 

- 점수

총점입니다.

이전보다 올랐지요.

특히 부동소수점, 메모리 점수.

 

 

- 분석1 : 아키텍처

시스테 정보에 나온대로 이전걸 1.4GHz, 이번걸 1.6GHz 결과로 보고 클럭당점수를 비교하면 이렇게 나옵니다.

메모리 점수는 CPU 클럭과 직접 연관은 없는 편이니 점수가 올라간건 확실할겁니다.

부동소수점 점수가 올라간건 긍정적인 방향이니 문제가 없다고 쳐도, 문제는 정수 점수.

이전보다 오히려 점수가 떨어졌습니다.

기존이든 이번이든 클럭 가정에 문제가 있다고 봐야할듯 합니다.

리틀코어 클럭이 표기되는 시스템 정보 클럭을 기준으로 계산한거부터가 이미 무리가 있는 가정이었습니다만, 당시에는 별 다른 방법이 없기도 했습니다.

 

기린950 (Cortex-A72 r0p0) 기준으로 세부항목 점수 비율을 비교해보면,

몽구스 r0p0/r1p1 은 기본적으로 비슷한 경향입니다.

정수에서 AES가 낮은 것 외에 거의 클럭차이만 있는듯 하고, 부동소수점은 클럭당점수가 크게 오른 것 외에 비슷한 경향입니다.

Kryo나 Cortex-A72 와는 차이가 있어서 같은 아키텍처로 보기 힘듭니다.

시스템 정보가 조작되거나 하지는 않은듯 합니다.

 

 

- 분석2 : 클럭

아키텍처는 어느 정도 확인됐다해도 문제는 클럭.

점수를 보면

몽구스 r0p0 : 정수+부동소수점 2700 , 메모리 점수 1846

몽구스 r1p1 : 정수+부동소수점 3287 , 메모리 점수 2792

 

r1p1 결과의 시스템 정보를 보면 빅코어 클럭은 1.6GHz 이상인게 확실하고, 클럭당 정수점수가 117%에서 더 올라갈 가능성은 없습니다.

이전 결과가 1.4GHz 결과가 아니라는건 거의 확실해진듯 합니다.

r0p0 정수 결과를 117%로 맞추면 클럭은 1.56GHz 정도로 계산되는데, 빅코어 1.6GHz + 리틀코어 1.4GHz 라는 애매한 클럭설정이 됩니다.

클럭이 더 높을거라고 봐야합니다.

그만큼 클럭당점수는 더 떨어질거고요.

정수 결과를 100%로 맞추면 1.84GHz로 계산됩니다.

이전 결과도 정수 100%로 맞추면 1.83GHz로 계산됩니다.

 

찌라시 점수를 보면 싱글코어 총점이 2200~2300점으로 나옵니다.

2200점으로 보고 메모리 점수 2792 를 빼면 정수+부동소수점 점수는 4104

r1p1 벤치의 테스트 클럭의 4104 / 3287 = 1.25배.

앞서 계산한 1.84GHz를 대입하면 1.84 x 1.25 = 2.30GHz가 나옵니다.

찌라시 내용하고 맞는 클럭인거 같기도 하고, 적당한 클럭으로 나오네요.

 

찌라시 점수가 2.5GHz 결과라고 가정하고 계산해보면 이번 결과는 2.0GHz 결과로 나옵니다.

 

1.85GHz 가정시 동클럭 성능.

 

2.0GHz 가정시 동클럭 성능.

 

 

- 멀티코어 점수

CPU 클럭에 비례하지 않는 메모리 점수를 빼고 정수+부동소수점 점수를 보면,

정수

r0p0 : 싱글 1569 멀티 6708 -> 멀티/싱글 비 4.28

r1p1 : 싱글 1592 멀티 7277 -> 멀티/싱글 비 4.57

부동소수점

r0p0 : 싱글 1131 멀티 4878 -> 멀티/싱글 비 4.31

r1p1 : 싱글 1695 멀티 6019 -> 멀티/싱글 비 3.55

 

엑시노스8890 긱벤치3 결과라고 인터넷에 돌았던 싱글 2294 멀티 6908 이란 점수에서 이번에 나온 메모리 점수를 빼서 정수+부동소수점를 계산하고, 멀티/싱글 점수 비를 계산해보면 15700 / 4339 = 3.62 로 위에서 계산한 부동소수점 점수비와 비슷한 수준입니다.

 

모 님의 제보대로 클럭에 비례해서 점수가 나와준다는 Mandelbrot 항목 점수를 보면,

r0p0 : 싱글 1514 멀티 7236 -> 멀티/싱글 비 4.78

(링크 : http://browser.primatelabs.com/geekbench3/3396273)

r1p1 : 싱글 2118 멀티 8669 -> 멀티/싱글 비 4.09

 

r1p1으로 오면서 멀티/싱글 점수비가 떨어지는데, 이것만 보면 r0p0 테스트할 때는 싱글, 멀티 코어 동작시 클럭이 같다가 최근에 들어오면서 싱글코어 동작시 클럭이 멀티코어 동작 때보다 높다고 해석할 수도 있습니다. (딱히 r0p0에서 없다가 r1p1에서 적용된 기능이라기보다는 클럭 셋팅 변경 시점과 리비전 시점이 맞아서 그렇게 보이는 것 같네요.)

 

정말 단순하게 계산해서 Mandelbrot 항목에서 나온 4.78 , 4.09 값을 그대로 쓰면 멀티코어 클럭은 싱글코어 클럭의 4.09 / 4.78 = 0.86, 86% 수준이고,

총점에서 나온 값을 쓰면 정수 기준 4.28 / 4.57 = 0.93, 93%, 부동소수점 기준 3.55 / 4.31 = 0.82, 82% 수준입니다.

찌라시 점수 기준의 3.62 를 쓰면 3.62 / 4.31 = 0.84, 84% 입니다.

 

찌라시 점수 근거로 계산했던 싱글코어 클럭 2.0GHz, 2.3GHz에 대입해보면,

싱글 2.0GHz, 멀티 1.6~1.9GHz, 그나마 신뢰도가 높다고 생각되는 Mandelbrot 수치 기준으로 보면 1.7GHz

싱글 2.3GHz, 멀티 1.9~2.1GHz, Mandelbrot 수치 기준 2.0GHz

 

하지만 멀티코어 점수라는게 리틀코어 영향으로 점수 변동이 큰 항목이라 단정짓기는 좀 힘들어보입니다.

그냥 가능성이 있다 정도로 봐야할듯.

 

 

- 몽구스 vs Kryo

클럭당점수를 A57과 비교하면 정수는 동급이거나 낮은 수준이고 부동소수점, 메모리 점수만 올랐다는게 되고, kryo보다 전반적으로 낮다는게 됩니다.

 

은연 중에 너무 당연하게 동클럭 성능에서 몽구스가 Kryo보다 높다고 생각했는데 이번 결과를 보면 오히려 반대입니다.

동클럭 성능에서 몽구스가 오히려 낮게 나오고, 정수보다 부동소수점 성능 향상이 크다는 점에서 성능향상 방향도 비슷합니다.

빅코어 기준으로 보면 스냅드래곤820은 듀얼코어이고 엑시노스8890은 쿼드코어이니

쿼드코어인 몽구스쪽의 단일코어 소비전력이 더 낮을 것이고, 그에 따라 성능도 낮을 것이라고 생각하는게 일반적인 해석일텐데 그 부분을 생각을 못 했습니다.

 

부동소수점 성능 향상에 집중하는건 아키텍처들의 공통적인 방향으로 보이는데, 데스크탑에서 일반적으로 사람들이 알고 있는 CPU 성능 우위라는게 부동소수점 성능 우위와 어느 정도 일치한다는 분석도 있는지라 같은 식의 성능 향상 흐름일 수도 있을듯 합니다.

 

 

- 제품 출시 후 최종 결과가 지금과 다르다면 엎어질 내용.

 

 

 

신고
Posted by gamma0burst Trackback 0 : Comment 34

댓글을 달아 주세요

  1. addr | edit/del | reply BlogIcon A TNT 2016.01.24 08:51 신고

    저 분석대로라면 정수연산 IPC 상승폭이 +0%라는건데... 흠... 그냥 A9처럼 결과가 나오면 알겠네요

  2. addr | edit/del | reply 흡혈귀왕 2016.01.24 14:20 신고

    뭔가 삼성과 퀄콤 추구하는 방향이 반대가 된듯하네요~

    예전
    엑시노스5 옥타(5420) VS 스냅드래곤800 당시만해도
    Cortex-A15의 경우 적당한 클럭에 고성능이었지만 소비전력이 높았고
    크레이트의 경우 고클럭이지만 클럭당 성능은 A15대비 떨어지고 소비전력이 좀 여유가 있는

    이런 구도였는데


    이번 몽구스와 Kryo의 경우 반대가된듯하네요~

    • addr | edit/del BlogIcon A TNT 2016.01.24 14:57 신고

      꼭 그런건 아닌게, 5430에 들어간 A15 보면 코어당 소비전력이 0.75W 수준이었을겁니다.

    • addr | edit/del BlogIcon A TNT 2016.01.24 15:00 신고

      그런데 좀 궁금한게 http://www.anandtech.com/show/8718/the-samsung-galaxy-note-4-exynos-review/6 여기서 보면 5430의 빅코어 1.8ghz 클럭때의 소비전력이 750mW라는데 http://images.anandtech.com/doci/8718/Power_model20nm.png 여길보면 1.8ghz일때 5430(20nm)의 Cortex A15가 1069mW를 소모하는걸로 나와있네요. 차이가 뭔지 궁금합니다

    • addr | edit/del 흡혈귀왕 2016.01.24 15:50 신고

      5430은 r3p3로 리비전됬고
      공정도 28nm가 아니라 20nm 라서 나름 A15에
      있던 문제가 해소됬죠

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2016.01.24 21:10 신고

      750mW 나온건 4스레드 측정치를 4코어 나눈 값이고, 1069mW 나온건 커널 정보같은걸로 계산한 값인거 같습니다.
      1코어 전력 측정하는게 그나마 가장 정확한 방법일겁니다.
      4코어 돌린 상태에서 측정하면 모든 코어가 피크 전력상태가 아닐게 뻔하거든요.

    • addr | edit/del BlogIcon 흐음 2016.01.24 22:11 신고

      감마님의 말씀도 일리가 있지만 어차피 피크치가 단 1초라도 나오면 피크치 값이 이정도다 구하는 것은 어렵지 않기 때문에;;
      실제로 노트5의 빅클러스트 풀로드가 3분이 넘어가도 다운클럭이 되지 않기 때문에 피크치 나누기 4를 해도 괜찮을 것 같습니다
      1코어 측정이 가장 정확하겠지만요

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2016.01.24 23:51 신고

      아난드텍 측정치가 피크치냐는게 문제지요.
      평균치일 가능성이 높을테니까요.

      S6 긱벤치 써멀 테스트 결과보면 3분정도 버티다가 클럭 떨어집니다.
      2코어 로드입니다.
      2코어에서도 이런데 4코어에서 피크 전력을 길게 유지할 수 있을지 의문입니다.
      노트5에서 TDP 증가나 방열 구조가 개선됐을 가능성도 있으니 S6보다 어질 수도 있겠습니다만, 어차피 14nm 공정인지라 이 결과로 20nm인 5433 추세를 추측하는건 무리가 있지 않을까요.

    • addr | edit/del BlogIcon A TNT 2016.01.25 00:27 신고

      흠... 보통 아난드텍에서 1코어당 전력소모 계산할때 쓰는 방식은 (4코어 로드 - 단일코어 로드)/3 인걸로 알고 있습니다

    • addr | edit/del BlogIcon 흐음 2016.01.25 01:07 신고

      피크치일거냐가 문제인 거는 이미
      벤츠에서 다 나오지 않나요?http://anandtech.com/show/9878/the-huawei-mate-8-review/5 에 보시면 클럭부터 시간까지 다 나오던데요

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2016.01.25 03:28 신고

      A TNT//
      아난드텍에서 그 방법으로 하는거 맞네요.
      언코어 전력빼려는거 같은데 방법상 문제가 있는게 사실이지요.
      그렇게 따지면 (3코어-1코어)/2 나 2코어-1코어도 비슷한 결과가 나와야하는데,
      같은 링크에서 같은 자료로 해보면 5430이 3코어 기준 0.8W, 2코어 기준 0.9W 입니다.
      0.75W랑 비교하면 20% 차이인데 가동 코어수가 늘어나면 전력이 축소돼보인다고 볼 수 있는 수준입니다.
      (5433은 그래도 1.48 , 1.47 , 1.38 / 1.7 , 1.7 , 1.63 으로 비슷하게 나오네요.)
      7420은 코어수 늘어나도 전력 증가가 비슷하게 나오고, 기린950은 차이가 좀 있는거봐서는 공정대비 사양이나 클럭이 높으면 전력이 증가가 오락가락하는듯.
      http://anandtech.com/show/9878/the-huawei-mate-8-review/3

      흐음//
      그래픽 카드 사례에서도 볼 수 있듯이 전력에 연관되는게 클럭뿐만 아니라 로드(몇% 인가 이런거.)도 영향이 있어서,
      클럭이 전력을 모두 대변하지는 않습니다.
      클럭이 유지된다고 그게 풀로드 전력이라고 단정할 순 없습니다.
      링크봐서는 노트5도 2코어 로드에서 3분정도 밖에 못 버티네요.
      1.7GHz 밑으로 안 떨어져서 S6보다 낫긴 하지만요.

      그렇다해도 아난드텍 측정치가 완전히 틀렸다는건 아닙니다.
      참고치로 충분히 의미가 있지요.
      어째됐든 직접 측정치니까요.
      처음 질문으로 돌아와서 보면 750mW는 측정치 근거고, 1069mW는 커널값 근거 계산치같은데 커널쪽 입력값은 전압같은걸 여유있게 줬을 가능성이 있고, CPU 코어에 들어가는 전압값이 아니라 전력공급단에 들어가는 전압값이 표기되는걸지도 모르겠습니다.
      어느 쪽이든 실제 CPU가 사용하는 전력량보다 크게 나왔을겁니다.
      (SW 개발은 안 해봐서 몰라요.)

    • addr | edit/del BlogIcon 흐음 2016.01.25 14:02 신고

      메이트8이 2코어를 시작으로 3,4코어도 테스트 되어 있는거 보니 다른 모델들도 4코어로 다 테스트 된 것 같습니다.
      감마님이 말씀하신 로드율은 알길이 없지만요 ㅎ

    • addr | edit/del BlogIcon 액티브s 2016.01.25 18:24 신고

      제가 기린 950 1코어당 전력소모 0.8W라 한것도 (4코어-1코어)/3으로 계산한건데....
      뭐 언코어 전력 빼는것까지 생각하면 2코어-1코어가 그나마 정확하겠네요.

  3. addr | edit/del | reply BlogIcon ㅁㄷㄱ 2016.01.25 12:18 신고

    전력소모가 관건인데 뒤엎어질 내용이아니라면 오히려 a72쓰는게 나았을수도있겠네요

  4. addr | edit/del | reply 2016.01.25 17:54

    비밀댓글입니다

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2016.01.25 23:57 신고

      그렇게해버리면 최종 출시 클럭이 낮아지는 모양새가 될텐데 어떻게 하려는건지 모르겠네요.

    • addr | edit/del 2016.01.26 02:28

      비밀댓글입니다

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2016.01.26 02:56 신고

      너무 높게되니까 이상한거지요.
      점수가 바뀔 가능성이 낮다고 보면 이렇게 흘러가지요.
      시스템 정보 기준 점수다. -> 클럭당점수가 높아진다. -> 클럭이 낮다.

  5. addr | edit/del | reply 2016.01.26 10:19

    비밀댓글입니다

  6. addr | edit/del | reply 액티브s 2016.01.27 17:09 신고

    그런데 저 결과 정수 멀티 효율에 비해 부동소숫점 효율이 너무 낮은데
    부동소숫점 쓰로틀링으로 해석하는게 나은것 같은데....

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2016.01.27 23:12 신고

      1. 결과 달랑 하나.
      2. 기존 빅리틀 아키텍처 구성에서 HMP에서 리틀코어의 점수 반영 비율에 대한 일관된 데이터나 분석된 패턴 전무.
      3. 하물며 몽구스-리틀코어 구성에서의 멀티코어 점수 구성에 대한 데이터는 더더욱 없음.
      -> 저 결과 하나로 쓰로틀링 결론내는게 더 무리입니다.

  7. addr | edit/del | reply 액티브s 2016.01.28 15:40 신고

    근데 어쩌면 저건 1.6Ghz 결과고 싱글점수 A9급으로 나올 가능성도....
    뭐 희망사항이겠죠??

  8. addr | edit/del | reply BlogIcon 유이링고 2016.01.29 23:32 신고

    감마님 항상 궁금한게 있었는데
    AP에 들어있는 그래픽코어의 vram할당은 ram에서 가져와서 사용하는건가요???
    그리고 같은 ap를 사용하고 해상도만 다른 기기의 전체 램 용량이 다르다면 그래픽코어쪽으로 할당되어있는지요 안드로이드os에서의 vram이 어떻게 할당되고 사용되는지 간단하게 좀 알려주세요~

    • addr | edit/del BlogIcon 유이링고 2016.01.29 23:37 신고

      엑시노스5433 엑시노스7420의 그래픽성능차이가 mp코어나 클럭대비 좀더 있는것으로 아는데 이경우 그래픽에 할당된ram이 ddr3와 ddr4의 차이에서 나온다고 볼 수는 없는지요

    • addr | edit/del BlogIcon 유이링고 2016.01.29 23:42 신고

      인텔 베이트레일의 경우도 같은 ap에 램의 듀얼체널 그리고 메모리클럭에따라 성능차이가 있으니 같은경우가 아닌지요~
      대표적으로 z3740 z3740d z3740f의 차이가 램에서 비롯되니... 이 부분에서도 궁금합니다

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2016.01.30 01:38 신고

      - 내장 그래픽쓰는 데스크탑 생각하면 됩니다. GPU는 전체 메모리 중 일부를 할당받고 할당용량은 설정따라 갑니다.

      - 당연히 메모리 대역폭이 높으면 성능 향상의 여지가 있으나, 대게 수% 수준의 차이가 있는 정도입니다.
      MP수가 늘어날 때의 scaling 효율 저하나 고클럭에서의 쓰로틀링같은 성능 저하 변수를 생각하면 메모리 대역폭 부족에 의한 성능 감소는 거의 무시할 수 있는 수준입니다.

      - 베이트레일에서 일부 제품이 싱글채널에 그친건 너무 메모리 대역폭을 깎아 먹은겁니다.
      플래그쉽-하이엔드 ARM 기반 AP는 거의 다 듀얼채널을 기본으로 깔고 갑니다.

  9. addr | edit/del | reply 액티브s 2016.01.30 17:23 신고

    http://browser.primatelabs.com/geekbench3/search?q=ARM+UNIVERSAL8890
    에 보면 1월 28일자 결과가 몇개 더 올라왔는데
    클럭은 똑같이 1.6인데 전반적으로 점수가 내려가고
    r0p0결과대비 총점은 비슷한데 정수가 올라가고 메모리가 내려간 결과가 나왔네요.
    이건 어찌 해석해야될지.....

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2016.01.31 00:30 신고

      메모리 점수가 좀 낮은데 메모리 점수가 이상하다면 그냥 참고만 하면 됩니다.
      쓰로틀링이 걸려도 왠만하면 안 떨어지는게 메모리 점수이니.

    • addr | edit/del BlogIcon 액티브s 2016.01.31 09:33 신고

      아 정정 r0p0대비 정수하락 메모리 상ㅅ.ㅇ

  10. addr | edit/del | reply BlogIcon A TNT 2016.02.04 20:46 신고

    예전과는 달리 A9 뺨칠정도로 벤치마크 결과가 안나오고 삼전이 뜸들이는거 같은데 CPU는 2000/7000에 맨해튼 45fps 이상만 나오면 좋겠습니다

  11. addr | edit/del | reply Qwer 2016.02.06 12:38 신고

    820은 싱글 2200대던데 멀티점수가 5300

    8890은 1800인데 6000에 근접하네요

    효율이 굉장히 좋은건지...다른조치를 한건지...



티스토리 툴바