- 하이실리콘 기린970 성능을 통한 Mali-G72 성능 분석입니다.

기린970 GPU 사양은 Mali-G72MP12로 클럭은 746MHz로 알려져 있습니다.

(링크 : https://www.anandtech.com/show/12195/hisilicon-kirin-970-power-performance-overview)

 

 

- GFX벤치 결과 분석

(링크 : https://gfxbench.com/device.jsp?benchmark=gfx40&os=Android&api=gl&D=Huawei+Honor+View+10+%28V10%2C+BKL-xxx%29&testgroup=overall)

Mali-G71 사양인 엑시노스8895, 7885와 비교입니다.

엑시노스 드라이버 r0p3, 기린970 드라이버 r8p0

 

1. 엑시노스8895와 비교.

동사양에서 성능이 +5~10% 정도 올라갔습니다.

 

2. 엑시노스7885와 비교.

엑시노스7885와 비교하면 오히려 동사양에서 성능이 떨어집니다.

저사양(적은 MP수)에서 더 높은 효율이 나오는걸 수도 있고, 기린970에서 제 성능이 안 나온걸지도 모르겠습니다.

정황상 전자의 가능성이 높아보이고요.

고사양(많은 MP수)인 엑시노스8895와의 비교가 더 정확할듯 합니다.

 

어느 쪽이든 ALU 결과가 5% 이하로 거의 차이가 없는데 연산성능 면에서는 향상이 거의 없는듯 합니다.

 

 

- 엑시노스9810 사양 추정

엑시노스9810 GPU 사양은 Mali-G72MP18 까지만 나왔고, 발표 성능은 전작(엑시노스8895)의 +20%라고 합니다.

(링크 : http://www.samsung.com/semiconductor/minisite/exynos/products/mobileprocessor/exynos-9-series-9810/)

어떤 벤치마크가 기준인지 모르겠지만,

단순 계산해보면 카 체이스 30.7 fps/ 맨해튼3.1 51.2 fps/ 맨해튼  77.8 fps/ 티렉스 149.0 fps

이걸 MP18과 앞서 계산한 G72 MP당, 클럭당 성능으로 역산해보면,

카 체이스 688MHz/ 맨해튼 3.1 667MHz/ 맨해튼 584MHz/ 티렉스 578MHz

 

커널상 엑시노스8895 GPU 클럭은 839 764 683 572 546 455 385 338 260MHz

(링크 : 엑시노스8895 GPU 성능. (Exynos8895, Mali-G71MP20))

저 중에서 고른다면 683MHz가 제일 가깝네요.

 

ARM 발표로는 G72는 동일 공정, 비슷한 조건에서 G71 대비 에너지 효율 +25%, 성능 밀도 +20%

(링크 : ARM Cortex-A75/A55, Mali-G72 발표.)

이나 삼성의 엑시노스9810 성능 발표치만으로 뭔가 뽑아내기에는 가정으로 커버해야되는 빠진 부분이 너무 많습니다.

가정에 따라서는 834MHz가 나오는 경우도 있는데 기린970(10FF 공정, G72MP12)이 746MHz인 상황에서 MP18이 더 높은 클럭이기는 어렵겠지요.

납득할만한 추측이 나오기는 어려울거 같고 적당히 찍어보는 방법 밖에 없어 보입니다.

그런 식으로 해보면......

 

G71에서 엑시노스8895와 기린960을 비교해보면,

10LPE, MP20, 546,455MHz / 16FF+?, MP8, 1037MHz

총 전력이 일정할 것이라 가정하고 MP수에 따라 클럭이 반비례한다고 보고 기린960 사양 기준으로 엑시노스8895 클럭을 계산해보면,

1037 / 20 x8 = 414.8MHz

여기에 공정 성능 차이 +10%를 반영하면 456.3MHz

엑시노스8895의 455MHz와 유사하네요.

546MHz와 455MHz의 차이는 20% (티렉스, 맨해튼과 카 체이스, 맨해튼3.1 구동시 GPU 전력 차이가 생각보다 큰듯?)

 

이걸 패턴이라고 보고 G72, 엑시노스9810, 기린970에 대입하면,

10LPP, MP18 / 10FF, MP12, 746MHz

746 / 18 x12 = 497.3

10FF -> 10LPP 에서의 공정 성능 차이 +10%를 반영하면 547.1MHz

(앞서 언급한 GFX벤치 테스트별 클럭 차이인) +20% 반영하면 656.5MHz

엑시노스9810 GPU클럭은 656MHz, 547MHz로 나오게 됩니다.

카 체이스, 맨해튼3.1 클럭이 656MHz, 맨해튼, 티렉스 클럭을 547MHz라고 보고 앞서 나왔던 G72의 동사양 성능 값과 엑시노스9810의 MP수로 GFX벤치 결과 값을 계산해보면,

카 체이스 29.3 fps/ 맨해튼3.1 50.4 fps/ 맨해튼 72.8 fps/ 티렉스 141.0 fps

엑시노스8895 대비 성능 향상치는 각각 +14% / +18% / +12% / +14% 입니다.

삼성이 발표한 값인 +20%에 제일 가까운게 맨해튼3.1 인데 성능 평가?판단? 기준이 기존 맨해튼에서 맨해튼3.1로 바뀐걸지도 모르겠네요.

기린970보다 동사양 성능이 더 높게 나와서 발표 성능 향상치였던 +20%까지 올라갈 가능성도 있습니다.

 

 

- 정리 : Mali-G72 성능

기린970 성능 기준 결과로 추가 상승 가능성있음.

 

1. G71 대비 동사양 성능

그래픽 성능 5~10% 향상.

연산성능 유의차 없음.

 

2. 엑시노스 9810 GPU 클럭 추정.

Mali-G72MP18

656MHz 내외 (GFX벤치 카 체이스, 맨해튼3.1) / 547MHz 내외 (GFX벤치 맨해튼, 티렉스)

추정 성능 엑시노스8895 대비 +12~18%

 

 

 

Posted by gamma0burst Trackback 0 : Comment 8

댓글을 달아 주세요

  1. addr | edit/del | reply BlogIcon 흡혈귀왕 2018.01.26 16:40

    잘하면 GPU는
    8890이랑 820 때 같은 차이가
    날수도 있겠군요....

    이래서 CPU만 강조한걸수도 ㅡㅡa
    근데 클럭이 너프먹으면...ㅠㅠ

    어서 S-GPU가 투입되었음 좋겠네요.
    7420(14LPE) -> 8890(14LPP)의 경우

    동일 노드에 세대 차이가 있고 같은
    미드가르드라도 성능향상이 꽤됬는데

    8895(10LPE) -> 9810(10LPP)도
    같은 비프로스트인데
    CPU에 너무 힘을줘서 그런지

    참 아쉬운 수치네용

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2018.01.26 21:06 신고

      CPU는 애플 많이 따라갔는데 GPU에서 힘 빠져버린 느낌이지요.
      커스텀 아키텍처 아니면 진짜 방법이 없나 봅니다.

  2. addr | edit/del | reply 2018.01.27 12:37

    비밀댓글입니다

  3. addr | edit/del | reply ㅇㅇ 2018.01.27 13:22

    스냅드래곤 아드레노는 전성비가 미쳤던데 전성비가 좋은만큼 스로틀링에 강하겠죠??

    그리고 이번 애플 A11 GPU 전성비가 A10과 같은 성능의 클럭에서 A10 대비 50%나 향상되었다는데 그거에 대해선 어떻게 생각하시나요?
    스냅드래곤도 깡패인데 A11을 스냅드래곤과 비교하면 어느쪽이 더 좋을지 궁금하네요

    일단 성능자체가 A11이 워낙 높아서 단순비교를 할수있을지 모르겠지만
    일단 스냅드래곤 835는 A10과 성능이 비슷하니까 애플이 말했던 A11의 A10 성능에서의 전성비와 스냅드래곤의 전성비를 비교하면 될텐데 결과가 어떨지 궁금하네요
    최대성능에서의 상황도 궁금하구요

    감마님 분석으로는 어떨지 궁금하네요!!

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2018.01.27 21:30 신고

      전성비 자료 (인터넷에 공짜로) 나와있는건 아난드텍거 밖에 없는걸로 알고 있는데 그건 시스템(폰) 전체 전력 기준이라 아주 정확한 값은 아닐겁니다.
      대략 비교는 할 수 있겠고요.

      스냅, A10, A11 GPU의 쓰로틀링 특성까지 알아야 비슷한 전력에서의 성능을 알 수 있고 전성비를 대략적으로 비교라도 해볼 수 있는데 자료가 없는 부분이 많네요.
      특히 A11은 GPU 종류도 불명이고(A10과 같다면 간접비교라도 할 수 있을겁니다.) 쓰로틀링 특성에 대한 리뷰가 없어서 비교하기가 더 어렵습니다.

      A10 쓰로틀링 특성을 보면
      (https://www.anandtech.com/show/10685/the-iphone-7-and-iphone-7-plus-review/5)
      장시간 유지되는 성능은 최대 성능 대비 60% 수준으로 나옵니다.
      (맨해튼3.1 온스크린 25~27 fps)

      스냅835는 최대 성능 대비 58% 수준이네요.
      (https://www.anandtech.com/show/11540/samsung-galaxy-s8-exynos-versus-snapdragon/5)
      (맨해튼3.1 오프스크린 25 fps)

      성능 하락 비율과 오프스크린 성능으로 쓰로틀링 상황에서 성능을 계산해서 비교하면
      A10, A540 둘 다 최종 성능이 비슷한데 이 때 전력이 비슷할거라 추측할 수 있을듯 합니다.
      최대 성능일 때의 전성비를 비교하려면 좀 더 자료가 필요할듯 합니다.

  4. addr | edit/del | reply ㅇㅇ 2018.01.28 17:04

    갤럭시 S8에는 있는 히트파이프가 아이폰7에는 없고 이런 것은 차치하고 그냥 저 내용으로만 러프하게 비교해 본다면

    A10의 전성비는 스냅드래곤 835와 비슷하고
    A11의 전성비는 A10의 성능에서는 A10보다 50% 향상, 최대 성능일 때는 아직 밝혀진 바가 없음

    이라고 생각하면 되겠군요


    스냅드래곤 835 전성비가 괴물이길래 이정도 되면 독보적인 정도겠거니 했는데
    A10이나 A11은 말그대로 상상 이상의 것이네요

    삼성에서 개발중이라는 GPU가 얼른 실기기에 탑재되었으면....

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2018.01.28 17:28 신고

      쓰로틀링 특성을 자세하게보면 최고 성능 유지하는 시간이 A10은 5분 미만이고 스냅835는 15분 정도 유지해서 더 낫긴한데,
      이건 방열 기구 차이나 공정 차이도 개입된 부분이라서 생산된 최종 결과물만 보면 정말 러프하게 잡아서 비슷하다라는 표현 밖에 안 되긴 합니다.