- 의문의 시작.
아래 그래프는 린팩 싱글스레드와 멀티스레드의 성능 비율입니다.
간단히 말하려고 멀티코어 효율이라고 했지마 크게 간략화해서 계산한거라 정확한건 아닙니다.



저가형(구형)인 Cortex-A7/A9 쿼드코어는 그 비율은 1: 3 을 넘습니다.
쿼드코어라면 이상적으로 1 : 4 겠지요.
이상적인 성능이 나오기 힘든게 일반적이니 1 : 3 이 넘으면 어느정도 납득할만한 수준입니다.
문제는 스냅드래곤 쿼드코어, Cortex-A15 쿼드코어같은 최신 제품이 1 : 3 에 턱없이 못 미치는 비율이라는 것.
엑시노스는 싱글스레드와 멀티스레드의 비율이 1 : 2.08 에 불과합니다. 
이건 이상과 현실의 차이만으로 설명할 수 없는 수준입니다.
스냅드래곤 듀얼코어가 1 : 2 라는 이론치에 가까운 결과를 내는 상황을 생각하면 더더욱 그렇습니다.




- 가정들.
그렇다면 그렇게 된 이유를 생각해봐야겠지요.
우선 쿼드코어에서의 최대 이론치를 생각해봐야 합니다.
Cortex-A7/A9 쿼드코어의 결과를 놓고보면 1 : 3.x 정도로 생각해야겠지만 스냅드래곤 듀얼코어가 1 : 2 라는 이론치에 가까운 결과를 내는 것을 보면 1 : 4 로 생각해도 문제는 없어보입니다.

여기서 참고할 수 있는게 엑시노스5420의 긱벤치3 결과.

 

(
http://browser.primatelabs.com/geekbench3/130434)
정수연산 - 1 : 3.4
부동소수점연산 - 1 : 3.62

긱벤치3에서 엑시노스5420 CPU 클럭은 1.9GHz로 고정이라고 합니다.
말많고 탈많은 그 벤치마크용 부스트 코드 덕분에 말입니다.
그 부분이 이슈화된게 10월초였는데 저 테스트는 10월말에 있었으니 저 테스트에서도 그런 설정이 적용되었는지 확신할 수 없지만 그럴 가능성이 높으니 그렇게 가정하도록 하지요.

긱벤치3에서 이론적으로 아래와 같습니다.
싱글코어 성능 : 멀티코어 성능 = 싱글코어 1.9GHz : 쿼드코어 1.9GHz = 1 : 4
그런데 실제는 1 : 3.62 이지요.
거기에 이 테스트에서 쿼드코어 1.9GHz는 확실한 사실이고요.
그렇다면 싱글스레드 성능이 싱글코어 1.9GHz보다 높다는 것이고 방법은 클럭이 높이는 수 밖에 없습니다.
1 : 3.62 라는 비율이 나오기위한 싱글코어 클럭을 계산해보면 2.1GHz 입니다.

여기서 결론이 하나 나왔습니다.
싱글코어 성능 : 멀티코어 성능 = 싱글코어 2.1GHz : 쿼드코어 1.9GHz = 1 : 3.62
싱글코어 클럭은 2.1GHz



다시 린팩으로 돌아가보면......
이론치가 1 : 4 인데 실제는 1 : 2.08 로 절반 수준이니 클럭 상승만으로 설명하기는 어렵습니다.
린팩의 싱글스레드에서 싱글코어가 아닌 듀얼코어가 동작한다고 가정할 수 있습니다.

듀얼코어에서도 싱글코어와 같은 클럭으로 동작한다고 가정하고 계산해보면 이렇게 되겠지요.
싱글스레드 성능 : 멀티스레드 성능 = 듀얼코어 2.1GHz : 쿼드코어 1.9GHz = 1 : 1.81
실제값인 1 : 2.08 이 되려면 싱글스레드가 낮아지거나 멀티스레드가 올라가야 합니다.
그 전에 생각해봐야하는게 있습니다.
멀티코어 성능이 이론치에 가까운 비율(듀얼코어라면 1:2, 쿼드코어라면 1:4)로 나온다는 현재의 가정하에서 듀얼코어와 쿼드코어의 성능 비율은 1 : 2 미만이 나올수가 없다는겁니다.
동클럭이라면 1 : 2 가 나올 것이고, 클럭이 차이난다하더라도 듀얼코어 시의 클럭이 쿼드코어 시의 클럭보다 무조건 높기때문입니다.
(활성화 코어수가 적을 때 통상적인 클럭보다 높게 올릴 수 있는 근거가 소비전력과 발열의 여유이기때문.)


린팩 싱글스레드가 듀얼코어를 사용한다는 가정을 지키기위해서는 다른 가정이 필요합니다.
린팩 싱글스레드가 듀얼코어의 최대 성능을 발휘하지 못 했다.라는 겁니다.
그런데 이 경우 모순이 생기지요.
싱글스레드라지만 듀얼코어에서 성능을 최대로 뽑아내지 못 하는데 멀티스레드에서 쿼드코어의 성능을 최대로 뽑아낼 수 있다? 앞뒤가 안 맞지요.
따라서 린팩 싱글스레드가 듀얼코어를 쓴다는 가정은 가능성이 낮아보입니다.

그렇다면 결론은 하나뿐입니다.
린팩 멀티스레드가 CPU의 최대성능을 뽑아내지 못 한다는거지요.
싱글코어와 멀티코어의 비교라면 최대 클럭의 차이를 고려한다해도 최소 1 : 3 이상은 나와줘야 합니다.
그런데 실제 싱글스레드 결과와 멀티스레드 결과의 비율이 이에 못 미친다는건 멀티스레드 테스트에서 멀티코어를 최대로 사용하지 못 한다고 밖에 볼 수 없겠지요. 
 

- 엑시노스 5410은 어떠한가?
엑시노스5410도 5420처럼 활성 코어수에 따라 클럭이 다른지 확인해 보겠습니다.

 

(
http://browser.primatelabs.com/geekbench3/77726)
정수연산 - 1 : 3.5
부동소수점연산 - 1 : 3.6

엑시노스5410은 1.6GHz로 알려져있고 긱벤치3 결과의 시스템 정보에서도 그렇게 나타나고 있습니다.
최소한 긱벤치3에서는 쿼드코어에서 1.6GHz로 동작한 것으로 보입니다.

싱글코어 성능 : 멀티코어 성능 = 1 : 3.6 = 싱글코어 1.78 GHz : 쿼드코어 1.6GHz
≒ 싱글코어 1.8 GHz : 쿼드코어 1.6GHz

엑시노스5420도 그렇지만 1.8GHz라는 싱글코어시 클럭이 싱글코어에만 그치지는 않을듯 합니다.
듀얼코어까지 최대클럭이 확장될 가능성이 높다고 봅니다.


- 요약.
엑시노스5410 : 싱글/듀얼코어 1.8GHz, 쿼드코어 1.6GHz
엑시노스5420 : 싱글/듀얼코어 2.1GHz, 쿼드코어 1.9GHz (혹은 그 이하.)
린팩 멀티스레드는 CPU의 최대 성능을 활용하지 못 함.

 

Posted by gamma0burst Trackback 0 : Comment 11

댓글을 달아 주세요

  1. addr | edit/del | reply 흡혈귀왕 2013.10.30 19:35 신고

    감마님 이번에 ARM에서
    새로운 3세대 미드가르드 GPU인
    Mali-T720과 T760을 발표했는데
    어떻게보시나요?

    전 T760보다 T720이 더 눈에 가더군요
    중저가 시장 포지션이란놈이 695MHz 클럭에서
    무려 700MHz Mali-T628MP6보다 높은
    쉐이더 성능을 보여주고 OpenGL ES3.0과
    다이렉트X11.1도 지원하더군요 ㅎㄷㄷㄷㄷ

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2013.10.30 19:54 신고

      T720은 성능과 구성으로 보건데 기본적으로 T628의 재탕이라고 봅니다.
      그래도 설계최적화가 새로운 기술이 적용되어서 전력, 다이사이즈, 전성비에서 개선되었을듯.
      그런데 Mali-450MP의 후속으로 소개되고 있지요.
      전체적인 성능이 향상되면서 라인업상 하위로 배치된 것도 있고, 다이사이즈가 작아지면서 하위라인업에 적용될 수준이 된 것일지도 모르겠습니다.


      T760은 최대 스펙은 MP16 기준으로보면 T678하고 쉐이더 수가 같습니다.
      동클럭에서 연산성능이 같은겁니다.
      그리고 T678에 비해 (이론적인) 그래픽 성능은 두 배.
      연산성능과 그래픽성능을 모두 잡을 수 있는 코어를 구상한듯한데 그렇다해도 이런 고스펙 GPU가 언제 제품화될지는 미지수.
      T678이 아직도 먼 것처럼 말이지요.

    • addr | edit/del 미르 2013.11.02 03:56 신고

      삼성에서 14나노를 내년초에 기사대로 양산하면 곧 볼수있을것 같네요

  2. addr | edit/del | reply ㅁㅁ 2013.11.01 20:22 신고

    그러면 린팩이 업데이트로 멀티코어점수가 재대로 측정되도록 바뀌어야 겟군요?

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2013.11.02 09:17 신고

      그렇긴한데 테스트 시간이 너무 짧아서 그런게 아닌가 싶기도 합니다.
      풀로드가 걸리기 전에 테스트가 끝나버린 느낌.
      그런데 과연 업데이트를 해줄까요?
      안드로이드 린팩은 별로 관리를 안 하는 것 같단 말이지요.

  3. addr | edit/del | reply 미르 2013.11.02 03:53 신고

    옥타코어여서 점수가 제대로 안나오는건 아닌지요
    현재 5420이 hmp인가요?

  4. addr | edit/del | reply ㅁㅁ 2013.11.02 18:33 신고

    근데 HMP가 되도 풀로스디 성능이10~15%정도 밖에 안오르는게 신기하네요
    a7쿼드의 성능이 그렇게 구린가...

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2013.11.04 19:41 신고

      총점 기준이기때문에 그런 것도 있지만 일단 Cortex-A7 성능이 낮은게 결정적인 이유일겁니다.

  5. addr | edit/del | reply Favicon of http://blog.naver.com/lyh901125 BlogIcon 빛의 편지 2013.11.04 20:44 신고

    그런데요. 같은 퀄컴 크레이트 아키텍처인데 GHz당 부동소숫점 성능이 다른 것은 어떻게 설명할 수 있을까요? 개선된 버전에서 단순히 메모리 성능이 향상된 수준은 아닐 거고고... GPU의 부동소숫점 연산을 끌어다 쓰는건지... 아니면 부동소숫점 연산모듈만 개선한 건가요?

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2013.11.04 22:09 신고

      테스트 결과들을 보면 시간이 지날수록 결과값이 높아집니다.
      제품의 소프트웨어적인 최적화도 있고, 안드로이드 버전업에 의한 성능향상도 있습니다.
      그런데 구형제품은 이런 성능향상의 수혜를 입는다 하더라도 사람들의 관심에서 멀어져있기때문에 린팩을 돌려보지 않고 인터넷 상에 결과가 올라오지도 않습니다.
      구형제품과 신형제품이 똑같이 수혜를 받았지만 인터넷 상에 나타나는건 신형제품뿐인겁니다.
      구형제품은 성능향상의 혜택을 받지 못한 과거의 결과만이 누적되어 있고, 신형제품은 혜택을 받은 최신 결과가 계속적으로 쌓여가는거지요.
      그러면 구형제품의 평균치와 신형제품의 평균치는 차이가 벌어질 수 밖에 없습니다.

      동일 사양임에도 신형 제품의 성능이 높은 것처럼 보이는건 그런 이유때문입니다.