본문 바로가기
스마트폰/퀄컴 Qualcomm

스냅드래곤810 (MSM8994) 긱벤치3 동작 분석.

by gamma0burst 2015. 2. 8.
반응형

 

- 스냅드래곤810 (MSM8994, 이하 스냅810)의 성능 논란이 있습니다. (현재 진행형이지요.)

긱벤치3 결과가 올라오면서 논란은 시작됐습니다.

 

Cortex-A57 2.0GHz, AArch64 사양의 스냅810 싱글코어 점수가......

 

Cortex-A57 1.9GHz, AArch32 사양의 엑시노스5433 보다 떨어지기때문입니다.

심지어 스냅810은 LPDDR4, 엑시노스5433은 LPDDR3로 메모리 점수에서 엑시노스가 열세인데도 점수 차이가 있습니다.

정수, 부동소수점 점수에서 스냅810이 크게 밀린다는 의미지요.

 

 

- 원인?

근본적인 원인은 발열로 알려져있는데 그렇다면 어떤 식으로 코어가 동작하느냐가 의문입니다.

단순히 A57 클럭이 떨어지는건지, A53으로 전환되는건지.

이를 확인해보겠습니다.

 

 

- Cortex-A57과 A53의 성능비.

긱벤치3 정수 테스트를 기준으로 A57과 A53의 클럭당성능비를 비교해보겠습니다.

스냅810 테스트가 AArch64로 이루어졌기때문에 AArch64 결과만을 취합해서 비교하겠습니다.

(같은 아키텍처라도 AArch32와 AArch64에서의 성능비가 다릅니다. 같은 모드로 비교해야합니다.)

 

Exynos7420 : http://browser.primatelabs.com/geekbench3/1780313
MSM8916 : http://browser.primatelabs.com/geekbench3/1407800
MSM8939 : http://browser.primatelabs.com/geekbench3/1806862

 

엑시노스7420은 A57 2.1GHz 이고, MSM8916/39는 1.65GHz 입니다.

순수 단일코어를 비교하기위해 긱벤치3 정수 싱글 점수를 비교하겠습니다.

 

A57을 기준으로 잡고 A53의 상대적인 클럭당점수를 비교한 것입니다.

A53과 같은 식의 그래프와 유사한 형태로 나온다면 A53으로 동작하는 상태라고 볼 수 있습니다.

엑시노스7420처럼 직선에 가까운 형태라면 A57이 동작하는 상태라고 볼 수 있습니다.

각 항목의 클럭당성능이 아키텍처에 따라 다르기때문입니다.

 

 

- 분석에 앞서.

긱벤치에 올라온 스냅810 결과는 크게 두 가지있습니다.

'unknown MSM8994 for arm64', 'LGE LG-F510'

전자는 개발킷으로 보이고, 후자는 G Flex2 입니다.

각각의 성능에 대해 분석해보겠습니다.

각 결과 중에서 싱글 총점 기준으로 최하, 600, 700, 800, 900, 1000, 1100, 1200, 최고점을 하나씩 표본으로 선택해서 비교했습니다.

 

앞서 말했듯이 A57로 동작한다면 엑시노스7420과 같이 직선으로 나올겁니다.

A53과 비슷한 형태의 그래프가 나온다면 A53으로 동작한다고 볼 수 있습니다.

A53으로 동작한다면 클럭은 1.55GHz인데, A57 기준으로 분석을 했기때문에 점수는 2.0GHz로 나눴습니다.

실제보다 더 높은 클럭으로 나눴기때문에 클럭당점수는 A53 기준보다 더 낮게 나오게 됩니다.

즉, A53 그래프와 비슷한 형태이면서 더 낮은 점수여야 A53으로 동작한다고 볼 수 있는겁니다.

(설명이 이해하기 힘들 것 같은데 아래 분석을 보면 이해할 수 있을겁니다.)

 

 

- MSM8994 Develop Kit 결과 분석.

Highest : http://browser.primatelabs.com/geekbench3/1266960
1200 : http://browser.primatelabs.com/geekbench3/1758963
1100 : http://browser.primatelabs.com/geekbench3/1742640
1000 : http://browser.primatelabs.com/geekbench3/1756757
900 : http://browser.primatelabs.com/geekbench3/1806529
800 : http://browser.primatelabs.com/geekbench3/1773306
700 : http://browser.primatelabs.com/geekbench3/1742102
600 : http://browser.primatelabs.com/geekbench3/1746310
Lowest : http://browser.primatelabs.com/geekbench3/1738470

 

최하 점수입니다.

AES, Sobel의 두 포인트를 제외하고는 직선에 가까운 형태를 보입니다.

 

두 포인트는 A53과 비슷한 수준까지 올라가서 A53인게 아니냐고 생각할 수 있겠지만 그렇지 않습니다.

Sobel을 예로 계산해보면,

A53의 클럭당점수비는 A57 대비 60% 수준입니다. (그래프 보면 바로 알 수 있지요.)

그런데 스냅810 점수를 2.0GHz로 나눈 결과도 60% 수준입니다.

만약 이게 A53이 동작한 결과라면 A53 클럭인 1.55GHz로 나눈 값이 60% 수준이 나와야하는거지요.

2.0GHz로 나눈 결과가 60%인데, 1.55GHz로 나눈다고 가정하면 77%가 되서 A53 기준보다 높아집니다.

A53 결과로 보기 힘든거고, 그렇기때문에 (앞서 말했듯이) A53과 비슷한 그래프 형태면서 A53 기준보다 결과가 낮아야 A53이 동작했다고 판단할 수 있습니다.

 

이를 토대로 보면 최하 결과는 기본적으로 A53이 낮은 클럭으로 동작했으며, 두 포인트에서 일시적으로 클럭이 높아졌다고 볼 수 있습니다.

아무리 쓰로틀링이 있다해도 A57 클럭이 10% 수준(200MHz)까지 떨어진다고 보기는 힘들기때문입니다.

보통 쓰로틀링 상황이 그 정도까지가면 그냥 A53으로 전환됩니다.

 

싱글 총점 600~800점 결과들입니다.

대부분 A53 기준 그래프와 유사한 형태를 띄고 있고, A53보다 점수가 낮습니다.

A53으로 동작했다는 의심을 하기 충분합니다.

그러면 이 결과를 A57 클럭인 2.0GHz가 아닌, A53 클럭인 1.55GHz로 다시 그려보겠습니다.

 

스냅810 A53클럭인 1.55GHz로 재계산한 결과입니다.

 

700점 그래프는 A53 기준과 거의 똑같이 나옵니다. A53으로 동작한다고 볼 수 있습니다.

 

600점 점수는 A53 기준보다 약간 낮지만 형태는 거의 같습니다.

A53으로 동작하지만 풀클럭(1.55GHz)으로 동작하지는 않는 것으로 보입니다.

 

800점 그래프는 A53 기준보다 높은 부분이 조금씩 나옵니다.

기본적으로 A53으로 동작하지만 일부 테스트에서 A57로 전환되는 것으로 보입니다.

 

900점, 1000점 결과입니다.

 

900점 그래프는 그래도 직선과 비슷한 수준을 보입니다.

A57로 동작하지만 클럭이 떨어진 상태로 보입니다.

 

1000점 그래프는 심하게 들쭉날쭉합니다.

초반 몇몇 항목은 엑시노스7420에 근접한 수준까지 올라가고요.

A57로 동작하면서 테스트 초반에는 클럭을 어느 정도 유지하다가 JPEG Compress부터 클럭이 크게 떨어지고, Sobel에서 다시 회복하는 형태로 보입니다.

 

1100점~최고점 결과입니다.

여전히 중간중간 클럭이 떨어지는 모습을 보이지만 그래도 앞선 결과에 비해 A57 결과답게 직선에 가까운 형태를 보입니다.

 

 

- LG G Flex2 결과 분석.

스냅810을 사용한 G Flex2 결과 분석입니다.

Highest : http://browser.primatelabs.com/geekbench3/1840473
1200 : http://browser.primatelabs.com/geekbench3/1820088
1100 : http://browser.primatelabs.com/geekbench3/1753482
1000 : http://browser.primatelabs.com/geekbench3/1791800
900 : http://browser.primatelabs.com/geekbench3/1792902
800 : http://browser.primatelabs.com/geekbench3/1784696
700 : http://browser.primatelabs.com/geekbench3/1852736
600 : http://browser.primatelabs.com/geekbench3/1806711
Lowest : http://browser.primatelabs.com/geekbench3/1708087

 

최하~700점 결과입니다.

최하는 기본적으로 직선이지만 마지막 부분에서 A53과 비슷한 형태입니다.

600점은 두 포인트가 크게 튀고 그 외에는 부분적으로 A53과 비슷한 부분이 있습니다.

700점도 A53과 비슷한 부분과 그렇지 않은 부분이 혼재되어 있습니다.

 

A53과 비슷한 부분이 있기때문에 스냅810 A53 클럭인 1.55GHz를 기준으로 다시 그려보겠습니다.

 

최하점은 AES에서 A53급으로 나오다가 직선에 가까운 형태로 A53보다 낮게가고, 마지막에 A53과 비슷한 형태가 나옵니다.

맨 앞과 맨 뒤에서 A53으로 동작하는건 맞는듯 합니다.

중간이 직선이긴하지만 A53보다 크게 떨어지는 점, 마지막에 A53과 비슷한 형태이나 A53보다 낮은걸로 보아 클럭이 떨어지는 것으로 추정되는 점들을 종합하면,

초반에 A53 풀클럭으로 동작했으니 이후 클럭이 풀클럭보다 낮은 상태로 변화하면서 진행해서 직선에 가까운 형태가되고, 마지막에서는 A53 클럭이 특정값으로 (풀클럭의 70% 수준)으로 고정되면 A53과 같은 그래프 형태를 보인 것으로 추정됩니다.

A53으로 동작했다는거지요.

 

600점 그래프를 보면,

크게 튀는 두 포인트느 클럭당점수가 A57을 넘어섰습니다.

2.0GHz 기준으로 계산하는게 맞다는거고, A57로 동작했다는 의미입니다.

그 외의 부분은 A53과 비슷한 형태입니다.

기본적으론 A53으로 동작하다가 일시적으로 A57로 동작했다고 볼 수 있습니다.

 

700점 그래프는 완전히 A57과 A53이 섞여서 동작하는 형태입니다.

중간중간 A53과 거의 일치하는 포인트가 다수 있는데 이 부분은 A53 풀클럭으로 동작한 것으로 볼 수 있고,

그 외 A53보다 높은 부분은 A57이 낮은 클럭으로 동작했다고 볼 수 있습니다.

 

800~1000점 결과입니다.

A53과의 유사점이 거의 없기때문에 A57로 동작했다고 볼 수 있습니다.

그런데 그래프의 최대-최소 차이가 심하지요.

쓰로틀링의 가장 극명하게 보여주는 결과가 아닌가 싶습니다.

 

Lua 결과를 보면 엑시노스7420보다 높은데 이는 스냅810 결과 중 최상위 그룹에서 자주 보이는 부분입니다.

아무래도 엑시노스7420 결과가 많지 않아서 이 부분의 점수가 최대치가 나오지 않은 것으로 보입니다.

이 결과만 보면 클럭이 40% 수준(800MHz)까지 떨어지는걸 알 수 있습니다.

 

BZip2 Deompress~PNG Deompress 구간 결과가 A53과 비슷한 것을 놓고 A53으로 동작한게 아닌가 할지 모르겠는데,

앞서 언급했듯이 2.0GHz 기준 계산 결과이기때문에 A53 기준보다 20% 이상 낮게 나와야 A53 풀클럭 동작 결과로 볼 수 있습니다.

 

1100점~최고점 결과입니다.

MSM8994 개발킷과 비슷한 결과입니다.

주목할 부분은 최고결과의 Twofish~JPEG Compress 구간에서 완벽에 가까울 정도의 직선이 나왔다는겁니다.

(스냅810은 하면 되는 아이였습니다. 대신 주변환경이 도와줘야하지만요. 많이 차갑게......)

 

최고 결과라해도 엑시노스7420대비 95% 수준인데, 아무래도 G Flex2에서 A57 클럭이 1.9GHz 수준으로 설정되어 있을 가능성이 있습니다.

혹은 1.9x GHz인데 2.0GHz라고 올려서 표기했을 가능성도 있습니다.

(엑시노스5433도 그렇고 20nm 공정에서 A57의 현실적인 한계클럭은 역시 1.9GHz인걸까요.)

 

 

- 정리

스냅810의 각 구간 결과별 코어 동작 상태를 종합하면 이렇습니다.

저성능 : A53이 낮은 클럭으로 동작. 간헐적으로 A57이 동작.

중성능 : 설정에 따라 다름.

      A53이 풀클럭을 동작하거나(개발킷),

 A57 클럭이 요동치면서 동작하거나.(G Flex2)

고성능 : A57 동작.

          쓰로틀링에 의한 클럭저하가 있지만 평균적으로 80%수준의 클럭(1.5~1.6GHz)을 유지.

 

 

반응형

댓글