본문 바로가기
스마트폰/퀄컴 Qualcomm

스냅드래곤835 CPU, GPU 성능 (Snapdragon835, MSM8998)

by gamma0burst 2017. 5. 9.
반응형

- 스냅드래곤835 벤치마크 분석입니다.


- 사양

삼성 10LPE 공정

CPU : Kryo280 최대 2.45GHz x4 + 1.9GHz x4

GPU : Adreno540 최대 710MHz

메모리 : LPDDR4 64bit(16 x4) 1866MHz



- 긱벤치 4.1 시스템 정보

(링크 : http://browser.primatelabs.com/v4/cpu/2684322)

MSM8998

8코어 1.9GHz : 이미 탑재 제품의 사양을 통해 다 나왔듯이 빅코어 x4 + 리틀코어 1.9GHz x4 사양

아키텍처는 part 2048 r10p1 입니다.

전작인 스냅820이 part 517 r2p1 이었던데 비하면 많이 다릅니다.

이 둘의 차이는 뒤에서 다루겠습니다.



- 긱벤치4.1 결과


싱글코어 점수

긱벤치 결과에서 싱글코어 총점 최대값이 2000점 넘게 나오는데 이건 왜 이렇게 낮은가 할 수 있는데

긱벤치 버전이 4.0에서 4.1로 바뀌면서 점수가 내려갔습니다.

대신 멀티코어 점수는 더 잘 나왔습니다.

총점은 스냅820과 큰 차이가 없는데, 세부 항목별 점수는 차이가 있습니다.


멀티코어 점수

총 4코어였던 스냅820에 비해 크게 올랐습니다.


싱글코어 클럭당점수

정수, 부동소수점, 메모리 점수 모두 Cortex-A73과 비슷합니다.


싱글코어 세부항목의 동클럭점수를 비교해보면 Kryo280이 A73과 유사하다는게 더욱 잘 드러납니다.

Kryo와 A73 간의 성능분포 차이가 큰 것에 비해 Kryo280과 A73의 성능분포는 최대 7% 정도 밖에 차이가 나지 않습니다.


pcwatch의 기사를 보면 Kryo280은 ARM BoC(Based ON arm Cortex technology) 라이센스 기반의 제품이라고 합니다.

(링크 : http://pc.watch.impress.co.jp/docs/column/ubiq/1050730.html)

ARM Cortex IP 라이센스를 사용한 세미 커스텀 제품이라는겁니다.


종합해보면 사양을 Kryo280 이라고했지만 실제로는 Cortex-A73 x4 + Cortex-A53 x4 기반의 커스텀 제품이라고 볼 수 있습니다.


싱글-멀티코어 총점 비율(멀티코어 총점/싱글코어 총점)을 보면 3.46으로 기존의 빅리틀 4+4 코어 구성 제품들과 비슷한 경향을 보입니다.

단일 아키텍처 8코어 제품의 경우 5.0 이상이 나와서 스냅835와 차이가 있습니다.


싱글코어 동클럭점수에서 그나마 A73과 차이가 큰 부분이 메모리 점수인데, 이건 메모리 컨트롤러가 자체 설계이거나 기존에 쓰던 다른 IP이기 때문이라고 해석할 수 있습니다.

세부항목 점수가 완전히 같지 않은건 벤치마크의 오차 혹은 코어 아키텍처를 제외한 내부 버스, 메모리 컨트롤러 등에서 커스텀이 이루어졌기 때문으로 볼 수 있을듯 합니다.

 

 

- GFX 벤치/ GPU GFLOPS

(링크 : https://gfxbench.com/device.jsp?benchmark=gfx40&os=Android&api=gl&D=Xiaomi+MI+6&testgroup=overall

https://gfxbench.com/device.jsp?benchmark=gfx40&os=Android&api=gl&D=Samsung+Galaxy+S8+%28Adreno+540%2C+SM-G950x%2C+SC-02J%29&testgroup=overall)

GFX벤치 결과는 크게 샤오미 미6, 갤럭시S8 결과가 올라와 있는데 둘의 결과에 10% 정도의 차이가 있습니다.

A540 710MHz 기준으로보면 스냅821의 A530에 비해 평군 +26% 정도 성능이 올라갔습니다.

ALU2 결과 차이는 9% 정도로 딱 클럭차이만큼 입니다.

연산유닛 수는 달라지지 않았다고 볼 수 있습니다.


텍스처링 결과로 보아 텍스처 유닛은 20tex/cycle 정도로 16tex/cycle이었던 A530보다 증가한 것으로 보입니다.

TMU, ROP 사양 증가로 인한 그래픽 성능 증가라고 볼 수 있을듯.


 

(왼쪽 : 스냅821, 오른쪽 : 스냅835)

A530과 A540의 연산유닛이 같다는건 GPU GFLOPS 결과로도 알 수 있습니다.

A530 653MHz의 결과가 328.4 GFLOPS인데 역산해보면 FP32 유닛 기준 256코어가 됩니다.

(256 x2 x0.653 = 334.3 GFLOPS)

A540 653MHz(갤럭시S8) 결과는 335.2 GFLOPS로 이론치만큼 나온듯 합니다.

이론치(334.3)보다 높게 나온 점때문에 클럭이 기존에 알려진대로 670MHz일 가능성도 있어보이는데 이 부분은 좀 더 확인이 필요해보입니다.



- 갤럭시S8 스냅드래곤835 버전 사양

GFX벤치 결과에서 나왔듯이 같은 스냅835라도 샤오미 미6와 갤럭시S8의 GPU 클럭은 차이가 있는 것으로 보입니다.


(링크 : http://weibo.com/1778375693/F02UJocHl)

샤오미 미6의 GPU 발표 사양은 653MHz인데 실제 동작을 보면 최대 800MHz 이상, 보통 710MHz 정도로 동작한다는 내용도 있습니다.

CPU 사양을 봐도 샤오미 미6는 2.45GHz, 갤럭시S8은 2.35GHz로 차이가 있습니다.


갤럭시S8 탑재 버전의 클럭이 최대치가 아니라는건데 엑시노스8895 사례에서도 추측해볼 수 있듯이 수율이 문제가 됐을 가능성이 있어 보입니다.

(링크 : 엑시노스8895 CPU 성능. (Exynos8895, Galaxy S8))


원래 퀄컴에서 기획했던 클럭은 710MHz 정도였을 가능성이 높아보입니다.

710MHz에서의 성능이 엑시노스8895의 성능과 비슷한데 이는 상호간 혹은 삼성에서 타겟으로 삼은 성능이 A540 710MHz 수준이였기때문일 가능성이 높습니다.

그런데 어떤 이유에서 710MHz 기준으로 충분한 물량이 확보되지 않아서 653MHz으로 기준을 낮춰서 물량을 확보해야했을 것이라 보는거지요.


만약 이 가설이 맞다면 샤오미 등 타사에 공급되는 제품이 문제인데,

653MHz라는게 샤오미의 공식 입장이기때문에 710MHz 동작하는 경우가 왜 발생했느냐에 대해 해석의 여지가 있습니다.

표면적으로 653MHz라고 발표했지만 제품마다 편차가 있어서 710MHz로 동작하는 제품이 섞여있는 경우,

표면적으로 653MHz라고 발표했지만 최대 클럭 제한을 풀어놔서 제품의 소비전력, 발열 특성에 따라 최대 클럭에 차이가 있는 경우,

또는 갤럭시S8 엑시노스8895 버전 중에서 초기 물량 중 2.5GHz로 동작하는 제품이 있었던 것처럼 710MHz로 동작하는 샘플이 들어간 제품이 초기 물량에 섞여있는 경우 정도를 생각해볼 수 있을듯 합니다.



- 정리 : 스냅드래곤835 (MSM8998)

삼성 10nm LPE 공정


CPU : Kryo280

 Cortex-A73 x4 + Cortex-A53 x4 기반 세미커스텀으로 추정.

 빅코어 성능은 Cortex-A73과 동일.

 내부 버스, 메모리 컨트롤러 등에서 차이가 있으나 코어 아키텍처는 ARM 레퍼런스 그대로인 것으로 추정.


GPU : Adreno540 최대 710MHz

 A530 653MHz 대비 평균 +26% 성능 향상

 256코어-20TMU-20ROP 추정

 710MHz 기준 363.5 GFLOPS, 14.2 GTex/s, 14.2 GPix/s 추정





반응형

댓글