본문 바로가기
스마트폰/기타업체 ETC

하이실리콘 기린950 CPU 사양/성능. (HiSilicon Kirin 950) (update 2016.01.07)

by gamma0burst 2016. 1. 7.
반응형

 

- 하이실리콘 기린950 CPU 사양/성능(긱벤치3 결과) 분석입니다. (HiSilicon Kirin 950)

 

- 사양

Cortex-A72 2.3GHz 쿼드코어 + Cortex-A53 1.8GHz 쿼드코어.

LPDDR3/4 지원.

Mali-T880MP4 900MHz

LTE Cat.6 모뎀. (원칩)

TSMC 16FF+ 공정

 

ISP 성능이나 CAM(ERA) 성능같은 것도 있는데 만드는 입장에서는 중요한데 쓰는 입장에서는 그 정도로 중요하지는 않단 말이지요.

GPU 얘기는 이전 포스팅 참고.

(링크 : 하이실리콘 기린950 GFX벤치 분석. (HiSilicon Kirin 950, Mali-T880))

 

 

 

(링크 : http://pc.watch.impress.co.jp/docs/news/event/20160106_737718.html)

 

 

- 긱벤치3 결과

 (링크 : http://browser.primatelabs.com/geekbench3/4061192)

 

시스템 정보에는 part 3336 (= Cortex-A72) 1.8GHz(= 리틀코어 클럭) 로 나옵니다.

공개한 사양과 일치합니다.

램 4GB

 

싱글코어의 클럭당점수를 보면,

정수, 부동소수점 점수는 기존 A72 제품과 비슷한 점수를 보입니다.

MT8173 결과가 높은 A72 x2 + A53 x2 로 코어 수가 적은 영향으로 보입니다.

메모리 점수가 낮은게 조금 걸립니다.

멀티코어 메모리 점수를 보면 LPDDR3 로 보이는데 그렇다해도 같은 메모리 사양인 스냅620보다 점수가 떨어집니다.

LPDDR4로 보이고, MT8173 점수를 보면 LPDDR4 추정 사양으로 메모리 점수가 2100점대까지 나옵니다.

LPDDR4로 탑재로 확인됐는데 메모리 점수를 보면 LPPDDR3 933MHz 사양인 헬리오 X20와 비슷한 수준입니다.

(링크 : http://www.myfixguide.com/manual/wp-content/uploads/2015/12/Huawei-Mate-8-Teardown-14.jpg)

 

아난드텍 리뷰를 보면 LPDDR4-1333 까지 지원한다고 하는데 이 내용이 사실이라면 어느 정도 납득이 가는 점수입니다.

이미 출시된 LPDDR4 사양 AP가 1600MHz를 지원하고, 향후 제품들이 1866MHz까지 보고 있는 상황에서 1333MHz라는건 LPDDR4와 LPDDR3 사이에 있는 애매한 값이니까요.

어쨌든 1333 이라도 최대 10666, 보통 800~933에 머무는 LPDDR3보다는 높은 클럭(=대역폭)인데 점수가 비슷한건 메모리 관련 IP에 원인이 있지 않을까 싶습니다.

화웨이 발표를 보면 메모리 사양이 LPDDR3/4 Combo 인데 (둘 다 지원하다는거.) 자체 IP를 썼거나 기존 IP를 활용해 커스텀했을 가능성이 있습니다.

그 때문에 네이티브 LPDDR4 지원보다 성능이 떨어지고 LPDDR3에 가까운 성능이 나왔다고 볼 수 있습니다.

(가설이지요.)

 

 

 

원점수 입니다.

화웨이 발표는 2.3GHz 였지만 GFX벤치 시스템 정보로 보아 2.2x GHz로 보입니다.

(링크 : 하이실리콘 기린950 GFX벤치 분석. (HiSilicon Kirin 950, Mali-T880))

아난드텍 정보로는 2304 2016 1805 1517 1210 807 480 로 클럭 단계가 나옵니다.

 

눈에 띄는건 단연 엄청난 멀티코어 점수.

A72와 높은 클럭 덕이라고 볼 수 있겠지요.

Cortex-A57 2.3GHz 기준으로 계산해봐도 정수는 비슷한 수준의 점수가 나올 수 있으나, 부동소수점과 메모리 점수는 확연한 차이를 보입니다.

성능만 보고 단순히 A57의 오버클럭 버전이라고 저평가할 수 없는 차이이고, 여기에 전력까지 포함한다면 A72의 장점은 더욱 커집니다.

 

위에서 싱글 메모리 점수가 낮게 나왔다고 했는데, MT8173까지는 아니더라도 스냅620 수준까지 나와준다고 가정하고 계산하면 현재 1710 에서 1800 이상까지 올라갈 수 있습니다.

만약이지만 LPDDR4가 탑재된다면 점수는 더 올라갈 수 있을듯.

 

update 2015.12.05.

앞서 얘기한대로 점수는 사양대비 나올만큼 나온듯 합니다.

메모리 점수도 확실히 올라왔고 싱글코어 총점도 올라갔습니다.

 

- SPECint 2000

아난드텍 결과를 보면 64비트 2.3GHz 1913점으로 0.830/MHz 입니다.

32비트에서는 0.77/MHz

이전 엑시노스7420 결과를 보면 64비트 0.847/MHz, 32비트 0.650/MHz 였습니다.

이번에 비교군으로 엑시노스7420 64비트를 다시 테스트한듯한데 일부 결과가 폭락하면서 0.700/MHz가 됐습니다. (어느 쪽을 써야될지 모르겠네요.)

0.700/MHz라고 해도 아주 뜬금없는 숫자는 아니니 써도 괜찮을듯 하긴한데 결과가 낮아진 경위에 대한 언급이 없는게 석연치 않습니다.

 

어쨌든 저 수치를 그대로 쓴다면 A57 -> A72 에서 성능 향상은 +18% 정도입니다.

 

 

- 성능/전력

화웨이에서는 전력 자료도 공개했습니다. (훌륭합니다.)

 

A57 대비

Spec2006 기준 클럭당성능 +11%

 

4코어 클러스터 기준 면적 -18% (1코어 기준 -11%)

이전 자료에서는 4코어 클러스터 기준 면적 -10% (1코어 기준 -8%)였는데 더 줄었습니다.

ARM이 16FF+ 공정에서 대해 POP(Process Optimization Pack)을 제공한다고 했는데 이 영향일지도?

(A72 쿼드, T880MP4 사양은 미디어텍 Helio X20에서도 보이는데, POP 지원때문에 자주 보이는걸지도 모르겠습니다.)

 

소비전력을 보면 Dynamic Power -20%, Static Power -27% 입니다.

2.3GHz 기준으로 보면 909mW -> 713mW로 A57 대비 -22% 입니다.

그런데 아래 성능-전력 그래프를 보면 713mW 포인트에서의 A72 클럭은 2.0GHz 정도로 계산됩니다.

위의 전력 자료 수치는 2GHz 이상의 고클럭 기준이 아니라, 상대적으로 전압이 낮은 저클럭 기준이거나 RTL 기준 자료일 가능성이 높아보입니다.

 

즉, 이걸로 기린950의 절대적인 소비전력을 계산할 순 없습니다.

A72와 A57의 전력, 성능을 비교하는 자료에 그칠듯 합니다.

 

(링크 : http://pc.watch.impress.co.jp/docs/news/event/20160106_737718.html)

발표 중 SPECint 2006 점수를 공개했는데 클럭당점수로 보면 기린950이 엑시노스7420보다 11% 높습니다.

앞서 밝힌 부분과 일치하는 내용입니다.

 

(링크 : Cortex-A72 성능, 전력 자료. (source : 화웨이))

전력관련 이전 자료.

 

i5라는 센서 모니터링 co-processor가 들어간다고 합니다.

기존 i3 대비 소비전력이 60mA -> 6.5mA 로 크게 줄었다는듯.

 

A72 성능 그래프의 각 포인트에서의 성능과 전력을 높은 곳부터 보면,

Max - 11486 DMIPS, 1456mW -> 2.53GHz, 4.54 DMIPS/MHz / 2.3GHz, 4.99 DMIPS/MHz

2nd - 10521 DMIPS, 1015mW -> 2.3GHz, 4.57 DMIPS/MHz / 2.1GHz, 4.99 DMIPS/MHz

3rd - 9210 DMIPS, 711mW -> 2.05GHz, 4.49 DMIPS/MHz / 1.85GHz, 4.99 DMIPS/MHz

 

A57은 4.1 DMIPS/MHz 로 알려져 있습니다.

A72가 A57 대비 +11%로 가정해서(앞서 나온 Spec2006 기준) 4.55 DMIPS/MHz로 잡고 Max 포인트 클럭을 계산하면 2.52GHz 입니다.

2.3GHz로 계산하면 4.99 DMIPS/MHz 가 됩니다.

다른 기사를 보면 최대 2.53GHz까지 가능하다는 내용이 있는데 이 클럭에서의 성능, 전력인 것으로 보입니다.

(링크 : http://www.gsmarena.com/the_kirin_950_soc_was_officially_unveiled_today_in_beijing-news-14843.php)

 

2nd 포인트를 화웨이 발표치인 2.3GHz 로 잡으면 4.57 DMIPS/MHz가 나옵니다.

3rd 포인트를 2.0GHz 정도로 잡으면 4.60 DMIPS/MHz가 됩니다. 2.1GHz까지는 아니고 2.05GHz 내외인듯.

 

A72 성능을 4.5~4.6 DMIPS/MHz 내외로 잡으면 A57 대비 +10% 정도.

4.99 DMIPS/MHz로 잡으면 +22%가 되는데 이건 상승치가 너무 높은듯 합니다.

A57이 4.1 DMIPS/MHz로 알려져있었는데 사실 그것보다 더 높았다는 가설이 가능합니다.

한 번에 4.99/4.21 = +21.7%가 아니라 같은 비율로 단계적으로 올라갔다고 가정하면, +10.3%, +10.3%로 계산됩니다.

4.1 DMIPS/MHz x1.103 = 4.52 DMIPS/MHz 가 됩니다.

정리하면 A57 4.4~4.5 DMIPS/MHz, A72 4.99 DMIPS/MHz

혹은 A57 4.1 DMIPS/MHz, A72 4.5~4.6 DMIPS/MHz 정도가 될듯 합니다.

 

이 자료대로면 A72 싱글코어 기준 최대사양(2.53GHz ? 2.3GHz ?)에서 1.5W 입니다.

16FF+ 공정의 힘이겠지요.

 

update 2016.01.07

아난드텍 정보로는 클럭 단계가 2304 2016 1805 1517 1210 807 480 이라고 합니다.

전력 측정치를 보면 2.3GHz에서 1.375W 입니다.

위 그래프에서 계산한 1.456W와 비슷한 값입니다.

따라서 가장 높은 성능 포인트는 2.3GHz인듯 합니다.

(포인트 개수도 딱 7개네요. 그냥 저 클럭대로 대입되는듯.)

그 기준으로 계산하면 Cortex-A72 Dhrystone 성능은 4.99~5.2 DMIPS/MHz 정도로 나옵니다.

 

 

- 16FF+ 공정과 생각보다 낮은 클럭?

앞서 언급했듯이 최대 2.53GHz 가능하다고 했고, ARM에서도 14/16nm 공정에서 A72가 최대 2.5GHz라고 밝히고 있습니다.

(링크 : ARM Cortex-A72 세부정보 공개. (Update 2015.05.30))

 

같은 Cortex-A72 이면서 28HPM 공정인 스냅620이 1.8GHz입니다.

TSMC에서 공개한 공정 성능 자료로 계산해보면 28HPM -> 16FF+ 의 speed gain은 +60% 입니다.

28HPM -> 16FF 는 +38%

(링크 : 애플 A9 논란에 관하여. (삼성, TSMC 공정 비교.))

 

화웨이가 밝힌 2.53GHz 기준이면 2.53/1.8 = +40% 이고, 2.3GHz 기준이면 2.3/1.8 = +28% 입니다.

2.5GHz 기준으로는 2.5/1.8 = +39%

화웨이가 당장 2.3GHz로 출시한건 그럴 수 있습니다.

최신 공정을 사용했기때문에 안정화가 덜 되었을 가능성도 있고, 후속 제품에서의 클럭상승을 위해 마진을 남겨뒀을 가능성도 있으니까요. (엑시노스처럼)

하지만 2.5GHz는 ARM, 화웨이 모두 언급한 내용이기때문에 16FF+ 공정에서 A72의 최대 클럭이라고 볼 수 밖에 없습니다.

 

2.53GHz 기준으로봐도 speed gain은 16FF 수준입니다.

공정은 16FF+ 인데 성능은 16FF인겁니다.

특히 2.5GHz으로 했을 때 나온 +39%는 TSMC가 언급한 수치와 일치합니다.

뭔가 의문 혹은 음모론이 떠오를 수 밖에 없습니다.

TSMC가 공개한 공정 성능 자료가 과정된게 아닌가 하는거지요.

 

20SOC 공정인 Helio X20을 보면, 코어 개수 차이가 있지만 A72 2.0GHZ, Mali-T880MP4 700MHz 입니다.

TSMC 자료에서 28HPM -> 20SOC에서 speed gain이 +15% 인데,

스냅620과 비교해서 CPU 클럭 상승이 2.0/1.8 = +11% 입니다. 들어맞는다고 봐야겠지요.

GPU를 보면 20SOC -> 16FF+에서 speed gain이 +40% 인데, 클럭은 900/700 = +29% 입니다.

20SOC -> 16FF+에서 speed gain이 +20%이고, 이 수치를 넘어간걸봐서는 클럭은 올라간만큼 올라간듯 하고 900MHz라는 절대적인 값이 높아서 더 이상 못 올라간게 아닌가 싶습니다.

 

기존에 16FF 성능으로 알려진 값이 사실 16FF+의 것이었다면 공정 성능 비교는 이렇게 바뀝니다.

(링크 : 애플 A9 논란에 관하여. (삼성, TSMC 공정 비교.))

이렇게 되면 삼성 14LPE와 16FF의 공정 성능 우위가 바뀌게 됩니다.

 

하지만 거꾸로 스냅620 클럭이 너무 높은 경우도 생각할 수 있습니다.

speed gain으로 역산하면 28HPM에서 A72 클럭은 1.68GHz로 계산됩니다. (2.53/1.6 = 1.68)

퀄컴이 최대 1.8GHz라고 발표했으나 실제 벤치마크의 시스템 정보상으로는 1.7GHz 입니다.

(링크 : https://gfxbench.com/device.jsp?benchmark=gfxgen&os=Android&api=gl&D=Qualcomm+msm8952+%28Adreno+510%2C+development+board%29&testgroup=info)

역산한 값과 일치하지요.

 

현재로는 TSMC 발표치가 틀리지 않았다고 볼 수 있는 상태입니다.

실제 이럴지, 단순히 양산 초기의 문제인지는 16FF+ 공정으로 나오는 다른 제품을 봐야 알 수 있을듯 합니다.

(저 자료가 정확하다고 할 수도 없고, 잘못 해석했다는 사람도 있으니......)

 

(링크 : http://pc.watch.impress.co.jp/docs/news/event/20160106_737718.html)

CES2016에서 화웨이 메이트8 발표 중 나온 공정별 전력효율 비교 차트입니다.

TSMC에서 표현하는 Speed, Power를 기준으로 본다면 Power gain의 역수나 Speed gain으로 볼 수 있을듯 합니다.

주목할건 20SOC 공정이 28HPM 대비 거의 이득이 없다는 것고, 삼성 공정과 16FF+ 사이의 차이가 그렇게 크지 않다는겁니다. (아마 삼성 공정은 14LPP 기준이겠지요?)

전에 A72 정보를 다루면서 28HPM과 20SOC의 Speed gain 차이가 5~6% 정도일 가능성을 언급한적이 있었는데 이런 식으로 나오니 진짜인가 싶기도 합니다.

(링크 : ARM Cortex-A72 성능 추정.)

기존에는 공정 성능 비교를 업체 발표치만으로 해서 부정확했을 가능성이 높은데, 이번 정보는 고객사 입장에서 받은 직접적인 정보였을 가능성이 높기때문에 아무래도 신뢰도가 더 높지 않을까 싶습니다.

 

 

- 정리

1. 사양

하이실리콘 기린950

Cortex-A72 2.3GHz 쿼드코어 + Cortex-A53 1.8GHz 쿼드코어.

LPDDR3/4 지원. (LPDDR4-1333)

Mali-T880MP4 900MHz

LTE Cat.6 모뎀. (원칩)

TSMC 16FF+ 공정

 

2. 긱벤치3 결과

LPDDR3 LPDDR4 탑재 추정.

LPDDR4 탑재

A72 + 공정으로 인한 고클럭 -> 멀티코어 점수 높음.

 

3. Dhrystone 성능.

A57 4.4~4.5 DMIPS/MHz

A72 4.99~5.20 DMIPS/MHz

혹은

A57 4.1 DMIPS/MHz

A72 4.5~4.6 DMIPS/MHz

 

4. 전력/면적

A72 : A57 대비 전력 -20%, 면적 -10%

싱글코어 기준 최대 1.5W

 

 

- update 2015.12.05. 기린950 점수 갱신.

- update 2016.01.07 추가 정보 추가로 내용 수정.

(링크 : http://www.anandtech.com/show/9878/the-huawei-mate-8-review/5)

(링크 : http://pc.watch.impress.co.jp/docs/news/event/20160106_737718.html)

 

 

 

반응형

댓글