스마트폰/ARM Holdings

ARM Cortex-A75/A55, Mali-G72 발표.

gamma0burst 2017. 6. 6. 21:21
반응형

 

- ARM에서 Cortex-A75/A55, Mali-G72 를 발표했습니다.

이미지 출처는 아래와 같습니다.

(링크 : http://www.anandtech.com/show/11441/dynamiq-and-arms-new-cpus-cortex-a75-a55 http://www.anandtech.com/show/11459/arm-announces-malig72-bifrost-refined-for-the-highend-soc)




- Cortex-A75

이전에 나왔던 로드맵 대로라면 코드네임 프로메테우스(Prometheus)에 해당합니다.

750mW 이상 구간은 추가성능 헤드룸으로 잡은걸 봤을 때 Ares는 아닌듯 합니다.




 

(왼쪽 : Cortex-A73, 오른쪽 : Cortex-A75)

2-wide decode -> 3-wide decode

dispatch 최대 4 -> 6 µops/cycle

각 파이프라인이 공유하던 issue queue를 파이프라인별 분리.

파이프당 최대 issue 8 µops/cycle로 증가.

NEON/FP 측 dispatch 최대 2 -> 3 µops/cycle


A73 대비 SPECINT +22%, SPECFP +33%, 긱벤치 +34%

긱벤치 기준이 싱글코어 총점이고 정수, 부동소수점 항목 클럭당점수 상승치가 SPECINT/FP와 같다고 가정하면, 메모리 점수는 +57% 상승했고 A75 2.4GHz 기준 긱벤치4 싱글코어 총점 2500점 정도로 계산됩니다.

다만 A57, A73의 경우 SPECINT가 상승하는만큼 긱벤치 정수 점수가 오르지는 않았습니다.

(SPECINT/FP는 아키텍처 사양 변화가 거의 그대로 결과에 반영되는 경향이 있는듯.)

SPECINT2000이 11% 오를 때 긱벤치 정수 점수는 3~4% 오르는데 그쳤습니다.

이런 추세라면 긱벤치 기준 상승치는 정수 +13% 내외, 부동소수점 +23% 내외로 볼 수도 있겠으나 어디까지나 추측의 영역이고 실제 벤치마크 결과가 나와봐야 확실해질듯 합니다.


화면이 큰(=방열 면적이 큰) 제품에서는 TDP 여유도 커지기 때문에 코어당 전력 최대치가 더 올라가고,

그에 따라 성능(=클럭)이 더 올릴 수 있다는겁니다.

0.75W에서 2W면 전력이 2.7배나 늘어나는데 클럭은 8% 밖에 늘어나지 않는건 전력 효율상 좋은건 아니지만요.

아래 그래프를 보면 10nm에서 A75 타겟 클럭이 3.0GHz인듯한데 이 정도가 전력 효율이 보장되는 한계 클럭으로 보입니다.


그래프 높이로 성능비를 계산해보면 A57 : A72  : A73 : A75 = 1 :  1.3 : 1.5 : 1.92 입니다.

아래 클럭을 써서 동클럭 기준으로 환산하면 1 : 1.14 : 1.13 : 1.35

A73 대비 A75가 +19%로 위에서 나왔던 SPECINT2006과 비슷한데 정확한건 불명.



- Cortex-A55

이전에 나왔던 로드맵 대로라면 코드네임 아난케(Ananke)에 해당합니다.

머큐리(Mercury)는 Cortex-A35에 해당하는 포지션.


 

(왼쪽 : Cortex-A53, 오른쪽 : Cortex-A55)

Load/Store 강화


A53 대비 전력 효율 +15%

A53 대비 SPECINT +18%, SPECFP +38%, 긱벤치 +21%



- Mali-G72

유출됐던 로드맵대로면 G71이 Mimir였으니 G72가 찌라시에 나오는 헤임달(Heimdallr)일 가능성이 높아 보입니다.

(Heimdallr로 표기할지, Heimdall로 표기할지 모르겠지만 영어권 경향 생각하면 Heimdall로 할듯?)



2017년 디바이스 대비 성능 1.4배.

2017년 디바이스라면 엑시노스8895 얘기일 가능성이 높습니다.

성능 얘기는 뒤에서 다시 하지요.



발전된 렌더링 기술로 대역폭 감소.


동일 공정 노드, 비슷한 조건에서

에너지 효율 +25%

최대 MP32

성능 밀도 +20%


전력 효율이 +25%인데 GPU에 할당되는 최대 전력이 거의 바뀌지 않는걸 고려하면 최대 성능이 +25% 올라갔다고 봐야합니다.

성능이 +25% 올라갔는데 성능 밀도가 +20%만 올라갔다는건 면적이 +4.2% 정도 증가했다는 해석이 가능합니다.


동일 공정에서 성능 +25%라고 했는데 여기에 추가로 10LPE -> 10LPP에서의 성능 게인 +10%를 반영하면 +37.5%가 됩니다.

(동일 공정 노드라는게 10LPE와 10LPP 간의 비교일 수도 있겠으나 비슷한 조건을 맞췄다니 클럭 차이가 없는 조건의 결과라고 보면 같은 공정 간 비교라봐도 무리는 없을듯.)

G71 발표 때 보면 성능 1.5배라고 했는데 실제 거기에 가장 잘 들어맞았던게 맨해튼3.0 +46% 였습니다.

(링크 : ARM Mali-G71 발표. (코드네임 : 비프로스트, Bifrost))

성능 1.4배라는게 맨해튼3.0 기준 +37.5% 얘기일지도 모르겠습니다.

엑시노스8895(64.3 fps)의 1.375배라면 맨해튼3.0 기준 88.4 fps가 됩니다.

(+40%라면 90 fps)


G71 발표시 나왔던 내용과 차기 엑시노스 내용이 나름 잘 맞아들어갔기에 이번에도 차기 엑시노스를 추측해볼만 합니다.

차기 엑시노스(엑시노스9810?)는 현재 삼성의 공정 이행 추세상 10LPP 공정일 가능성이 높은데 엑시노스8895의 10LPE와 비교해서 면적 감소는 없습니다.

엑시노스8895의 G71MP20이 성능을 위해 한계까지 면적을 늘린 결과로 생각되는데, G72가 G71 대비 면적이 +4.2% 정도 증가했다면 MP수는 오히려 줄어들어야 합니다.

20 / 1.042 = 19.2 , MP19로 나옵니다.


오늘 올라온 엑시노스9610 찌라시를 보면 A73 x4 + A53 x4 구성인데 엑시노스9610 CPU 성능이 이 정도라면 그보다 상위 라인업인 엑시노스9810 CPU 성능이 8895 대비 크게 오를 가능성이 높습니다.

(A73 쿼드라면 엑시노스M2 쿼드와 라인업 차이를 둘 만큼 성능 차이가 크지 않음.)

그러기 위해서는 CPU 규모가 커져야 할 것이고 GPU에 할당되는 면적이 줄어들 가능성이 있어, 계산상 MP19 지만 실제 더 줄어들 가능성도 있습니다.


위에서 했던 가정대로라면 동클럭에서 G71MP20 -> G72MP19 ? 에서 성능이 +25% 라는게 됩니다.

MP19 라면 MP1 당 성능이 G71 대비 +32%

MP수를 더 낮춰서 계산해보면 MP18 : +39%, MP17 : +47%, MP16 : +56% 입니다.

실제 동클럭 조건이 아니고 G72쪽 클럭이 더 높을 경우까지 고려한다해도 T880 -> G71에서 성능 향상이 +25% 정도였던걸 감안하면 MP18 미만일 가능성은 낮아 보입니다.

 

 

 

반응형