본문 바로가기
스마트폰/ARM Holdings

ARM Cortex-A72, Mali-T880 발표.

by gamma0burst 2015. 2. 7.
반응형

 

- ARM에서 새로은 IP 제품군을 발표했습니다.

CPU 코어 : Cortex-A72

GPU 코어 : Mali-T880

인터커넥트 : CCI-500

 

CPU, GPU 코어는 아래에서 자세히 다루기로 하고, CCI-500은 간단히 ARM 소개 내용만 보고 지나가겠습니다.

 

- CCI-500

Cache Coherent Interconnect

Snoop Filter 통합이 가장 큰 변화.

캐시 일관성 유지를 위해 기존엔 빅리틀 I/O의 각 클러스터가 서로 메모리 참조를 실행했지만, CCI-500은 캐시된 메모리 태그를 저장하는 snoop filter를 통합하여 효율화.

이를 통해 소비전력 12% 절감.

기존 CCI-400 대비 최대 메모리 대역폭 2배, 메모리 성능 30% 증가.

 

 

- Cortex-A72

기존에 코드네임 Maia(Maya)로 알려진 제품이 이것으로 보입니다.

28nm A15와 16nm FinFET A72를 비교하면, (TSMC 공정)

동일 전력제한에서 Sustained 성능 3.5배.

동일 작업에서 소모전력 -75% (1/4 수준)

(20nm A57과 비교하면, 동일 작업에서 소모전력 -55%)

16nm FinFET에서 A72는 최대 2.5GHz가 가능하다고 합니다.

Cortex-A53과 빅리틀 구성이 가능합니다.

 

3.5배라는건 약간 훼이크에 가까운 표현으로 보입니다.

최대 성능이 아닌 유지성능(Sustained Performance) 기준이기때문입니다.

스마트폰 전력 제한 하에서 지속적으로 낼 수 있는 성능을 얘기하는겁니다.

쓰로틀링까지 고려한 현실적인 체감성능이라고 볼 수도 있습니다.

 

'동일 작업에서 소모전력 -75%'

이건 최대 전력이 아닙니다.

어떤 작업을 끝낼 때까지 소모한 총 에너지를 얘기하는겁니다.

 

 

- Cortex-A72 자료 분석이 가능한가?

저 자료만으로 A72의 성능을 분석할 수 없습니다.
공정 간 전력 차이에 대해서는 어느 정도 나와있는 자료가 있습니다.

하지만 거기에 추가로 각 공정에서 아키텍처의 클럭당소비전력(mW/MHz)에 대한 정보가 있어야, A72의 클럭당성능을 계산할 수 있고 A57과 비교할 수 있습니다.

그런 정보가 인터넷에 돌아다닐리가 없지요.

특히 결정적으로 16nm 공정에서의 전력 자료가 있어야하는데 최신공정 최신 아키텍처에 대한 자료가 그렇게 공개되서 돌아다닐 가능성은 없다고 봐야하고요.

 

지난 번 테그라X1 때도 그렇고 갈수록 업체들이 자료 공개를 이런 식으로 합니다.

(링크 : 엔비디아 테그라 X1 발표. (1) CPU (Tegra X1))

그냥 본인들 주장만 일방적으로 담고 분석이나 비판을 근본적으로 차단하는 식으로 자료를 작성하여 배포합니다.

요즘 트렌드인가요?

 

 

- Mali-T880

T880도 A72 수준까지는 아니지만 아주 최소한 정보만 공개되었습니다.

2014년 Mali-T760 기반 제품 대비 1.8배의 성능.

동일 작업시 소모전력 -40%

 

2014년 T760 기반 제품의 1.8배 성능이라고 하는걸보니,

엑시노스5433(Mali-T760MP6 700MHz) 탑재 갤럭시노트4의 1.8배라는 의미겠지요?

GFX벤치 맨해튼 오프스크린이 17.9 fps이니 T880 탑재 제품은 32 fps 정도는 나오는듯.

(그래봤자 MP 구성, 클럭도 모르니 무슨 의미.)

 

 

기본적으로 T760과 비슷한 구조입니다.

최대 MP16 가능.

 

ARM 사이트에서 공개한 사양은,

MP16 850MHz 기준

1700 MTri/s, 13.6 GPix/s

 

클럭을 고려하면 기존 T760, T860과 같습니다.

(링크 : ARM Mali-T800 시리즈 발표. (T860/T830/T820))

 

 

가장 큰 변화는 쉐이더 코어(shader core)의 ALU 숫자가 기존 2개에서 3개로 늘었다는겁니다.

미드가르드 아키텍처를 그대로 확장한 것이라면 연산성능이 1.5배로 늘어나게 됩니다.

Mali 계열이 다른 GPU에 비해 열세인 원인 중의 하나가 연산성능 부족인걸 생각하면 긍정적인 변화입니다.

(링크 : Adreno330 vs Mali-T628 GFXBench Manhattan 성능 차이 분석.)

 

 

-

계산할게 없으니 내용이 점점 단순 전달로 변질되가는 느낌.

이걸 업체들이 노리는건가.

-

 

 

 

반응형

댓글