본문 바로가기
스마트폰/mobile GPU

ARM Mali-T760/720 분석.

by gamma0burst 2013. 11. 14.

http://www.arm.com/about/newsroom/arm-announces-complete-suite-of-graphics-processing-technology.php
http://www.arm.com/products/multimedia/mali-mid-range-graphics/mali-t720.php
http://www.arm.com/products/multimedia/mali-high-end-graphics/mali-t760.php
http://pc.watch.impress.co.jp/docs/column/kaigai/20131101_621747.html

ARM Techcon 2013에서 새 GPU인 Mali-T700 을 설명(발표)했습니다.
이번에 발표된 제품은 두 가지입니다.


- Mali-T760
먼저 Mali-T760 입니다.




기존 하이엔드 GPU의 연장선상에 있습니다.
T604보다 에너지 효율이 400% 향상되었다고 하는데 이는 차기 공정(16nm FinFET인듯)을 기준으로 하는 말인듯 합니다.



API는 OpenGL ES 3.0, Full Profile OpneCL 1.1, Direct3D 11.1 지원.





프레임 버퍼 압축기술인 AFBC(ARM Frame Buffer Compression)를 지원합니다.
(이름 참 쉽게 지었네요.)
아래 그래프를 보면 GL벤치마크에서 압축률이 50%을 넘습니다.







GPU 구조는 크게 변경된 편입니다.
병렬도가 높아졌는데 Snoop 유닛이 있어서 코어사이의 일관성을 유지합니다.
작업 스케줄링 부분을 개량해 효율을 높였는데, 파이프라인 스테이지가 줄어들고 클럭의 상한선이 낮아졌다고 합니다.
이런 개량을 통해 다이 크기 효율이 상승했을 것으로 추측됩니다.
전체적으로 클럭은 낮추고 연산유닛은 늘리고 효율은 높인 구조입니다.
(고사양 저클럭 그러니까 애플 AP의 GPU가 생각나네요.)



최대 16코어까지 확장가능합니다.
L2 캐시는 1MB (512KB x2)
600MHz에서
픽셀 필레이트 : 9.6 Gpix/s
트라이앵글 : 1066.6 MTri/s
연산성능 : 326.4 GFLOPS

Mali-T600 계열이었다면 이 사양에서 1371.4 MTri/s 이 나올텐데 이보다는 낮네요.
중간에 추가된 Advanced Tiling Unit 덕인 것 같기도 하지만, 쉐이더 코어를 제외하면 기존 구조의 재탕에 가까운 T720도 비슷한 경향을 보이는 것으로 봐서는 코어 아키텍처 개선의 영향인듯 합니다.
이론치 간의 비교이니 실제 성능이 더 높게 나오는게 중요하겠지요.
이걸로 전보다 나아졌네 나빠졌네 평가하기는 이른듯 합니다.

연산성능으로 보건데 1코어당 ALU는 2개입니다.
T604, T62x와 같은 수준이고, T678의 절반입니다. (T678은 1코어당 4ALU입니다.)
T628MP6, T678MP8, T760MP16 을 동클럭에서 비교해보면 다음과 같습니다.
(1/8?? 1/9??)

 Clock : 600MHz  T628MP6  T678MP8   T760MP16 
 Pixel Fillrate (Mpix/s)  3600  4800   9600
 Triangle Rate (MTri/s)  514.3  685.7  1066.6 (1200?)
 FP Perf (GFLOPS)  122.4  326.4  326.4

T678MP8, T760MP16을 비교해보면 T760의 컨셉을 알 수 있습니다.
T760으로 넘어가면서 그래픽성능은 1.6~2배 가까이 상승한데 반해 연산성능은 그대로 입니다.
현 상황에서 그다지 중요하지않은 연산성능은 (사실상) 줄이고 좀 더 중요한 그래픽 성능을 올리는,
현실적인 성능 구조를 갖는다고 볼 수 있습니다.


- Mali-T720
다음은 Mali-T720 입니다.



기본적인 특징은 T760과 같습니다.
다만 T720은 Mali-400의 연장선상에 있습니다.
중저가형 라인업이라는거지요.





시스템 구성도 저가형 스마트폰을 예로 들고 있습니다.
Cortex-A7/A12, 메모리 싱글채널 등등.





최대 8코어까지 확장가능합니다.
L2 캐시는 256KB (128KB x2)
T62x 대비 다이 크기는 30% 감소.
기존 제품(Mali-400/450 인듯) 성능 50% 향상.
600MHz에서
픽셀 필레이트 : 4.8 Gpix/s
트라이앵글 : 533.2 MTri/s
연산성능 : 81.6 GFLOPS

연산성능으로 보건데 1코어당 ALU는 1개입니다.
T604, T62x의 절반 수준입니다.
저가형이라 부를만큼 심하게 줄여버렸습니다.
T604, T628MP6과 동클럭에서 비교해보면 다음과 같습니다.

 Clock : 600MHz  T604  T628MP6  T720MP8 
 Pixel Fillrate (Mpix/s)  2400  3600  4800
 Triangle Rate (MTri/s)  342.9  514.3  533.2 (600?)
 FP Perf (GFLOPS)  81.6  122.4  81.6

동클럭에서 코어 수가 절반인 T604와 연산성능이 같고, T628MP6과 비교하면 2/3 입니다.
대신 T604에 비해 그래픽 성능은 1.6~2배로 올라갔습니다.
심지어 T628MP6보다도 높지요.
T720도 라인업만 다를뿐 T760과 같은 컨셉인겁니다.
연산성능보다 그래픽 성능을 중시한거지요.


- 요약 정리.
Mai-T700 은 연산성능보다 그래픽성능을 중시하는, 보다 현실적인(실용적인) 구조를 갖춘 것으로 보입니다.



댓글