본문 바로가기
스마트폰/mobile GPU

ARM Mali-T800 시리즈 발표. (T860/T830/T820)

by gamma0burst 2014. 11. 1.
반응형

 

- ARM에서 새로운 IP를 공개했습니다.

GPU Mali-T800 시리즈, 비디온 엔진 Mali-V550, 디스플레이 엔진 Mali-DP550

물론 여기서는 GPU만 볼겁니다.

개인적으로는 표면적으로 T700에 비해 새로울게 없고, 공개한 내용도 애매한 수치들이라 그리 인상적이지 않았습니다.

 

 

- 공통 사항

1. 미드가르드 아키텍처 (Midgard)

Mali-T800 은 기존의 미드가르드 아키텍처를 그대로 따르는 것으로 보입니다.

다만 완전히 같지는 않은 것으로 보입니다.

소위 말하는 Tri pipe 구조를 그대로 따른다고 하는게 정확하겠네요.

 

2. 메모리 대역 절감

 

 

 

ASTC (Adaptive Scalable Texture Compression)

AFBC (Arm Buffer Frame Compression)

을 통해 메모리 대역폭을 절약합니다.

메모리 대역폭 요구량, 메모리 대역폭에 대한 압박을 줄인다는거고 이는 소비전력 절감에도 도움이 됩니다.

 

TE (Transcational Elimination)

SC (Smart Compression)

MSE (Motion Search Elimination)PLS (Pixel Local Storage)

을 통해 불필요한 작업 줄인다는데, 얼마나 효용이 있을지는 두고 볼 일.

 

3. 지원 API

OpenGL ES 3.1/3.0/2.0

OpenCL 1.2/1.1

Direct 3D 11.1

Renderscript

 

 

- Mali-T830/T830

 

1. Mali-T820

최대 4코어(MP4) 구성.

1코어당 1alu 구성입니다.

이는 기존 T720과 같은 구성입니다.

아키텍처도 기존과 같은 미드가르드 아키텍처입니다.

(링크 : ARM Mali-T760/720 분석.)

 

성능은 MP4 650MHz 기준, 400Mtri/s, 2.6Gpix/s

(링크 : http://www.arm.com/products/multimedia/mali-cost-efficient-graphics/mali-T820.php)

T720과 비교하면 같은 사양에서 픽셀성능은 동일, Triangle 성능은 +23% 입니다.

 

ARM의 주장에서는 T622과 같은 사양, 같은 공정에서

면적대비성능 +50%,

전력대비성능 +15%

대역폭(요구량) -25%

면적감소 10%

라고 하는데 T622 탑재 제품이 나온적이 있어서 비교를 하든말든 하지요.

 

그래도 T700 발표 때보다는 양심적입니다.

그 때는 사양이나 공정 조건 얘기도 없이 막연하게 T604 대비 전성비 400% 같은 소리를 하고 있었습니다.

 

2. Mali-T830

최대 4코어(MP4) 구성.

1코어당 2alu 구성입니다.

기존 T760과 같은 구성입니다.

T820처럼 기존과 같은 미드가르드 아키텍처입니다.

(링크 : ARM Mali-T760/720 분석.)

 

성능은 MP4 650MHz 기준, 400Mtri/s, 2.6Gpix/s 로 T820과 같습니다.

(링크 : http://www.arm.com/products/multimedia/mali-cost-efficient-graphics/mali-t830.php)

T720과 비교하면 같은 사양에서 픽셀성능은 동일, Triangle 성능은 +23% 입니다.

1코어당 2alu로 T820의 두 배이니 연산성능은 T820의 두 배입니다.

 

ARM의 주장에서는 T622과 같은 사양, 같은 공정에서

면적대비성능 +50%,

전력대비성능 +15%

대역폭(요구량) -25%

3D 성능 +55%

라고 하는데 이 역시 T622 탑재 제품이 나온적이 있어서 비교를 하든말든 하지요.

 

 

- Mali-T860

 

최대 16코어(MP16) 구성.

1코어당 2alu 구성입니다.

기존 T760과 같은 구성입니다.

기존과 같은 미드가르드 아키텍처입니다.

(링크 : ARM Mali-T760/720 분석.)

 

성능은 MP16 695MHz 기준, 1390Mtri/s, 11.2Gpix/s

(링크 : http://www.arm.com/products/multimedia/mali-performance-efficient-graphics/mali-t860.php)

T760과 비교하면 같은 사양에서 픽셀성능, Triangle 성능 모두 동일합니다.

 

 

ARM의 주장에서는 T628과 같은 사양, 같은 공정에서

전력대비성능 45%

3D 성능 +37% (하이엔드 게이밍 그러면 3D 벤치마크 정도에 해당.)

 

일단 같은 사양 기준에서 보면 T628 -> T760 에서 15%의 성능 향상이 있었습니다.

(링크 : RK3288로 보는 Mali-T760 성능.)

MP6 이상의 고사양에서는 10% 정도의 성능 향상이 있었습니다.

(링크 : 엑시노스5433 (Exynos5433) GFXBench 분석. (Mali-T760MP6, 갤럭시 노트4))

 

높은 쪽인 15%를 적용한다면,

T628 -> T760 : +15%

T628 -> T860 : +37%

즉, T760 -> T860 : +19% (대략 20%)

 

 

- 잡담 및 찌라시

T700 후속작 관련 찌라시를 보면 T700 대비 20~30% 향상이라고 합니다.

연산성능은 40% 향상.

동일 MP일 때 기준이라니 아무래도 동일 사양 기준인듯 합니다.

 

ARM 얘기대로면 T860이 T760 대비 +20% 이니 20% 향상이라는건 T860을 얘기하는듯 한데, 문제는 30% 향상입니다.

T628 -> T760이 불과 +10~ +15%인데, 같은 제품으로 어떤건 +20%, 어떤건 +30%가 나올거라 생각하기 힘듭니다.

이번에 발표되지 않았지만 T860보다 더 높은 라인업의 제품이 있을 가능성이 있습니다.

 

여기서 걸리는데 T820/T830에서 alu/core 라는 표현을 썼다는겁니다.

예전같지 않은 모습이지요.

그렇다면 코어당 alu라는 개념을 최근 신경쓴다는 얘기이고, alu/core 숫자가 기존과 다른 제품이 있을 가능성이 있습니다.

 

예전 라인업을 보면 Mali-T658/T678 이라고 4alu/core인 제품이 있었습니다.

하지만 결국 못 나오고 라인업에서까지 사라져버렸습니다.

문제가 다이사이즈 증가에 따른 수율 저하/원가 부담일수도 있고, 다이사이즈 증가에 비해 성능 증가가 크지 않을수도 있습니다.

어쨌든 4alu/core로는 상업성이 떨어진다고 밖에 볼 수 없습니다.

 

4alu/core 구성이라면 동일 사양에서 연산성능은 2배가 되어야합니다.

4alu/core에 +40%가 되려면 alu당 연산성능이 60%로 떨어져야합니다.

현재 미드가르드 아키텍처가 17 Flops인데, 60%면 10 Flops가 됩니다.

그런데 T860은 미드가르드 아키텍처를 따르고 있지요.

alu당 연산성능이 떨어진다고 보기 힘듭니다.

 

T700 대비 성능 30% 향상, 연산성능 40% 향상을 맞추려면 새로운 아키텍처여야 합니다.

4alu/core가 안 맞으면 3alu/core로 타협해볼 수 있을텐데, 연산성능 향상을 맞추려면 alu당 연상성능이 93% 수준으로 떨어져야합니다.

16 Flops 정도로 나오는데 기존보다 크게 떨어지지 않는 수준입니다.

 

어디까지나 찌라시를 근거로 한 추측이니 있을지 없을지도 모르겠고, 있다해도 나올지 안 나올지도 모르겠고.

 

 

 

반응형

댓글