- ARM에서 새로운 IP를 공개했습니다.

GPU Mali-T800 시리즈, 비디온 엔진 Mali-V550, 디스플레이 엔진 Mali-DP550

물론 여기서는 GPU만 볼겁니다.

개인적으로는 표면적으로 T700에 비해 새로울게 없고, 공개한 내용도 애매한 수치들이라 그리 인상적이지 않았습니다.

 

 

- 공통 사항

1. 미드가르드 아키텍처 (Midgard)

Mali-T800 은 기존의 미드가르드 아키텍처를 그대로 따르는 것으로 보입니다.

다만 완전히 같지는 않은 것으로 보입니다.

소위 말하는 Tri pipe 구조를 그대로 따른다고 하는게 정확하겠네요.

 

2. 메모리 대역 절감

 

 

 

ASTC (Adaptive Scalable Texture Compression)

AFBC (Arm Buffer Frame Compression)

을 통해 메모리 대역폭을 절약합니다.

메모리 대역폭 요구량, 메모리 대역폭에 대한 압박을 줄인다는거고 이는 소비전력 절감에도 도움이 됩니다.

 

TE (Transcational Elimination)

SC (Smart Compression)

MSE (Motion Search Elimination)PLS (Pixel Local Storage)

을 통해 불필요한 작업 줄인다는데, 얼마나 효용이 있을지는 두고 볼 일.

 

3. 지원 API

OpenGL ES 3.1/3.0/2.0

OpenCL 1.2/1.1

Direct 3D 11.1

Renderscript

 

 

- Mali-T830/T830

 

1. Mali-T820

최대 4코어(MP4) 구성.

1코어당 1alu 구성입니다.

이는 기존 T720과 같은 구성입니다.

아키텍처도 기존과 같은 미드가르드 아키텍처입니다.

(링크 : ARM Mali-T760/720 분석.)

 

성능은 MP4 650MHz 기준, 400Mtri/s, 2.6Gpix/s

(링크 : http://www.arm.com/products/multimedia/mali-cost-efficient-graphics/mali-T820.php)

T720과 비교하면 같은 사양에서 픽셀성능은 동일, Triangle 성능은 +23% 입니다.

 

ARM의 주장에서는 T622과 같은 사양, 같은 공정에서

면적대비성능 +50%,

전력대비성능 +15%

대역폭(요구량) -25%

면적감소 10%

라고 하는데 T622 탑재 제품이 나온적이 있어서 비교를 하든말든 하지요.

 

그래도 T700 발표 때보다는 양심적입니다.

그 때는 사양이나 공정 조건 얘기도 없이 막연하게 T604 대비 전성비 400% 같은 소리를 하고 있었습니다.

 

2. Mali-T830

최대 4코어(MP4) 구성.

1코어당 2alu 구성입니다.

기존 T760과 같은 구성입니다.

T820처럼 기존과 같은 미드가르드 아키텍처입니다.

(링크 : ARM Mali-T760/720 분석.)

 

성능은 MP4 650MHz 기준, 400Mtri/s, 2.6Gpix/s 로 T820과 같습니다.

(링크 : http://www.arm.com/products/multimedia/mali-cost-efficient-graphics/mali-t830.php)

T720과 비교하면 같은 사양에서 픽셀성능은 동일, Triangle 성능은 +23% 입니다.

1코어당 2alu로 T820의 두 배이니 연산성능은 T820의 두 배입니다.

 

ARM의 주장에서는 T622과 같은 사양, 같은 공정에서

면적대비성능 +50%,

전력대비성능 +15%

대역폭(요구량) -25%

3D 성능 +55%

라고 하는데 이 역시 T622 탑재 제품이 나온적이 있어서 비교를 하든말든 하지요.

 

 

- Mali-T860

 

최대 16코어(MP16) 구성.

1코어당 2alu 구성입니다.

기존 T760과 같은 구성입니다.

기존과 같은 미드가르드 아키텍처입니다.

(링크 : ARM Mali-T760/720 분석.)

 

성능은 MP16 695MHz 기준, 1390Mtri/s, 11.2Gpix/s

(링크 : http://www.arm.com/products/multimedia/mali-performance-efficient-graphics/mali-t860.php)

T760과 비교하면 같은 사양에서 픽셀성능, Triangle 성능 모두 동일합니다.

 

 

ARM의 주장에서는 T628과 같은 사양, 같은 공정에서

전력대비성능 45%

3D 성능 +37% (하이엔드 게이밍 그러면 3D 벤치마크 정도에 해당.)

 

일단 같은 사양 기준에서 보면 T628 -> T760 에서 15%의 성능 향상이 있었습니다.

(링크 : RK3288로 보는 Mali-T760 성능.)

MP6 이상의 고사양에서는 10% 정도의 성능 향상이 있었습니다.

(링크 : 엑시노스5433 (Exynos5433) GFXBench 분석. (Mali-T760MP6, 갤럭시 노트4))

 

높은 쪽인 15%를 적용한다면,

T628 -> T760 : +15%

T628 -> T860 : +37%

즉, T760 -> T860 : +19% (대략 20%)

 

 

- 잡담 및 찌라시

T700 후속작 관련 찌라시를 보면 T700 대비 20~30% 향상이라고 합니다.

연산성능은 40% 향상.

동일 MP일 때 기준이라니 아무래도 동일 사양 기준인듯 합니다.

 

ARM 얘기대로면 T860이 T760 대비 +20% 이니 20% 향상이라는건 T860을 얘기하는듯 한데, 문제는 30% 향상입니다.

T628 -> T760이 불과 +10~ +15%인데, 같은 제품으로 어떤건 +20%, 어떤건 +30%가 나올거라 생각하기 힘듭니다.

이번에 발표되지 않았지만 T860보다 더 높은 라인업의 제품이 있을 가능성이 있습니다.

 

여기서 걸리는데 T820/T830에서 alu/core 라는 표현을 썼다는겁니다.

예전같지 않은 모습이지요.

그렇다면 코어당 alu라는 개념을 최근 신경쓴다는 얘기이고, alu/core 숫자가 기존과 다른 제품이 있을 가능성이 있습니다.

 

예전 라인업을 보면 Mali-T658/T678 이라고 4alu/core인 제품이 있었습니다.

하지만 결국 못 나오고 라인업에서까지 사라져버렸습니다.

문제가 다이사이즈 증가에 따른 수율 저하/원가 부담일수도 있고, 다이사이즈 증가에 비해 성능 증가가 크지 않을수도 있습니다.

어쨌든 4alu/core로는 상업성이 떨어진다고 밖에 볼 수 없습니다.

 

4alu/core 구성이라면 동일 사양에서 연산성능은 2배가 되어야합니다.

4alu/core에 +40%가 되려면 alu당 연산성능이 60%로 떨어져야합니다.

현재 미드가르드 아키텍처가 17 Flops인데, 60%면 10 Flops가 됩니다.

그런데 T860은 미드가르드 아키텍처를 따르고 있지요.

alu당 연산성능이 떨어진다고 보기 힘듭니다.

 

T700 대비 성능 30% 향상, 연산성능 40% 향상을 맞추려면 새로운 아키텍처여야 합니다.

4alu/core가 안 맞으면 3alu/core로 타협해볼 수 있을텐데, 연산성능 향상을 맞추려면 alu당 연상성능이 93% 수준으로 떨어져야합니다.

16 Flops 정도로 나오는데 기존보다 크게 떨어지지 않는 수준입니다.

 

어디까지나 찌라시를 근거로 한 추측이니 있을지 없을지도 모르겠고, 있다해도 나올지 안 나올지도 모르겠고.

 

 

 

Posted by gamma0burst Trackback 0 : Comment 18

댓글을 달아 주세요

  1. addr | edit/del | reply 2014.11.01 21:32

    비밀댓글입니다

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2014.11.01 21:53 신고

      옥타7은 브랜드라고 봐야하고, 5433은 일종의 파트네임으로 봐야합니다.
      그 둘의 네이밍 목적은 근본적으로 다르고, 목적이 다르기때문에 반드시 네이밍 기준/패턴이 일치할 필요가 없습니다.
      엑시3만 봐도 Cortex-A8도 있고, A7도 있지요.
      (물론 일치한다면 여러사람이 편하겠지만요.)

      왜 5433이냐, 사양이 이러냐는거에 대해서는 이전에도 몇 차례 제 생각을 밝힌적이 있으니 그거 참고하시면 됩니다.

  2. addr | edit/del | reply 지나가던폰덕 2014.11.01 21:40

    T860... 뜬금없이 공개되서 보니 결국 새로운 건 없나보네요...... 과연 7420에는 뭐가 들어갈지....

    • addr | edit/del 흡혈귀왕 2014.11.01 21:42

      눈에 띄는건
      4K 10bit YUV4:4:4 와
      OpenCL1.2

      지원정도네요ㅎㅎㅎ
      전 사실 T860은 ALU유닛이 배로 늘어나거나
      성능이 상승하길 기대했는데

      걍 T628대비 전력 45% 상승
      3D성능 30% 상승정도라해서 아리까리ㅋㅋ

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2014.11.01 21:48 신고

      arm이 말하는대로 성능향상이 있으면 새롭긴한데 발표내용만보면 변한게 딱히 없어서 이게 진짜 성능향상이 있을지도 의문입니다.
      일단 연산성능 증가에 너무 소극적이에요.

  3. addr | edit/del | reply BlogIcon Seagate 2014.11.02 00:30

    결국은 그냥저냥이라는 거네요 ㅋㅋ 이제 말리는 더이상 NAVER...

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2014.11.02 10:51 신고

      20%가 그냥저냥이면 왠만한 제품은 다 죽어야할듯.

    • addr | edit/del BlogIcon Seagate 2014.11.02 17:54

      그냥 이번에 나온 GX시리즈나 테그라K1 그래픽성능이 인상적이어서요...;;; T760도 그렇고;;; 20퍼는 어떤거 기준인가요?

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2014.11.02 20:02 신고

      본문에 있듯이 같은 사양(MP수, 클럭)에서 T760 대비 그렇다는겁니다.
      동사양에서 저렇게 올라가는건 상당히 올라간겁니다.
      실제 어떨지는 나와봐야 알 수 있는 부분이겠지만 예전에 비하면 구체적인 비교 조건을 직접 밝힌지라 일단 믿는다면 그렇습니다.

      A8X나 테그라K1 성능이 인상적인건 맞는데 스마트폰에 들어갈 수 있는 성능과 태블릿에만 들어갈 수 있는 성능의 차이를 인정해야하는 측면이 있습니다.
      둘의 소비전력 차이는 분명히 있으니까요.

  4. addr | edit/del | reply BlogIcon 플리드 2014.11.03 08:58

    아키텍쳐 호환을 7 시리즈까지만 유지한다고 했던 것 같은데, 뚜껑을 열어보니 같은 아키텍쳐네요;; 그래도 메인 넘버링이 바뀌었으니 뭔가 다른 게 있기를 기대해봅니다... GPU 성능은 아무래도 그래픽 전문 회사들을 따라가기엔 한참 먼 것 같습니다...

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2014.11.03 16:24 신고

      이전 로드맵보면 T604 이후 3세대까지는 Midgard 입니다.
      https://t1.daumcdn.net/cfile/tistory/19379D385028FE5827
      이미지가 작아서 잘 안 보이는데 화살표에 midgard라고 써있습니다.
      T604 이후 제품이 어떤 것인가는 그 때 생각과 지금 현실이 다르겠지만 어쨌든 T628, T760, T860 까지 미드가르드가 된걸보면 나름 로드맵이 지켜진 것같습니다.

  5. addr | edit/del | reply Favicon of http://ㄴ BlogIcon ㅋㅋㅋ 2014.11.03 10:04

    제발제발 sgx잡아보자 말리야!ㅁ

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2014.11.03 16:26 신고

      SGX도 애플이 사용하지 않았다면 제품화에서 별 힘을 못 썼을겁니다.
      태블릿 전용 AP라는걸 만들 수 있는 애플이기때문에 나올 수 있는 사양과 성능이니까요.
      애플 외의 제품에서 보여주는 SGX의 성능은 안 좋은 편입니다.

  6. addr | edit/del | reply Favicon of https://random-ad.tistory.com BlogIcon JordanK 2014.11.03 21:30 신고

    그럼 기존 T7xx 시리즈에 비해 동일 클럭(=동일 성능?)에서 전력소모 감소된 게 다인 건가요...? (그게 별거 아니란 얘기는 아니지만...) 그러니까 클럭 올릴 여지를 준 거라는 건지...?

    • addr | edit/del Seagate 2014.11.03 22:58

      공정이 좋아진다면야 클럭수가 올라가겠지만, 지금 상황봐서는 그게 안될 거 같아요...

      게다가 갈수록 코어수 늘리고 클럭수 늘려서 얻는 성능 향상도 예전보단 덜한 편이죠

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2014.11.04 16:32 신고

      -
      본문에도 있지만 성능향상을 언급하고 있습니다.
      전력효율은 아무래도 종합적으로 봤을 때인듯 하고요.말씀하신대로 전성비가 좋아졌다는건 결국 같은 전력을 유지한다면 성능이 오른다는 얘기가 되니 의미있는 부분입니다.

      -
      코어, 클러 늘려서 얻는 성능 이득은 여전합니다.
      늘어난만큼 올라갑니다.
      비율상 예전보다 상승률이 작아졌을뿐입니다.

  7. addr | edit/del | reply Favicon of http://biasedit.tistory.com BlogIcon JordanK 2014.11.07 02:09

    근데 잡설입니다만 모바일 GPU 비교 그래프 지금 시점에서 만드실 생각 없으십니까.