- 이매지네이션이 신규 아키텍처 PowerVR Furian을 발표했습니다.

전작인 Rogue가 시리즈6,7,8XE까지 사용됐고 Furian은 시리즈 8XT 부터 적용됩니다.


구조를 보Shader Processing Unit은 2개의 USC로 구성.


USC 내부 구조.

크게 Primay ALU Pipeline, Specialisde ALU Pipeline으로 구성.

Specialisde ALU Pipeline은 7XT로 치면 FP16 ALU, Special function 유닛 에 해당하는 부분으로 추측됩니다.


Primay ALU Pipeline 구성.

Rogue 1 pipeline당 2 MAD(MUL and ADD) 연산인데 반해, Furian은 1MAD+1MUL 입니다.

7XT 블록 다이어그램을 보면 FP32 유닛이 두 개로 표시되어 있고, 위쪽 이미지를 보면 Furian의 Primay ALU Pipeline는 하나로 표시되어 있어서 이런 구성 변화를 어느 정도 반영한 이미지가 아닌가 싶습니다.

그렇다면 Furian에서 Specialisde ALU Pipeline 영역에 4개의 블록이 있는건, 7XT에서처럼 FP16 ALU가 4개 있다는 의미로 생각해 볼 수도 있을듯 합니다.


7XT가 16 pipeline으로 표기되어있는데 이건 USC 기준의 파이프라인 구성 얘기입니다.

Furian의 USC는 32 pipeline 구성이라는 의미겠지요.


파이프라인당 연산성능은 줄었으나 파이프 라인이 두 배로 늘면서 USC 규모에서는 연산성능이 증가습니다.

실제 연산 사용 빈도를 고려해서 규모는 줄이고 효율은 올리는 방향을 선택한 것으로 보입니다.


7XT와 같은 공정, 동클럭, 같은 면적 조건에서 비교시 연산성능 +35%, 필레이트 +80%


앞서 추측한 내용을 토대로 숫자를 끼워맞춰보면

FP16 기준으로는 7XT 12클러스터(=192파이프라인)의 연산성능 1536 FLOPS/cycle

+35%면 2074 FLOPS/cycle

8XT 8클러스터(=4쉐이더 유닛 = 256파이프라인)의 연산성능 2048 FLOPS/cycle (오차 1.3%)


FP32 기준으로는 7XT 16클러스터(=256파이프라인)의 연산성능 1024 FLOPS/cycle

+35%면 1382 FLOPS/cycle

8XT 14클러스터(=7쉐이더 유닛 = 448파이프라인)의 연산성능 1344 FLOPS/cycle (오차 2.9%)


필레이트 기준으로보면 7XT는 2개의 클러스터가 하나의 TMU를 공유하고 1TMU는 4 Tex/cycle 입니다.

슬라이드로 보아 2클러스터가 1TMU를 공유하는건 8XT도 마찬가지로 보입니다.

FP16 기준으로 보면,

7XT 12클러스터는 24 Tex/cycle인데 8XT는 필레이트 80% 증가이니 24 x1.8 = 43.2 Tex/cycle

8XT 8클러스터는 4TMU이니 1TMU당 10.8 Tex/cycle 정도가 나옵니다.

FP32 기준으로 보면,

7XT 16클러스터는 32 Tex/cycle인데 8XT는 필레이트 80% 증가이니 32 x1.8 = 57.6 Tex/cycle

8XT 14클러스터는 7TMU이니 1TMU당 8.2 Tex/cycle 정도가 나옵니다.


아난드텍 기사에 따르면 텍스처 유닛 성능은 4 Tex/cycle에서 8 Tex/cycle로 증가했다고 합니다.

그렇다면 FP32 기준이 맞다는게 됩니다.

동일 면적에서 파이프라인이 75%나 증가했다는겁니다.

게이밍 성능이 70~90% 증가하려면 그 정도의 규모 증가가 필요한 것 같기도 합니다.

연산 유닛 밀도 증가는 파이프 라인 규모 감소, USC 단위가 커지면서 프론트 엔드 규모가 줄어드는 등의 효과로 추측됩니다.




마지막에 시장 얘기를 하면서 옆에 이미지가 있는데 아래쪽이 삼성의 폴더블 OLED 컨셉 이미지입니다.

최근에 엑시노스9810에 이매지네이션 GPU가 들어간다는 루머가 돌기도해서 연관성이 있을까 싶었는데

위 쪽 Automotive 이미지를 찾아보니 TI DLP 더군요.

(링크 : https://www.youtube.com/watch?v=tq00BOJ1N6M)

삼성과 직접적으로 연관성은 없어 보입니다.

(아니면 TI, 삼성에 둘 다 들어가든가?)

 

 

 

신고
Posted by gamma0burst Trackback 0 : Comment 22

댓글을 달아 주세요

  1. addr | edit/del | reply 흡혈귀왕 2017.03.10 07:46 신고

    오랫만에 포스팅 2개나 해주셔서 반갑네요~

    일단 아키텍쳐 자체는 꽤 개선이 된것으로 보입니다~
    주장대로라면 확실히 큰 성능향상임은 틀림없겠군요.

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2017.03.10 16:20 신고

      전력 얘기가 안 나와서 애매하지만 발표대로면 상당한 성능향상이 있는거 같습니다.
      7XT에서 성능은 별로 달라지는거 없다는 얘기도 있었던거 같은데 예상 외 입니다.

  2. addr | edit/del | reply A TNT 2017.03.10 21:06 신고

    8xe가 기존의 rogue 아키텍쳐를 재사용하는거 보고 8xt도 rogue 기반일줄 알았는데 전혀 새로운 아키텍쳐네요. rogue도 midgard처럼 상당히 오래 쓰인거 같습니다.

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2017.03.10 21:24 신고

      Rogue 기반 6XT 2세대가 12년 말에 발표됐으니 Rogue로 4년정도 왔네요.
      Furian도 약간씩 개량하면서 비슷하게 몇 년 쓸듯 합니다.

  3. addr | edit/del | reply 흡혈귀왕 2017.03.11 10:44 신고

    어쨋든 아직 루머단계지만
    차기 엑시노스9810에 이게달린다면 이번엔 좀 기대해봐도 좋지않을까란 생각이듭니다.
    모 사업부(무선이겠지요?)에서 계속해서 GPU바꾸라고 압박을 가하고있다는데

    일단 저 발표대로되고 장미빛 인생이 맞다면
    연산성능 + 게이밍 모두 충족할 GPU가 될수있을듯한데

    전성비부분은 좀더 지켜봐야겠지만 엑시노스쪽 GPU 이미지 쇄신이 어느정도 되지않을까 생각합니다.
    OpenCL2.0 풀프로파일에 FP16연산 두배에 FP64연산도 지원하니 컴퓨팅 연산도 뛰어날테고...


    문제는 고질적인 드라이버 성능 문제와 지원 이슈정도겠지요...
    이메지네이션사 리눅스나 안드로이드쪽 드라이버 지원이 엔비디아보다 더 악질로 유명한지라...

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2017.03.11 21:50 신고

      7XT도 발표와는 다르게 최신벤치말곤 별 성능향상을 보이지 않아서 8XT도 진짜 성능이 어떨지 나와봐야할거 같습니다.

      7XT는 최신 벤치만 성능이 올라갔는데 이건 최신 드라이버 영향일 수도 있으니......

  4. addr | edit/del | reply 궁금해요 2017.03.12 11:50 신고

    안녕하세요 궁금한점이 생겨서 질문드립니다. 스냅드래곤625가 14나노공정 저전력으로 배터리효율이 좋다고 하던데요. 단순 성능으로 보면 800과 비교해서 싱글,멀티,그래픽 은 어느게 우세고 어느게 열세인가요?

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2017.03.12 13:25 신고

      긱벤치 기준으로 보면 CPU는 스냅800이 싱글 +20%, 멀티 -15% 정도네요.
      GPU는 GFX벤치 맨해튼3.0 기준으로 스냅800이 10~15%정도 높습니다.

  5. addr | edit/del | reply 궁금해요 2017.03.12 17:49 신고

    하나만 더 여쭤보겠습니다. 650은 800과 비교시 어떤가요? 위 댓글처럼 수치상으로 대략 비교시에요

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2017.03.12 20:43 신고

      스냅650이 스냅800 대비 CPU 긱벤치4 기준 싱글 +45%, 멀티 +70%
      GPU GFX벤치기준 +70%

  6. addr | edit/del | reply 궁금해요 2017.03.12 21:55 신고

    헉 성능차이가 많이 나는군요. 화웨이가 제법 치고 올라온거 같아 요즘 하이실리콘 라인업도 궁금한데 혹시 기린935는 어느정도인가요? 800 가볍게 넘나요?

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2017.03.14 07:06 신고

      스냅800 대비
      CPU 긱벤치4 기준 싱글 -25%, 멀티 +30%
      GPU GFX벤치기준 -20% 정도네요.

  7. addr | edit/del | reply 궁금해요 2017.03.14 09:28 신고

    많은 질문에도 친절하게 답주셔서 감사합니다!

  8. addr | edit/del | reply A TNT 2017.03.17 11:30 신고

    835 긱벤치 낮게 나온거 보고 8895도 성능 향상폭이 낮을거라 생각하고 있었긴 했는데 싱글 1900 멀티 6300은 낮아도 너무 낮은거 같네요.

    http://browser.primatelabs.com/v4/cpu/2109288

    대충 싱글 2200~2300 선을 예상하고 있었는데 결과 나온거 보면 전작대비 성능향상폭은 10% 내외일듯 합니다.

    엑시노스 공식 홈페이지의 8895 소개란에 CPU 성능향상폭에 대해서 아무 언급도 없던거 보고 이상하다고 생각했는데 이런 반전이 있었네요.

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2017.03.18 18:15 신고

      결과봐서는 현 클럭 셋팅조건에서 싱글 2175점까지 나올거 같네요.
      이거에 대한건 다룰 기회가 있을듯.

  9. addr | edit/del | reply A TNT 2017.03.18 07:47 신고

    http://www.anandtech.com/show/11088/hisilicon-kirin-960-performance-and-power/5

    이 링크를 보니 기린 960의 GPU 성능향상폭이 높긴 한데 클럭을 무리하게 높인 후폭풍이 꽤나 어마어마한거 같네요. OpenGL ES 3.1에서는 8W, ES 2.0에서는 9.5W를 소모한다고 합니다.

    그리고 해당 링크에서 810 v2.1의 CPU 전력소모량도 나왔는데 이쪽은 아예 4코어 로드를 걸어보지도 않은거 같네요...

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2017.03.18 18:22 신고

      시스템 전력이라서 그대로 비교하기는 힘들지만 대충보면 엑시8890 T880 전성비보다 떨어지고 기린955 T880보다도 떨어지는데 이건 이렇게 해석할 수 있지요.
      기린955보다 떨어지는걸봐서 1037MHz로 클럭을 과도하게 올려서 전력이 폭증한 것으로 보이고,
      기린955 - 엑시8890 간 전성비 차이의 원인은 설계 최적화로 보이는데 (예전에 T880 전력이 상당하다는 찌라시도 있었으니까요.) 화웨이보다 삼성의 설계 최적화 능력이 좋거나 더 공을 들였다라고 볼 수 있습니다.
      기린960이 ARM 레퍼런스를 적당히 갖다 썼다고 생각해볼 수 있지요.

      종합해보면 G71 상태도 생각보다 좋지는 않은데 화웨이에서는 설계 최적화도 없이 고클럭 설정을 적용하는 바람에 소비전력이 폭주했다고 해석할 수 있을듯.

  10. addr | edit/del | reply qwerty 2017.03.22 00:36 신고

    이게 아이폰8에 들어갈까요?

  11. addr | edit/del | reply A TNT 2017.04.03 18:46 신고

    8XT Furian은 회사의 운명과 함께 훅 가버리겠네요.