- 이매지네이션이 신규 아키텍처 PowerVR Furian을 발표했습니다.
전작인 Rogue가 시리즈6,7,8XE까지 사용됐고 Furian은 시리즈 8XT 부터 적용됩니다.
구조를 보면 Shader Processing Unit은 2개의 USC로 구성.
USC 내부 구조.
크게 Primay ALU Pipeline, Specialisde ALU Pipeline으로 구성.
Specialisde ALU Pipeline은 7XT로 치면 FP16 ALU, Special function 유닛 에 해당하는 부분으로 추측됩니다.
Primay ALU Pipeline 구성.
Rogue 1 pipeline당 2 MAD(MUL and ADD) 연산인데 반해, Furian은 1MAD+1MUL 입니다.
7XT 블록 다이어그램을 보면 FP32 유닛이 두 개로 표시되어 있고, 위쪽 이미지를 보면 Furian의 Primay ALU Pipeline는 하나로 표시되어 있어서 이런 구성 변화를 어느 정도 반영한 이미지가 아닌가 싶습니다.
그렇다면 Furian에서 Specialisde ALU Pipeline 영역에 4개의 블록이 있는건, 7XT에서처럼 FP16 ALU가 4개 있다는 의미로 생각해 볼 수도 있을듯 합니다.
7XT가 16 pipeline으로 표기되어있는데 이건 USC 기준의 파이프라인 구성 얘기입니다.
Furian의 USC는 32 pipeline 구성이라는 의미겠지요.
파이프라인당 연산성능은 줄었으나 파이프 라인이 두 배로 늘면서 USC 규모에서는 연산성능이 증가했습니다.
실제 연산 사용 빈도를 고려해서 규모는 줄이고 효율은 올리는 방향을 선택한 것으로 보입니다.
7XT와 같은 공정, 동클럭, 같은 면적 조건에서 비교시 연산성능 +35%, 필레이트 +80%
앞서 추측한 내용을 토대로 숫자를 끼워맞춰보면
FP16 기준으로는 7XT 12클러스터(=192파이프라인)의 연산성능 1536 FLOPS/cycle
+35%면 2074 FLOPS/cycle
8XT 8클러스터(=4쉐이더 유닛 = 256파이프라인)의 연산성능 2048 FLOPS/cycle (오차 1.3%)
FP32 기준으로는 7XT 16클러스터(=256파이프라인)의 연산성능 1024 FLOPS/cycle
+35%면 1382 FLOPS/cycle
8XT 14클러스터(=7쉐이더 유닛 = 448파이프라인)의 연산성능 1344 FLOPS/cycle (오차 2.9%)
필레이트 기준으로보면 7XT는 2개의 클러스터가 하나의 TMU를 공유하고 1TMU는 4 Tex/cycle 입니다.
슬라이드로 보아 2클러스터가 1TMU를 공유하는건 8XT도 마찬가지로 보입니다.
FP16 기준으로 보면,
7XT 12클러스터는 24 Tex/cycle인데 8XT는 필레이트 80% 증가이니 24 x1.8 = 43.2 Tex/cycle
8XT 8클러스터는 4TMU이니 1TMU당 10.8 Tex/cycle 정도가 나옵니다.
FP32 기준으로 보면,
7XT 16클러스터는 32 Tex/cycle인데 8XT는 필레이트 80% 증가이니 32 x1.8 = 57.6 Tex/cycle
8XT 14클러스터는 7TMU이니 1TMU당 8.2 Tex/cycle 정도가 나옵니다.
아난드텍 기사에 따르면 텍스처 유닛 성능은 4 Tex/cycle에서 8 Tex/cycle로 증가했다고 합니다.
그렇다면 FP32 기준이 맞다는게 됩니다.
동일 면적에서 파이프라인이 75%나 증가했다는겁니다.
게이밍 성능이 70~90% 증가하려면 그 정도의 규모 증가가 필요한 것 같기도 합니다.
연산 유닛 밀도 증가는 파이프 라인 규모 감소, USC 단위가 커지면서 프론트 엔드 규모가 줄어드는 등의 효과로 추측됩니다.
마지막에 시장 얘기를 하면서 옆에 이미지가 있는데 아래쪽이 삼성의 폴더블 OLED 컨셉 이미지입니다.
최근에 엑시노스9810에 이매지네이션 GPU가 들어간다는 루머가 돌기도해서 연관성이 있을까 싶었는데
위 쪽 Automotive 이미지를 찾아보니 TI DLP 더군요.
(링크 : https://www.youtube.com/watch?v=tq00BOJ1N6M)
삼성과 직접적으로 연관성은 없어 보입니다.
(아니면 TI, 삼성에 둘 다 들어가든가?)
'스마트폰 > mobile GPU' 카테고리의 다른 글
ARM Mali-G72 성능 분석. (하이실리콘 기린970) (8) | 2018.01.26 |
---|---|
스마트폰 플래그쉽 AP GPU 성능 추세 / 차기 제품 성능 추정 (6) | 2017.06.11 |
ARM Mali-G71 성능 분석. (하이실리콘 기린960) (2) | 2016.12.04 |
ARM Mali-G71 발표. (코드네임 : 비프로스트, Bifrost) (4) | 2016.06.14 |
ARM Mali-T830 GFX벤치 결과 분석. (AmLogic S912) (5) | 2015.11.18 |
댓글