- GTC2014에서 공개된 테그라 로드맵입니다.
맥스웰 GPU를 사용한 차기 테그라가 나왔고, 코드네임은 에리스타(Erista)입니다.
(에리스타가 울버린의 딸이고 울버린의 아버지가 로건 Logan이니 하는 설정이 있는걸보니 마블 코믹스 캐릭터 이름을 아주 포기한건 아닌듯.)
(비록 태블릿 한정이었지만) 엄청난 그래픽 성능을 보여준 테그라K1과 케플러 아키텍처(이하 케플러)로 인해 맥스웰 아키텍처(이하 맥스웰)에 대한 기대가 적지 않습니다.
케플러와 맥스웰의 성능 차이, 아키텍처 차이에 따른 코어 구성 추정 등을 통해 에리스타의 GPU 사양과 그래픽 성능을 추정해보겠습니다.
- 케플러와 맥스웰의 성능 차이
엔비디아가 맥스웰을 공개하면서 밝힌 바에 따르면 케플러 대비 코어당 성능은 +35~40% 입니다.
(왼쪽 : 코어당 성능 +35%, 오른쪽 : 코어당 성능 +40%)
그리고 이는 실제 벤치마크를 통해서 입증된 내용이기도 합니다.
(링크 : http://udteam.tistory.com/668)
여기서 확인할 수 있는건 크게 두 가지입니다.
1. 동일 사양에서 맥스웰은 케플러보다 35~40% 효율이 높다.
-> 실제 성능 향상치와의 관계는 불명. (사양에 따라 제각각)
2. 실제 성능에 영향을 끼치는 요소는 코어, TMU, ROP, 메모리, 클럭 등 다양하지만 코어수(와 클럭)을 성능을 대표하는 지수로 사용하는데 지장이 없다. 실제 엔비디아가 코어당성능이라는 지표를 사용한다.
-> 따라서 여기서는 코어 수와 클럭을 근거로 성능을 추정하겠습니다.
- GK104-GK20A 관계와 GM204 코어 구조를 근거로 한 에리스타 GPU 사양 추정
테그라K1에 들어간 GPU, GK20A는 192코어-8TMU-4ROP의 구조를 갖고 있습니다.
이런 구성은 어디에서 온걸까요.
GK104에서 왔다고 보는게 타당할겁니다.
실제 더 고사양의 GK110이 있습니다만, GK110은 연산성능에 치중하여 게이밍 효율은 떨어지는 구조였습니다.
전력에 민감한 AP에는 GK104의 구성이 더 적합합니다.
GK104는 1536코어-128TMU-32ROP 였습니다.
8SMX 구성이고, (단순 비례로 보면) 1SMX = 192코어-16TMU-8ROP입니다.
GK20A는 1SMX의 구성에 가까운겁니다.
이를 근거로 패턴화를 해보면, AP의 GPU 사양은 1SM의 구성을 기본적으로 따르고 TMU, ROP 수는 절반으로 줄어든다고 볼 수 있습니다.
다른 시각으로는 위의 GK208 사양의 절반이라고 볼 수도 있습니다만, 이것도 역시 GK104의 변칙적인 다운그레이드이기때문에 이를 기준으로 잡기는 힘들다고 생각됩니다.
(애초의 위에서 가정한 패턴이란 것도 절대적인건 아니지만요.)
위에서 가정한 패턴을 맥스웰에 적용해보겠습니다.
맥스웰 기반 GPU인 GM204
케플러로 치면 GK104 같은 위치입니다.
GM204 사양은 2048코어-128TMU-64ROP 입니다.
총 16SMM으로 (단순 계산으로) 1SMM = 128코어-8TMU-4ROP 입니다.
추측을 해보자면, 128코어로는 나오지 않을듯 합니다.
아무리 효율이 40% 올라도 코어수가 30% 이상 줄어들어서는 큰 성능 향상을 보기 힘듭니다.
게다가 이번에도 엔비디아는 연산성능을 얘기할텐데 코어 수가 줄어들면 연산성능은 전세대 제품을 넘어서는게 불가능합니다.
그렇기때문에 2SMM 구성으로 추측됩니다.
이는 GK20A가 GK104의 1/8 사양이었다는 점과도 일치합니다.
앞서 가정한 패턴대로면 256코어-8TMU-4ROP의 구성.
클럭은 예상하기 힘든데 끼워 맞춰보면 이렇습니다.
GTX980(GM204)를 GTX680(GK104)와 비교해보면,
코어 수 33% 증가, 클럭 14% 증가임에도 TDP는 15% 감소했습니다. (같은 28nm인데?!)
사양이 증가해도 클럭을 올릴 수 있다는겁니다.
에리스타에서도 같은 비율로 클럭이 상승한다면 클럭은 1100MHz 정도 됩니다.
클럭 상승은 소비전력 문제로 힘들수도 있으니 추가적인 성능 상승 옵션으로 남겨두면 될듯.
- 성능 추정
정리해보면 에리스타 GPU 추정 사양은 256코어-8TMU-4ROP 입니다.
코어 수는 +33%, 아키텍처 변화에 따른 향상이 +35% 입니다.
이를 모두 종합하면 (동클럭에서) 테그라K1 대비 성능은 1.8배입니다.
950 기준으로 맨해튼 오프스크린 60 fps, 티렉스 오프스크린 123 fps 정도 되겠네요.
- 문제점 : GFX벤치에서 3DMark 같은 성능향상이 나타날 것인가.
케플러 -> 맥스웰 에서의 향상은 35~40%로 봤지만 이게 GFX벤치에서 나타날지가 문제입니다.
코어와 클럭에 따른 GFX벤치 결과를 보면 케플러 기반이나 맥스웰 기반이나 별 차이가 없습니다.
GFX벤치에서 데스크탑 그래픽 카드 결과를 대게 오버클럭 상태에서 측정된게 많아서 레퍼런스 클럭에서의 비교가 어렵다는게 문제이고, 이 때문에 제대로 된 결과값을 통한 계산인지 확실하지 않아서,
정말 케플러-맥스웰 사이의 GFX벤치 성능 차이가 없는가에 대해서는 확실하지 않습니다.
'스마트폰 > nvidia Tegra' 카테고리의 다른 글
엔비디아 테그라 X1 발표. (2) GPU (Tegra X1, Maxwell) (23) | 2015.01.13 |
---|---|
엔비디아 테그라 X1 발표. (1) CPU (Tegra X1) (21) | 2015.01.11 |
엔비디아 덴버코어 AArch64(64bit) 성능 분석. (Denver, Tegra K1) (15) | 2014.11.22 |
엔비디아 덴버 코어 긱벤치 성능 분석. (Nvidia, Denver, Geekbench3) (update 14.11.01) (30) | 2014.11.01 |
테그라K1 GK20A 클럭/성능 추정 (2) (13) | 2014.07.30 |
댓글