본문 바로가기
스마트폰/nvidia Tegra

엔비디아 테그라K1 GPU 클럭/성능 추정. (Tegra K1)

by gamma0burst 2014. 5. 3.
반응형

테그라 K1의 GPU 성능에 대해 간단히 다뤄봤는데 추가적으로 나온 정보와 이전 정보를 합쳐서 테그라 K1 GPU의 클럭, 그래픽 성능을 추정해보겠습니다.
(링크: 엔비디아 테그라K1 (32bit) 벤치마크 및 간단 분석.)


-
최초 벤치입니다.
(링크 :
http://gfxbench.com/device.jsp?benchmark=gfx30&os=Android&api=gl&D=Lenovo%20ThinkVision%2028)
 

Lenovo Thinkvision 28
시스템 정보상 CPU 클럭 2.014 GHz
텍셀 필레이트는 3849/3769 MTex/s (On/Off screen)
테스트 결과에는 프레임이 없지만 탐스하드웨어의 정보를 보면 T-Rex offscreen 48 fps 입니다.
(링크 :
http://www.tomshardware.com/news/lenovo-thinkvision-28-nvidia-tegra-k1-android,25733.html)

그 다음 나온 벤치.
(링크 :
http://gfxbench.com/device.jsp?benchmark=gfx30&os=Android&api=gl&D=Lenovo%20K1%20HD%20%282014%29)
Lenovo K1 HD의 결과.

 

우선 초기 결과입니다.
역시 CPU 클럭은 2.014GHz
맨해튼 오프스크린 7.7 fps

티렉스 오프스크린 17.3 fps
텍셀필레이트 1745/1341 MTex/s (On/Off screen)

 

그 이후에 나온 테스트 결과.

맨해튼 오프스크린 11.5 fps

티렉스 오프스크린 24.6 fps
텍셀필레이트 2267/2161 MTex/s (On/Off screen)

위의 3가지 결과를 종합해볼까요.

 Texel fillrate
 (GTex/s)
 T-Rex off (fps)  fps/Tex (T-Rex)  Manhattan off (fps)  fps/Tex
 (Manhattan)
 3.849  48  12.47    
 2.267  24.6  10.85  11.5  5.07
 1.745  17.3  9.91  7.7  4.41
우선 텍셀필레이트 온/오프 결과 중에서 높은걸 기준으로 계산한겁니다.
프레임과 텍셀(=클럭)이 비례해서 나오지 않습니다.

 Texel fillrate
 (GTex/s)
 T-Rex off (fps)  fps/Tex (T-Rex)  Manhattan off (fps)  fps/Tex
 (Manhattan)
 3.769  48  12.73    
 2.161  24.6  11.38  11.5  5.32
 1.341  17.3  12.90  7.7  5.74
오프스크린 텍셀필레이트 결과를 기준으로 계산한겁니다.
fps/Tex 값이 비슷하게 나옵니다.
프레임과 텍셀(=클럭)이 비례해서 나온다고 볼만한 수준의 오차만 있습니다.
Lenovo Thinkvision 28 의 GFX벤치 테스트 조건과 탐스 하드웨어에서 측정한 조건(=클럭)이 동일하다는 반증이되기도 합니다.

오프스크린 텍셀필레이트 값을 기준으로 클럭을 계산해야 할듯 합니다.


-
클럭 추정에 있어 문제는 측정결과가 이론치의 몇% 수준이냐 하는 것.
엔비디아의 주장으로는 최대클럭이 950MHz이고, 티렉스 60 fps이 나온다고 합니다.
950MHz 일 때 60 fps 라고 가정하면 48 fps가 나오기위한 클럭은 760MHz입니다.
이 때 텍셀필레이트 이론치는 6080 MTex/s 입니다.
실제로는 3769 MTex/s 가 나왔습니다. 이론치의 62%
GL벤치마크 2.7 이라면 그러려니하고 넘어갈 수 있는 수준이지만 GFX벤치 3.0 이라면 그러기가 어렵습니다.
다른 참고자료를 찾아야합니다.


-
참고할 수 있는건 테그라K1 탑재 개발보드인 Jetson K1


(링크 :
http://developer.download.nvidia.com/embedded/jetson/TK1/docs/Jetson_platform_brief_May2014.pdf)
일단 화이트페이퍼를 보면 맨해튼 오프스크린 기준으로 애플 A7의 2.5배 성능이라고 합니다.


(링크 :
https://devtalk.nvidia.com/default/topic/720056/embedded-systems/jetson-vs-kayla-compute-capability-which-one-to-choose-/)
이 정보를 보면 GPU 클럭은 960MHz인듯. (GK20A는 테그라K1 GPU)
엔비디아에서 발표한 최대 클럭인 950MHz보다 높은데 두 가지 모두를 고려해서 계산해보도록 하지요.

맨해튼 오프스크린이 A7의 2.5배라면 약 33 fps 라는 얘기입니다.
(A7이 13.2 fps, 링크 :
http://gfxbench.com/device.jsp?benchmark=gfx30&os=iOS&api=gl&D=Apple%20iPhone%205S)
즉, 950MHz(or 960MHz)에서 맨해튼 오프스크린 33 fps 라고 정리할 수 있습니다.

실제 테스트 결과를 보면 2161 MTex/s 일 때 11.5 fps 였습니다.
950MHz(or 960MHz) - 33 fps 에서 11.5 fps일 때 클럭을 계산하면 331MHz(or 335MHz) 입니다.
이 때 텍셀필레이트 이론치는 2648(or 2680) MTex/s
실제 결과는 2161 MTex/s로 이론치의 82%(or 81%)입니다.
이전보다 훨씬 그럴듯한 수치입니다. 테그라3가 81.3%의 효율을 보이기도 했습니다. 비슷하지요.


-
현재까지의 정보를 종합해보면, 테그라K1 GPU 추정 클럭/성능은 다음과 같습니다.

 Tegra K1 GPU (GK20A)  331MHz
 (Lenovo K1 HD)
 577MHz
 (Lenovo ThinkVision 28)
 950MHz
 (Max clock)
 T-Rex offscreen  24.6  48  70.6
 Manhattan offscreen  11.5  20  33

최대 클럭 결과를 보면 엄청난 수준입니다만 문제는 소비전력.
태블릿인 Lenovo K1 HD의 추정클럭이 최대클럭의 1/3 수준에 불과하다는건 소비전력 문제가 상당하다는 반증이 됩니다.
물론 최종 성능이 현재 GFX벤치에 올라온 것보다 높을 가능성이 있기때문에 단정지을 수는 없습니다.



반응형

댓글