테그라 K1의 GPU 성능에 대해 간단히 다뤄봤는데 추가적으로 나온 정보와 이전 정보를 합쳐서 테그라 K1 GPU의 클럭, 그래픽 성능을 추정해보겠습니다.
(링크: 엔비디아 테그라K1 (32bit) 벤치마크 및 간단 분석.)


-
최초 벤치입니다.
(링크 :
http://gfxbench.com/device.jsp?benchmark=gfx30&os=Android&api=gl&D=Lenovo%20ThinkVision%2028)
 

Lenovo Thinkvision 28
시스템 정보상 CPU 클럭 2.014 GHz
텍셀 필레이트는 3849/3769 MTex/s (On/Off screen)
테스트 결과에는 프레임이 없지만 탐스하드웨어의 정보를 보면 T-Rex offscreen 48 fps 입니다.
(링크 :
http://www.tomshardware.com/news/lenovo-thinkvision-28-nvidia-tegra-k1-android,25733.html)

그 다음 나온 벤치.
(링크 :
http://gfxbench.com/device.jsp?benchmark=gfx30&os=Android&api=gl&D=Lenovo%20K1%20HD%20%282014%29)
Lenovo K1 HD의 결과.

 

우선 초기 결과입니다.
역시 CPU 클럭은 2.014GHz
맨해튼 오프스크린 7.7 fps

티렉스 오프스크린 17.3 fps
텍셀필레이트 1745/1341 MTex/s (On/Off screen)

 

그 이후에 나온 테스트 결과.

맨해튼 오프스크린 11.5 fps

티렉스 오프스크린 24.6 fps
텍셀필레이트 2267/2161 MTex/s (On/Off screen)

위의 3가지 결과를 종합해볼까요.

 Texel fillrate
 (GTex/s)
 T-Rex off (fps)  fps/Tex (T-Rex)  Manhattan off (fps)  fps/Tex
 (Manhattan)
 3.849  48  12.47    
 2.267  24.6  10.85  11.5  5.07
 1.745  17.3  9.91  7.7  4.41
우선 텍셀필레이트 온/오프 결과 중에서 높은걸 기준으로 계산한겁니다.
프레임과 텍셀(=클럭)이 비례해서 나오지 않습니다.

 Texel fillrate
 (GTex/s)
 T-Rex off (fps)  fps/Tex (T-Rex)  Manhattan off (fps)  fps/Tex
 (Manhattan)
 3.769  48  12.73    
 2.161  24.6  11.38  11.5  5.32
 1.341  17.3  12.90  7.7  5.74
오프스크린 텍셀필레이트 결과를 기준으로 계산한겁니다.
fps/Tex 값이 비슷하게 나옵니다.
프레임과 텍셀(=클럭)이 비례해서 나온다고 볼만한 수준의 오차만 있습니다.
Lenovo Thinkvision 28 의 GFX벤치 테스트 조건과 탐스 하드웨어에서 측정한 조건(=클럭)이 동일하다는 반증이되기도 합니다.

오프스크린 텍셀필레이트 값을 기준으로 클럭을 계산해야 할듯 합니다.


-
클럭 추정에 있어 문제는 측정결과가 이론치의 몇% 수준이냐 하는 것.
엔비디아의 주장으로는 최대클럭이 950MHz이고, 티렉스 60 fps이 나온다고 합니다.
950MHz 일 때 60 fps 라고 가정하면 48 fps가 나오기위한 클럭은 760MHz입니다.
이 때 텍셀필레이트 이론치는 6080 MTex/s 입니다.
실제로는 3769 MTex/s 가 나왔습니다. 이론치의 62%
GL벤치마크 2.7 이라면 그러려니하고 넘어갈 수 있는 수준이지만 GFX벤치 3.0 이라면 그러기가 어렵습니다.
다른 참고자료를 찾아야합니다.


-
참고할 수 있는건 테그라K1 탑재 개발보드인 Jetson K1


(링크 :
http://developer.download.nvidia.com/embedded/jetson/TK1/docs/Jetson_platform_brief_May2014.pdf)
일단 화이트페이퍼를 보면 맨해튼 오프스크린 기준으로 애플 A7의 2.5배 성능이라고 합니다.


(링크 :
https://devtalk.nvidia.com/default/topic/720056/embedded-systems/jetson-vs-kayla-compute-capability-which-one-to-choose-/)
이 정보를 보면 GPU 클럭은 960MHz인듯. (GK20A는 테그라K1 GPU)
엔비디아에서 발표한 최대 클럭인 950MHz보다 높은데 두 가지 모두를 고려해서 계산해보도록 하지요.

맨해튼 오프스크린이 A7의 2.5배라면 약 33 fps 라는 얘기입니다.
(A7이 13.2 fps, 링크 :
http://gfxbench.com/device.jsp?benchmark=gfx30&os=iOS&api=gl&D=Apple%20iPhone%205S)
즉, 950MHz(or 960MHz)에서 맨해튼 오프스크린 33 fps 라고 정리할 수 있습니다.

실제 테스트 결과를 보면 2161 MTex/s 일 때 11.5 fps 였습니다.
950MHz(or 960MHz) - 33 fps 에서 11.5 fps일 때 클럭을 계산하면 331MHz(or 335MHz) 입니다.
이 때 텍셀필레이트 이론치는 2648(or 2680) MTex/s
실제 결과는 2161 MTex/s로 이론치의 82%(or 81%)입니다.
이전보다 훨씬 그럴듯한 수치입니다. 테그라3가 81.3%의 효율을 보이기도 했습니다. 비슷하지요.


-
현재까지의 정보를 종합해보면, 테그라K1 GPU 추정 클럭/성능은 다음과 같습니다.

 Tegra K1 GPU (GK20A)  331MHz
 (Lenovo K1 HD)
 577MHz
 (Lenovo ThinkVision 28)
 950MHz
 (Max clock)
 T-Rex offscreen  24.6  48  70.6
 Manhattan offscreen  11.5  20  33

최대 클럭 결과를 보면 엄청난 수준입니다만 문제는 소비전력.
태블릿인 Lenovo K1 HD의 추정클럭이 최대클럭의 1/3 수준에 불과하다는건 소비전력 문제가 상당하다는 반증이 됩니다.
물론 최종 성능이 현재 GFX벤치에 올라온 것보다 높을 가능성이 있기때문에 단정지을 수는 없습니다.



Posted by gamma0burst Trackback 0 : Comment 6

댓글을 달아 주세요

  1. addr | edit/del | reply BlogIcon 흡혈귀왕 2014.05.03 11:19

    타블렛이냐 쉴드2에선
    577~600MHz 정도로 맞춰줬음 좋겠네요 ㅎㄷㄷ

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2014.05.03 16:06 신고

      쉴드정도되면 풀클럭도 가능해보이네요.
      빌열은 별 문제가 안 될거고 소비전력이 좀 걸리는데 배터리를 늘리면 어떻게든 될듯.

  2. addr | edit/del | reply Favicon of https://rubp.tistory.com BlogIcon RuBisCO 2014.05.03 14:09 신고

    저번에도 이야기 했지만 케플러를 겨우 TMU 쳐내고 반쪽을 낸 정도로는 잘쳐줘도 소비전력이 납득할 수준으로 줄어들지를 못하죠. 클럭까지 크게 내려갔군요. 하기야 풀클럭에선 11W 미만이라니 예정된 수순이 아닌가 싶긴 합니다.

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2014.05.03 16:11 신고

      11W라는 것도 TDP인지 소비전력인지 모르겠는데 일단은 소비전력으로 표기돼있더군요.
      TDP라면 GPU 소비전력이 5~10W 수준으로 엄청나다는거고,
      최대소비전력이라면 GPU가 최대 5~6W 정도 먹는다는 얘기가 되는데 이 정도면 사양대비 상당히 좋은 수준이지요.

    • addr | edit/del Favicon of https://rubp.tistory.com BlogIcon RuBisCO 2014.05.04 04:29 신고

      개인적으로는 TDP에 따른 소비전력 상한이 그정도라는게 아닌가 싶습니다. 비등한 클럭의 랩탑용 케플러코어의 소비전력이 32W인데 대강 여기서 부터 스케일을 줄여서 짐작해 볼 수 있는게 대강 10W 선이니까요.

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2014.05.04 23:32 신고

      이론적으로는 10W 미만(5~6W선)도 가능하긴 합니다.
      문제는 그게 말처럼 잘 됐느냐가 첫째고,
      현재 디바이스 조건상 GPU 성능은 2~3W 기준으로 평가될 수 밖에 없는데 그것과는 너무 동떨어진 소비전력이라는게 둘째.