본문 바로가기
스마트폰/기타업체 ETC

Huawei K3V2 GPU 정보/분석.

by gamma0burst 2012. 9. 24.
반응형


(엄밀히 말하면 K3V2 는 화웨이 제품이 아닌, Hisilicon의 제품이지만, 화웨이 제품에 탑재되고 있기때문에 임의 표기하였습니다.)

전에 Hisilicon의 K3V2 에 대해 다룬 적이 있는데, 새로운 내용이 나와서 다시 한 번 다루게 되었습니다.
(화웨이 K3V2 그래픽 성능. (Huawei K3V2))

http://www.expreview.com/21331-2.html

그동안 K3V2 GPU는 Immersion.16 이라는 이름의 16코어라고만 알려져있었는데,
Vivante 그래픽 코어 기반이라고 합니다.

http://www.glbenchmark.com/phonedetails.jsp?benchmark=glpro25&D=Huawei+U9510&testgroup=overall
http://www.glbenchmark.com/phonedetails.jsp?benchmark=glpro25&D=Huawei+U9510+%28GC4000%29&testgroup=overall



(같은 제품인데 한 쪽은 Immersion.16, 한 쪽은 GC4000)

GLBenchmark 정보에서는 GC4000 으로 나오는 경우도 있습니다.
이러한 정보들과 16코어라는 발표 스펙, 아래 자료들을 종합해보면, Vivante GC4000 2코어 라는게 가장 적절한 해석으로 보입니다.

16코어라는 점과 아래 자료들을 통해 Vivante GC8000 임을 알 수 있습니다.
- 통합 쉐이더 방식으로 32bit SIMD Vec4 구조.
- IEEE 32bit FP 연산 지원. (단정밀도)
- 자료를 보건데, 한 사이클에 ADD, MUL 모두 처리 가능한듯 합니다. (2op/cycle)
이런 스펙은 아직까지 모바일용 GPU에서는 보기 힘듭니다.











성능표대로라면 GC8000 GC4000 2코어는
400 Mtri/s, 5 Gpix/s, 96 GFLOPS
의 성능을 갖는게 되는데, 실제 제품이 보여주는 성능은 그렇지 않습니다.
(
모바일 GPU 성능 비교 v12.9)
아마도 성능표의 기준이 된 클럭에 비해 실제 제품에 적용된 클럭이 크게 낮겠지요.

그렇다면 K3V2 의 GC8000 GC4000 2코어 의 클럭은 얼마일까요.
아래 자료가 실마리를 제공합니다.





이 자료를 통해 알 수 있는 사실은 다음과 같습니다.

- GC2000 과 그 파생 제품에 적용된 Scalarmorphic Unified Shader는 1코어당 9 Flops/cycle 의 연산성능을 갖는다.
(이는 저전력 타겟 통합쉐이더로써는 높은 수치입니다.)
- GC8000 GC4000 2코어는 16코어이니 144 Flops/cycle 이 되고, 96 GFLOPS 가 나오기 위한 클럭은 670MHz 내외.

- 스펙표의 성능은 600~670MHz 정도가 적용된 수치이다.
- Freescale i.MX 6D/Q 에 적용된 GC2000 의 클럭은 528MHz(쉐이더 600MHz) 이다.


GLbenchmark 에 이 Freescale i.MX 6D/Q 를 테스트한 결과가 있습니다.
http://www.glbenchmark.com/phonedetails.jsp?D=Freescale+SABRESD-MX6DQ&benchmark=glpro25

그리고 K3V2 가 적용된 제품의 테스트 결과도 있습니다.
http://www.glbenchmark.com/phonedetails.jsp?D=Huawei+U9510&benchmark=glpro25




4코어인 GC2000 528MHz 의 테스트 결과가 8.3 fps
16코어인 GC4000 2코어 의 테스트 결과가 13.9 fps (최근 결과는 최대 14.8 fps)

스펙은 4배인데, 성능은 1.78배입니다.
계산해보면 클럭은 236MHz 가 나옵니다.
250~266MHz 정도로 생각할 수 있습니다. 

264MHz 에서의 GC4000 2코어 성능을 계산해보면 다음과 같습니다.
176 Mtri/s, 2.112 Gpix/s, 38 GFLOPS

이 수치는 벤치마크 상에서 Mali-400MP4, SGX543MP 계열과의 성능 차이를 납득하게 할만한 값으로 보입니다.

-
GLBenchmark 2.5.1 로 패치되면서 결과가 크게 달라졌습니다.
http://www.glbenchmark.com/phonedetails.jsp?D=Huawei+U9508&benchmark=glpro25
http://www.glbenchmark.com/phonedetails.jsp?D=Freescale+SABRESD-MX6DQ&benchmark=glpro25




4코어인 GC2000 528MHz 의 테스트 결과가 15.1 fps
16코어인 GC4000 2코어 의 테스트 결과가 14.8 fps

스펙은 4배, 성능은 0.98배.
클럭은 130MHz 가 나옵니다.

130MHz 에서의 GC4000 2코어 성능을 계산해보면 다음과 같습니다.
86.7 Mtri/s, 1.04 Gpix/s, 18.7 GFLOPS
(성능이야 그렇다쳐도 클럭이 너무 낮은듯.)

Freescale i.MX 6D/Q 결과 2.5.1 이전에는 8.3 이었는데, 2.5.1 에서 두 배 가까이 상승한건 확실히 의심스럽습니다. 테스트 결과도 하나뿐이고요.
(오버클럭 된 결과일지도.)

이 부분은 아직 그렇게 신용하기는 어려워보입니다.
-


-
의문점은 또 있습니다.

 

같은 제품인데 어째서 결과가 이렇게 다른 것인가...
위의 것도 그렇고, 결과가 이상할만큼 높은건 모두 다 특정인물이 업로드한 결과인데,
그렇기때문에 무조건적으로 신뢰할게 아니라 조심스럽게 접근해야할듯 합니다.
-



- 2012.12.04 Innersion.19 = GC4000 2코어 를 기준으로 한 전면적인 재수정.



반응형

댓글