본문 바로가기
반응형

GPU48

엔비디아 테그라K1 GPU 성능. (Nvidia Tegra K1) GFX벤치에 테그라 K1의 최대 성능으로 보이는 결과가 올라왔습니다. (링크 : http://gfxbench.com/device.jsp?benchmark=gfx30&os=Android&api=gl&D=NVidia%20Mocha) - 테스트 기기 사양 Nvidia Mocha 디스플레이 : 7.9인치, 2048 x 1536 CPU : Cortex-A15 쿼드 2116MHz 사양만 보면 태블릿 플랫폼으로 보입니다. 엔비디아 Mocha라는 이름을 봐서는 개발용 플랫폼이거나 테그라K1 탑재 레퍼런스 디자인일지도 모르겠습니다. Mocha라는건 아무래도 테그라K1의 코드네임 혹은 테그라K1 플랫폼의 코드네임으로 보입니다. 해당 제품의 AP 네임이 ARM Mocha 인걸 봐서 말이지요. (링크 : http://brow.. 2014. 5. 8.
엔비디아 테그라K1 GPU 클럭/성능 추정. (Tegra K1) 테그라 K1의 GPU 성능에 대해 간단히 다뤄봤는데 추가적으로 나온 정보와 이전 정보를 합쳐서 테그라 K1 GPU의 클럭, 그래픽 성능을 추정해보겠습니다. (링크: 엔비디아 테그라K1 (32bit) 벤치마크 및 간단 분석.) - 최초 벤치입니다. (링크 : http://gfxbench.com/device.jsp?benchmark=gfx30&os=Android&api=gl&D=Lenovo%20ThinkVision%2028) Lenovo Thinkvision 28 시스템 정보상 CPU 클럭 2.014 GHz 텍셀 필레이트는 3849/3769 MTex/s (On/Off screen) 테스트 결과에는 프레임이 없지만 탐스하드웨어의 정보를 보면 T-Rex offscreen 48 fps 입니다. (링크 : http.. 2014. 5. 3.
엔비디아 테그라K1 (32bit) 벤치마크 및 간단 분석. 어느 분의 제보로 알게된 벤치마크 결과입니다. (링크 : http://gamma0burst.tistory.com/689#comment8446713) 티렉스, 맨해튼 테스트가 없어서 미처 못 봤나봅니다. - GFX벤치에 테그라K1 32비트의 벤치마크가 올라왔습니다. 링크 : http://gfxbench.com/device.jsp?benchmark=gfx30&os=Android&api=gl&D=Lenovo%20ThinkVision%2028) 테그라K1 발표 초기에 탐스하드웨어엣 벤치마크했었던 레노버 Thinkvisoin 28 입니다. 탐스 벤치에서 티렉스 오프스크린 결과가 48 fps 였습니다. (링크 : http://www.tomshardware.com/news/lenovo-thinkvision-28-nv.. 2014. 4. 13.
RK3288로 보는 Mali-T760 성능. GFX벤치마크에 RK3288의 테스트 결과가 올라왔습니다. (링크 : http://www.glbenchmark.com/device.jsp?benchmark=gfx30&os=Android&api=gl&D=Rockchip+rk3288&testgroup=overall) 먼저 RK3288의 대략적인 사양을 보면, Cortex-A17 쿼드코어 1.8GHz Mali-T760MP4 600MHz Cortex-A17을 보고 오타라고 비웃는 분위기가 있었으나 얼마 뒤 ARM에서 Cortex-A17을 발표해버리면서 비웃던 사람들을 뻘쭘하게 만들었지요. 거기에 저도 포함되고요... (링크 : RK3288로 보는 Mali-T760 성능 추정.) 시스템 정보부터 보면, ARMv7 기반 쿼드코어 1.0GHz or 1.4GHz Ma.. 2014. 3. 25.
APPLE A7 분석 (3) GPU 성능 및 G6430 사양 추정. GPU 사이즈는 전체의 22%. 23mm2 정도입니다. GPU 코어만 따지면 16mm2 정도입니다. 32nm A6의 SGX543MP3의 GPU 코어 면적이 22mm2 정도였습니다. 규모로 보면 A6 대비 95~100% 수준입니다. GPU의 종류와 클럭을 추정해보겠습니다. 우선 벤치마크 결과부터 보겠습니다. A6 대비 2배라더니 4배 가까운 성능입니다. 2.5 이집트 HD 오프스크린으로 비교해보면 A6 대비 2배입니다. 아무래도 업계에서 말하는 성능 기준은 2.5 이집트인가 봅니다. 2.5가 2.7보다 현실적인 조건이기도 할테니 2.5를 기준으로 테스트하고 있을 가능성이 있겠습니다. GPU는 거의 무조건 이매지네이션의 제품일 것이고 구체적인 종류가 의문입니다. 다이 사진을 통해 GPU 코어 구성이 4개라는.. 2013. 10. 1.
GPU 아키텍처별 효율 분석. (1) 기초 배경 설명. 이전에 엔비디아와 AMD의 GPU와 그 연산 성능에 대해 간략히 다뤘습니다. (AMD GPU 부동소수점연산(FLOPS) 계산.) (Nvidia GPU 부동소수점연산(FLOPS) 계산.) (계산한 것은 이론적인 피크치일뿐이고, 게이밍으로 대표되는 일반적인 사용자 환경과는 동떨어진 부분이지만요.) GPU 제조사들은 새로운 GPU를 발표할 때마다, 더 높은 효율의 새로운 아키텍처, 유닛을 홍보합니다. 이번 포스팅에서는, 이런 아키텍처의 차이가 실제 환경에서 어떻게 나타나는지 분석해보고자 합니다. (어떤 결과가 나올지는 모르겠지만...) - 1 - 분석을 위해서는 절대적인 평가 지표가 필요합니다. 이 지표에는 그래픽 카드의 성능을 드러내는 요소가 반영되어야하고요. 여기에 가장 적합한 벤치마크 프로그램이 3Dma.. 2012. 8. 26.
Nvidia GPU 부동소수점연산(FLOPS) 계산. 플롭스(FLOPS) 관련 기초 내용은 이전 포스트 참고. (AMD GPU 부동소수점연산(FLOPS) 계산.) (1) G80/G92 계열 Geforce 8000, Geforce 9000, GT100, 일부 GTX200 계열에 사용. 32비트 단정밀도(Single-Precision) 지원. (Geforce 9000 만 지원) 64비트 배정밀도(Double-Precision) 미지원. G92 는 G80 에서 텍스처 유닛이 강화되고, 공정이 더 미세화되었다는 것 외에는 동일합니다. Geforce 9000 계열이 사골이라고 욕먹는 이유. (이하의 이런 류의 일러스트는 모두 後藤 弘茂(Hiroshige Goto)씨 출처입니다.) G80/G92 코어는 SM(Streaming Multiprocessor) - TPC(T.. 2012. 8. 21.
AMD GPU 부동소수점연산(FLOPS) 계산. FLOPS (FLoating point OPeration per Second, 플롭스) 는 초당 부동소수전 연산 횟수라는 뜻으로, 컴퓨터의 성능을 평가하는 가장 대표적인 지표입니다. 슈퍼컴퓨팅 등에서는 절대적인 성능 지표이고, 개인용 컴퓨터에 있어서도 (플롭스가 체감성능으로 이어지는 것은 아니지만) 성능 평가에 있어서 참고가 됩니다. 부동소수점은 실수를 표시할 때, 소수점을 고정하지 않고, 소수점의 위치를 따로 표기하는 방식으로 복잡한 연산이 필요한 슈퍼컴퓨팅 등에 기본적으로 쓰이는 방식입니다. 전체 비트는 부호를 나타내는 sign bit, 소수점의 위치에 대한 정보인 지수부분(exponent), 유효숫자를 표시하는 가수부분(fraction/mantissa) 으로 구성되어 있습니다. 가장 널리쓰이는 표준.. 2012. 8. 20.
APPLE The new iPad 그래픽 성능 http://www.glbenchmark.com/phonedetails.jsp?benchmark=glpro21&D=Apple+iPad+3&testgroup=overall 드디어 떳습니다. 신형 아이패드 벤치마크 결과. (The new iPad) 역시 SGX543 이였습니다. SGX543MP4 겠지요. iOS 가 원래 시스템 정보가 횡한데, 이번에도 역시나 입니다. 스크린 사이즈는 오류가 있는듯. 딱봐도 엄청난 수치들. Offscreen 720p 이집트/프로가 140.9 Fps/252.1 Fps 아이패드2 의 결과와 제법 차이가 나지만, 두배까지는 아닙니다. 아이패드2 의 SGX543MP2 보다 클럭은 낮다는 반증입니다. (차후에 더 높은 결과가 올라온다면 어떻게 될지 모릅니다만, 현재로는 그렇습니다.) .. 2012. 3. 13.
테그라3 GPU 클럭 추정 엔비디아의 AP, 테그라의 GPU는 ULP Geforce 라는 이름을 갖고 있습니다. 테그라2 는 GPU 의 클럭이 구체적으로 밝혀진데 반해, 테그라3 의 GPU 클럭은 구체적인 값이 알려져있지 않습니다. 그 클럭을 계산해보려고 합니다. 일단 스펙을 확인해야겠지요. 테그라2는 버텍스 파이프라인 4개 + 픽셀 파이프라인 4개 의 구성이고, 테그라3는 버텍스 파이프라인 4개 + 픽셀 파이프라인 8개 의 구성입니다. GPU의 3D 출력과정을 보면, 결국 최종적으로 성능을 결정하는건 픽셀 파이프라인의 성능입니다. CPU나 버텍스 파이프라인에서 성능 병목이 생기지 않는다는 조건하에서 말이지요. 테그라3로 넘어오면서 버텍스 파이프라인이 강화되지 않고, 그대로 온 것을 보면 버텍스 파이프라인의 성능은 충분한 것으로 .. 2012. 3. 10.
반응형