본문 바로가기
반응형

adreno5

긱벤치 ML을 통한 Adreno GPU 사양 추정. (A7x, A6x, A5x) (update 23.11.05.) - 긱벤치ML(Geekbench ML)이 점수를 근거로 퀄컴 Adreno GPU ALU 사양을 추정해봄. GPU의 물리적 사양을 추정하는 방법을 대충 훑어보면 스마트폰 출시 초기에는 그래픽 성능 벤치마크 결과로 비슷한 제품군끼리 간접 비교했고 이후 GFX벤치 중 ALU 테스트같은 로우엔드 벤치마크가 추가되면서 이를 함께 활용해서 교차검증했음. ( 퀄컴 Adreno 사양/성능 분석. (update 2014.05.23) ) 하지만 그래픽 성능 벤치는 아키텍처가 같은 제품 간 비교에서는 그럭저럭 잘 맞지만 아키텍처가 바뀌면 비교하기 어려워지고, 이런 간접비교 방식은 비교 제품이 늘어날수록 오차가 누적됨. 로우엔드 벤치마크도 연산성능 이론치를 제대로 보여주지 못 해서 간접비교 방식에서 벗어나지 못 했음. 이후 .. 2023. 10. 24.
Adreno330 vs Mali-T628 GFXBench Manhattan 성능 차이 분석. - 시작하기에 앞서 A330과 T628MP6을 비교해보면 2.1 이집트 - 2.7 티렉스 - 3.0 맨해튼으로 올수록 T628의 성능이 열세로 나타남. 2.1에서는 우위였으나 2.7에서 동급, 3.0에서 열세로 돌아섬. 이는 테스트 성향이 픽셀 중심에서 폴리곤(텍스처, 버텍스) 중심으로 넘어가고 있기때문으로 추측. 후자쪽으로 갈수록 ALU(SP : 쉐이더 프로세서)의 사용률이 올라감. 3DMark가 대표적인 케이스인데 SP x 클럭(근사적으로 연산성능.)에 비례해서 점수가 나오는 수준. 물론 실제 게임 등에서는 그 정도로 쉐이더를 하드하게 쓰지는 않는건지 SP수와 프레임이 비례하기는 않지만 최소한 하드한 벤치마크에서는 ALU(SP)성능이 중요하다는 것. 그리고 그런 경향이 이제 모바일 GPU 벤치마크에서.. 2014. 9. 27.
모바일 GPU사양과 GFXBench(GLBenchmark) 성능 관계에 대하여. GFX벤치(GFXBench, GLBenchmark) 2.7 결과와 GPU 성능 간에 어떤 관계성이 있는지 분석해봤습니다. 테스트 결과는 GFXBench 2.7 T-Rex offscreen를 기준으로 하며, 각 GPU 사양은 인터넷에서 최대한 정보를 긁어모아서 가장 적합한 사양을 선택했습니다. (특히 클럭) 연산부와 출력부가 명확히 분리되는 통합쉐이더 방식 GPU만을 대상으로 했습니다. Mali-400, 테그라처럼 버텍스 쉐이더, 픽셀 쉐이더가 따로 존재하는 구조에서는 명확한 관계성을 (쉽게) 발견하기 어렵습니다. 통합쉐이더 방식을 선택했기때문에 퀄컴 Adreno, 이매지네이션 PowerVR 계열을 다루었습니다. Mali-T600도 통합쉐이더이지만 아직 출시 제품의 사양이 다양하지 않기때문에 명확한 관계성.. 2014. 1. 18.
퀄컴 Adreno 사양/성능 분석. (update 2014.05.23) GL벤치마크 결과로 현재까지 알려진 Adreno GPU의 클럭이 맞는지 확인해보고, 클럭을 기반으로 이론적인 성능을 정리해보겠습니다. 이하 그래프는 GL벤치마크 2.7/2.5 에서 각 제품의 성능 분포입니다. 연산성능 계산을 위한 ALU 구성을 먼저 보겠습니다. Adreno 계열은 기본적으로 4vec+1scalar 의 ALU 구성을 보입니다. ALU수로 카운트되는건 벡터(vec) ALU 만이고요. 벡터 유닛은 1클럭에 2번의 연산을 하고 스칼라 유닛은 1클럭에 1번의 연산을 합니다. Adreno200 계열은 스칼라 유닛이 FP연산을 못 하고, Adreno300 계열은 가능하다고 합니다. - Adreno 200 1 TMU, 1 ROP 로 구성된 MP1으로 볼 수 있습니다. MP1 당 8 ALU 2.7에서는.. 2014. 1. 12.
스냅드래곤 S4 MSM8960(Adreno225) 그래픽 성능 분석 & 예측. 스냅드래곤은 S1 ~ S4 의 4개의 라인업으로 구성되어 있습니다. 이 중 S4는 지난 10월 7일 발표되었습니다. 특징을 몇 가지 짚어보면 다음과 같습니다. - Scorpion 아키텍처에서 Krait 아키텍처로 변경. 클럭당 성능이 60% 향상. 2.1DMIPS 에서 3.3DMIPS 로 성능이 증가한겁니다. 참고로, Cortex-A8 : 2.0 DMIPS/MHz Cortex-A9 : 2.5 DMIPS/MHz Cortex-A15 : 3.5 DMIPS/MHz (추정) - 28nm 공정 - 3G/LTE 통신기능 내장 - GPU : Adreno225 통합 쉐이더 아키텍처(USA)을 사용하여 그래픽 자원을 효율적으로 활용할 수 있습니다. 성능은 이전 세대인 Adreno200 의 6배, Adreno205 의 3배.. 2011. 11. 26.
반응형