본문 바로가기

부동소수점연산성능3

ARM 기반 아키텍처별 부동소수점 연산성능. 올라온지 좀 된 자료인데 린팩보다 훨씬 더 정확한 것 같아서 올립니다. (http://wlog.flatlib.jp/item/1620) 원본의 내용을 다수 참고하고 있으며 일부 저의 해석이 들어갔습니다. 테스트 원본입니다. (물론 테스트 자료 여러 개 취합해서 정리한건 저...) 결과 단위는 초(sec) 입니다. 값이 작을수록 빠릅니다. 각 제품마다 클럭이 다르기때문에 1.0GHz 기준으로 정규화한 결과입니다. 이래야 제대로 된 비교가 되겠지요. - 공통내용 m44 : NEON을 사용한 4 x 4 매트릭스 연산. A : 파이프라인 최적화 없음, 인/아웃이 완전히 다른 레지스터. B : 4명령마다 인터리브(Interleave, 동시참조), 레이턴시가 커질 경우 A보다 스톨(stall)이 발생할 가능성 높음... 2013. 6. 5.
ARM 부동소수점 연산 성능 비교. v12.2 #hottrendsContainer{display:none !important;}차트는 클릭하면 커집니다.- v12.1 변경점1. 80여개이던 자료수가 200여개로 늘었습니다. 추가적인 리뷰로 인해 한자리 수의 증가는 있겠지만, 새로운 스마트폰 리뷰 사이트가 발견되지 않는한 이번처럼 급증하는 일은 없을 것으로 보입니다.2. 버전표시.12.1 은 12년 1월 기준이라는 얘기입니다.카탈리스트 방식을 따왔습니다.특별한 추가 자료가 없는한 갱신은 없습니다.3. ARM11, Cortex-A5 추가.Cortex-A5 는 저가형 스냅드래곤(싱글코어)에 제법 많이 사용되고 있습니다.4. 1GHz 기준 멀티스레.. 2012. 2. 1.
ARM 아키텍처, 제조사별 부동소수점 연산 성능 비교. Linpack(린팩) 안드로이드 버전은 린팩 기반으로 개발한 자바 버전이며, 안드로이드 스마트폰의 부동소수점 연산 성능을 측정합니다. 계산 밀집형 스레드 Ax=b를 통해 계산 속도를 알아냅니다. 안드로이드 Dalvik 가상 머신에서 부동소수점 연산 테스트를 합니다. 현재 스마트폰 시장을 독점하고 있는 ARM 기반으로 아키텍처는 다음 정도입니다. Cortex-A8 Cortex-A9 퀄컴의 Scorpion 같은 아키텍처라도 제조사에 따라 성능에 차이가 있습니다. 여기저기서 찾아본 자료는 다음 정도입니다. 컴퓨터 구조에 대해 구체적으로 아는바가 없기때문에 각 아키텍처의 차이에 따른 성능 차이의 원인은 정확히 모르겠네요. (작은 사진은 클릭하면 커짐.) http://www.anandtech.com/show/49.. 2011. 12. 22.