반응형 성능비교 그래프/부동소수점 연산 (VFP)22 ARM 부동소수점 연산 성능 비교 v13.11 1. 엑시노스 5420 1.9GHz 싱글스레드, 멀티스레드 모두 스냅드래곤800과 비슷한 결과입니다. 평균치라서 차이가 있지 최대치를 비교하면 멀티스레드에서 스냅드래곤800은 1088 MFLOPS, 엑시노스 5420은 1081 MFLOPS입니다. 2. 쿼드코어의 싱글스레드. 엑시노스 5420이 1.9GHz라는데 엑시노스 5410 결과와 비교해보면 간단히 생각하기가 어렵네요. 터보부스트나 테그라처럼 쿼드코어 로드시의 클럭보다 듀얼코어 로드시의 클럭이 더 높은걸지도 모르겠습니다. 이와 묶어서 싱글스레드에서 듀얼코어가 동작한다고 해석할 수도 있습니다. 자세한건 나중에 따로 포스팅하겠습니다. 2013. 10. 29. ARM 부동소수점 연산 성능 비교 v13.7 1. 스냅드래곤800 추가. 드디어 1GFLOPS 돌파입니다. 하지만 린팩이 VFPv4 성능을 제대로 뽑아낸다고 보기 힘든 상황인지라 크게 의미부여하기는 어렵습니다. 2. 클로버트레일+ 결과 추가. 이제야 제대로 된 멀티스레드 성능을 보여줍니다. 3. K3V2 결과가 추가. 이제야 Cortex-A9 다운 결과가 나옵니다. 4. 동클럭 성능에서는 스냅드래곤800도 엑시노스 5410에 안 됩니다. 스냅드래곤600과는 확실한 차이를 보이고 있습니다. 차이는 10~15% 정도. 5. 스냅드래곤200 쿼드코어 추가. Cortex-A5 기반입니다. 멀티스레드가 싱글스레드의 두 배 정도 밖에 안 되는 것으로보아 최적화의 여지가 있다고 봅니다. 6. K3V2 멀티코어 효율이 기타 쿼드코어 제품과 비슷한 수준까지 올라갔.. 2013. 7. 1. ARM 기반 아키텍처별 부동소수점 연산성능. 올라온지 좀 된 자료인데 린팩보다 훨씬 더 정확한 것 같아서 올립니다. (http://wlog.flatlib.jp/item/1620) 원본의 내용을 다수 참고하고 있으며 일부 저의 해석이 들어갔습니다. 테스트 원본입니다. (물론 테스트 자료 여러 개 취합해서 정리한건 저...) 결과 단위는 초(sec) 입니다. 값이 작을수록 빠릅니다. 각 제품마다 클럭이 다르기때문에 1.0GHz 기준으로 정규화한 결과입니다. 이래야 제대로 된 비교가 되겠지요. - 공통내용 m44 : NEON을 사용한 4 x 4 매트릭스 연산. A : 파이프라인 최적화 없음, 인/아웃이 완전히 다른 레지스터. B : 4명령마다 인터리브(Interleave, 동시참조), 레이턴시가 커질 경우 A보다 스톨(stall)이 발생할 가능성 높음... 2013. 6. 5. ARM 부동소수점 연산 성능 비교 v13.6 1. 엑시노스5410 멀티스레드 결과. 결과 몇 개 쌓이니까 바로 스냅드래곤600 역전. 당연하다면 당연한건가... 2. 엑시노스5250이 엑시노스5410은 물론이고 스냅드래곤에게도 밀리는걸 보고 있으면, 본격적인 Cortex-A15 기반 제품을 위한 프로토 타입이 아니었나하는 느낌이 듭니다. 그런데 다른 벤치마크 결과보면 Coretx-A15 다운 모습을 보여줍니다. 린팩에서만 죽을 쒀요. 알다가도 모르겠음. 3. 쿼드코어 효율은 3.1 정도가 한계인듯합니다. 캐시와 메모리의 영향을 거의 받지 않는 벤치마크 앱이라면 더 높게 나올지도 모르겠지만, 일단 린팩은 아닌듯. v13.6 1. 스냅드래곤S4 듀얼 1.7GHz 추가. 2013. 5. 31. ARM 부동소수점 연산 성능 비교 v13.5 1. 엑시노스5 옥타 멀티스레드 추가. 추가이긴한데 테스트 자료가 거의 없습니다. 해외 3G판이나 국내판이 전부라서 그런듯. 국내에서 제대로 벤치마크 결과 올리는 곳이 거의 없으니까요. 멀티스레드 결과는 최대치는 아닌 것으로 보이지만 일단 있는 자료를 올렸습니다. 최대치가 궁금하시면 주변에 갤럭시S4 구입자들에게 린팩 돌려보라고 부추겨보시길.ㅋㅋ 2. 스냅드래곤400 추가. 스냅드래곤S4 듀얼과 차이가 심합니다. 평균의 함정이라는게 있지만 그런 부분을 배제해도 동클럭에서 7% 정도 높습니다. 3. 클로버트레일+ 추가. Z2580 추가입니다. 2코어 4스레드 2GHz 싱글스레드에서 메드필드보다 10%정도 높습니다. 멀티스레드는 아직 문제가 있어보입니다. 듀얼코어인데 싱글코어의 특성을 보이고 있습니다. 4... 2013. 5. 2. ARM 부동소수점 연산 성능 비교 v13.4 1. 엑시노스 5410 1.8GHz 스냅드래곤600을 가볍게 눌러버리는 결과. 엑시노스5250 결과와 비교하면 심하게 높습니다. 스냅드래곤S4 쿼드 때 처럼요. 듀얼코어가 싱글스레드 처리하는 수준의 성능인데 아무래도 아래와 같은 구조가 아닐까 추측. 듀얼코어의 성능이 1+1=2 가 아니라 1+1=1.7 이고, 쿼드코어도 1+1+1+1=4 가 아니라 1+1+1+1 = 2.2 (코어수가 늘어난만큼 100% 성능 증가가 있지않다는 것.) 이를 극복하기위해서 쿼드코어를 듀얼코어+듀얼코어로 구성해서 효율을 끌어올렸다는 것. 듀얼+듀얼이면 1.7 x 1.7 = 2.89 가 되서 2.2 보다 성능이 더 높으니까요. 이렇게되면 싱글스레드 작업에 듀얼코어가 사용될 수 있습니다. 린팩 결과를 보면 스냅드래곤 쿼드, 엑시노.. 2013. 3. 30. ARM 부동소수점 연산 성능 비교 v13.3 - 전체 결과 1. 스냅드래곤 600 추가했습니다. 기존의 스냅드래곤S4 쿼드보다 크게 향상된 것처럼 보이지만 실제 그런지 아래에서 다루겠습니다. - 클럭당성능 비교 2. 스냅드래곤 600 의 Krait 300은 기존 Krait 대비 클럭당성능이 15% 정도 상승했고, 부동소수점 연산, 자바스크립트 성능이 향상되었다고 합니다. 위의 클럭당 부동소수점 연산 성능을 보면 그 말이 맞는 것 같지요. (408.5/362.8 = 1.125, 12.5% 향상.) 그런데 저건 스로틀링 가능성이 있는 다수 결과의 평균이기때문에 차이가 나는 것이고, 최대값을 비교해보면 동급입니다. NEON의 성능은 모르겠지만, 린팩에서의 VFP 성능은 기존 스냅드래곤S4 프로와 스냅드래곤 600 이 같습니다. - 멀티코어 효율 3. 스.. 2013. 3. 1. ARM 부동소수점 연산 성능 비교 v13.2 1. 그 동안 스냅드래곤 S4 쿼드 결과가 지나치게 높다고 여겨졌습니다. 그런데 이게 젤리빈에서 뭔가 바뀌어서 그런걸지도 모르겠습니다. 제 포스트 봐온 분들은 아시겠지만 제가 쓰는게 테이크 LTE 입니다. 스냅드래곤S4 듀얼 탑재지요. 최근에 젤리빈이 올라갔는데, 린팩 결과가 상승했습니다. 싱글스레드가 100 정도였는데 150 정도로 올라갔고, 덩달아 멀티스레드도 200 정도에서 300 정도로 상승했습니다. 1.5GHz 싱글스레드 150 MFLOPS 는 스냅드래곤S4 쿼드 1.5GHz 싱글스레드 결과에 크게 근접하는 결과입니다. 그리고 쿼드코어이기때문에 멀티스레드에서 정확히 4배 성능이 나온다면 산술적으로 600 MFLOPS 인데, 이는 스냅드래곤S4 쿼드 1.5GHz 멀티스레드 결과 중 상위 결과들과 .. 2013. 1. 31. ARM 부동소수점 연산 성능 비교 v13.1 1. 스냅드래곤 S3 1.7GHz 이상하게 높게 나옵니다. 쓰는 제품도 거의 없습니다. 다른 결과를 기다려봐야겠네요. 2. Rockchip RK3066 클럭을 생각하면 특별히 좋다고 볼 수 없지만 무난합니다. 3. 스로틀링때문에 제 성능 안 나오는 경우가 있는데, (특히 쿼드코어) 린팩도 그런 영향을 받을지도 모르겠네요. v13.1 1. 스냅드래곤S3 1.7GHz 추가. 2. Rockchip RK3066 추가. 3. U8500 수정 -> U8500/U8420 2013. 1. 2. ARM 부동소수점 연산 성능 비교 v12.12 1. 스냅드래곤S4 쿼드 결과는 상당히 들쭉날쭉합니다. 간간히 스냅드래곤S4 듀얼과 비슷한 수준의 결과들도 있는데, 아직까지는 전체 데이터 중에서 비중이 낮아서 크게 의미를 부여하기 어렵습니다. 2. 엑시노스5 듀얼 멀티스레드 성능은 예상에서 크게 벗어납니다. Cortex-A15 에 아직 최적화가 안 된 린팩 탓인가, 원래 효율이 그 정도인건가. 3. 테그라3 데이터를 대대적으로 정리했습니다. 수준 이하의 데이터를 다 빼버렸는데, 기준을 높였더니 거의 반이 없어져버렸습니다. 덕분에 전반적으로 수치도 올라가고, 멀티코어 효율도 올라갔습니다. 4. Hisilicon K3V2 를 Huawei K3V2 로 변경. K3V2 는 화웨이 산하의 Hisilicon 에서 생산합니다. Hisilicon Hi3620 혹은 .. 2012. 12. 2. 이전 1 2 3 다음 반응형