본문 바로가기
성능비교 그래프/부동소수점 연산 (VFP)

ARM 부동소수점 연산 성능 비교. v12.2

by gamma0burst 2012. 2. 1.
반응형

차트는 클릭하면 커집니다.









- v12.1 변경점


1. 80여개이던 자료수가 200여개로 늘었습니다. 
추가적인 리뷰로 인해 한자리 수의 증가는 있겠지만,
새로운 스마트폰 리뷰 사이트가 발견되지 않는한 이번처럼 급증하는 일은 없을 것으로 보입니다.

2. 버전표시.

12.1 은 12년 1월 기준이라는 얘기입니다.
카탈리스트 방식을 따왔습니다.
특별한 추가 자료가 없는한 갱신은 없습니다.

3. ARM11, Cortex-A5 추가.

Cortex-A5 는 저가형 스냅드래곤(싱글코어)에 제법 많이 사용되고 있습니다.

4. 1GHz 기준 멀티스레드 성능 차트 추가.


5. 싱글, 멀티스레드 간의 비율을 활용하여 멀티코어 성능 향상 비율 차트 작성.

6. 테그라3 성능 수정.
테그라3 탑재 제품 중 아수스의 트랜스포머 프라임은 성능모드별로 클럭이 다른데, 이것을 반영.

- v12.2
1. 자료수 증가. (전체 자료수 약 650개)
2. 스냅드래곤 S1, S2 추가. (총 4종, Scorpion 기반 1.4GHz, 1.5GHz, Cortex-A5 기반 0.6GHz, 0.8GHz)
3. 다수 해외 사이트의 내용을 반영하여 테그라3 모드별 클럭 조정. (760Mhz ->700MHz, 620MHz ->600MHz)
 참고로 말하자면, 이 조정은 테그라3 성능이 높게 나오는데 유리한 방향임. (특히 멀티스레드 성능)


- 이런저런 포인트



1. 스냅드래곤 싱글코어 1.5GHz 와 듀얼코어 1.5GHz 의 싱글스레드 성능 비교시,
싱글코어쪽이 10%정도 높게 나옵니다.
메모리 듀얼채널의 효과가 아닌가 추측됩니다.
(모든 스냅드래곤 제품 중에서 S2 싱글코어 일부 제품만이 듀얼채널 지원.)

2. 테그라3 의 멀티스레드 성능이 엑시노스 1.4GHz 멀티스레드 성능보다 낮게 나옴.
이건 각 벤치마크 사이트에서 테스트를 엉망으로 했을 가능성이 매우 높습니다.
엔가젯에서 최대 135MFLOPS가 나왔음에도 불구하고, 그 외의 사이트는 100을 넘기 못하는 경우가 허다합니다.
앞으로 테그라3 탑재 제품이 다수 출시되고 테스트 결과가 축적된다면 자연스럽게 오차가 해소될 것으로 보입니다.
하지만, 비동기식 멀티코어의 효율 문제일 가능성도 있습니다.



3. 허밍버드와 OMAP3 의 성능차이.
약 10%정도 납니다.
스펙상 걸리는건 허밍버드의 L2 캐시가 OMAP3 의 2배라는 것 정도입니다.

4. NEON 제외로 인해 테그라2 의 부동소수점연산 성능이 떨어지지는 않는 것으로 보입니다.
Cortex-A9 아키텍처는 기본적으로 VFPv3 을 갖추고 있고, 테그라2는 NEON이 없는 경우를 위한 VFPv3-D16 을 갖고 있습니다.
문제라면 VFPv3 이 NEON보다는 효율이 떨어진다는 점이지만, 테스트 결과를 봐서는 최소한 린팩에서는 크게 패널티가 되지는 않는 수준으로 보입니다.


5. 테그라3 의 멀티스레드 능력에 대한 부분.
4코어치고 상당히 낮은데, 테그라3 의 화이트 페이퍼를 보면 어느정도 납득이 갑니다.


린팩 멀티스레드에서 쿼드코어의 성능이 듀얼코어의 1.5배 정도라는, 엔비디아 발표의 공식자료입니다.
(칼엘은 테그라3의 코드명)

동클럭 싱글스레드에서 테그라2 와 테그라3 의 차이가 거의 없는데,
위의 멀티스레드 차트에서, 테그라2 가 57.4, 테그라3 가 84.2 의 값을 보입니다.
테그라3 가 테그라2 의 1.47배이지요.
엔비디아의 자료와 대략적으로 들어맞는 결과입니다.


6. 테그라3 와 스냅드래곤의 멀티코어 효율이 낮은건, 비동기식이기때문인 것으로 보입니다.
(동기식, 비동기식의 차이는 다음 포스팅 참고 : 모바일 AP 둘러보기. (3) Cortex-A9)


반응형

댓글