본문 바로가기
단신/찌라시 읽기

찌라시 읽기 (2) 64bit 엑시노스 사양 추정.

by gamma0burst 2014. 6. 8.
반응형


전 포스팅에서 Cortex-A57/A53 긱벤치3 점수를 예측.[각주:1]
이것과 찌라시 내용을 근거로 향후 나올 Cortex-A57/A53 프로세서 긱벤치3 성능을 추정해보겠습니다.
계산 과정이 쓸데없이 길어서 그냥 마지막의 결론만 봐도될듯.



1. 찌라시 내용.
싱글 1650

싱글 1793
멀티 6785

일단 이 제품이 Cortex-A57 기반으로 보겠습니다.
계산해보고 안 맞으면 다른 기반이라고 봐야겠지요. (결과봐서는 맞는거 같지만요.)


2. 분석1 - 싱글 1793
예상에서 1.0GHz 기준으로[각주:2]
A57 32b int : 587
A57 32b fp : 567
A57 32b mem : A15 32b 대비 +20%
A57 64b int : 785
A57 64b fp : 637
A57 64b mem : A15 32b 대비 +45%

총점 = (int + fp) x0.4 + mem x0.2

- 32bit
1793 = (587 + 567) x클럭 x0.4 + mem x0.2

메모리 점수가 최소 엑시노스5 는 될테니까 현 엑시노스5 최대값이 1034[각주:3] 수준.
이것의 1.20배 -> 1241

1793 = (587 + 567) x클럭 x0.4 + 1241 x0.2 -> 클럭 3.35GHz
말도 안 되게 클럭이 높습니다.
둘 중 하나입니다.
메모리 점수가 높아져야하든가, 32b가 아닌 64b 점수든가.

- 64bit ?
mem : 1034 x1.45 = 1499
1793 = (785 + 637) x클럭 x0.4 + 1499 x0.2 -> 클럭 2.63GHz
그나마 현실적인 수준.

메모리 점수를 올려보겠습니다.
메모리 대역폭이 두 배로 늘어난다고보고 대역폭이 25.6GB/s인 제품의 메모리 점수를 보면 1337[각주:4]
왜 이 점수를 택했는가?
긱벤치3에서 아톰, 리눅스 플랫폼의 메모리 대역폭-점수 가 엑시노스와 비슷하기때문입니다.
메모리 대역폭이 유사한 Z3770의 메모리 점수는 싱글 최대 1030[각주:5] 으로 위에서 인용한 엑시노스 메모리 점수와 일치하는 수준입니다.

- 다시 32bit
mem : 1337 x1.2 = 1604
1793 = (587 + 567) x클럭 x0.4 + 1604 x0.2 -> 3.19GHz
여전히 클럭이 높습니다.

- 다시 64bit
mem : 1337 x1.45 = 1939
1793 = (785 + 637) x클럭 x0.4 + 1939 x0.2 -> 클럭 2.47GHz
이게 제일 그럴듯 하네요.

- 1650은?
32b : 1650 = (587 + 567) x클럭 x0.4 + 1604 x0.2 -> 클럭 2.91GHz
64b : 1650 = (785 + 637) x클럭 x0.4 + 1939 x0.2 -> 클럭 2.22GHz

-> Cortex-A57 64bit 2.47GHz


3. 분석2 - 멀티 6785
A57 점수부터 계산.

- A57 쿼드 2.47GHz
64b : 정수 7756, 부동소수점 6294
32b : 정수 5800, 부동소수점 5602

- 메모리 점수
앞서 가정한대로
64b : 싱글 1939 -> 멀티 2061
32b : 싱글 1604 -> 멀티 1705

엑시노스5 긱벤치 결과를 보면 메모리 점수는 싱글이나 멀티나 차이가 거의 없습니다. 스냅드래곤은 안 그런데 말이지요.
그래도 차이가 아예 없는건 아니라서 6% 정도 차이가 있습니다.[각주:6]


- A53 점수는?
동클럭 점수는[각주:7]
A53 64b int : 405
A53 64b fp : 327

64b : 6785 = A57점수 x0.4 + A53점수 x0.6[각주:8] x0.4 + 메모리 x0.2
(리틀코어 점수가 60%만 반영되는건 엑시노스5260 결과가 그렇기때문입니다. 5422는 현재 최대치가 26%)
위 식을 숫자로 풀어보면,

6785 = [(7756 + 6294) x0.4] + [(405 + 327) x클럭 x4코어 x0.4 x0.6] + 2061 x0.2
-> (405 + 327) x클럭 x4 x0.4 x0.6 = 753 -> 클럭 1.07GHz
말도 안 되는 수준은 아니지만 엑시노스5 리틀코어 클럭이 1.3GHz인걸 생각하면 좀 낮습니다.
리틀코어 점수 반영비율을 엑시노스5260이 아닌 엑시노스5422에 맞춰서 재계산해보겠습니다.

6785 = [(7759 + 6307) x0.4] + [(447 + 362) x클럭 x4코어 x0.4 x0.26] + 1939 x0.2
-> (405 + 327) x클럭 x4 x0.4 x0.26 = 753 -> 클럭 2.47GHz
이번엔 너무 높습니다.
멀티 결과가 32b 결과라고 가정하고 계산해보겠습니다.

A53의 32b에서의 성능에 대한 자료가 없는데 A57처럼 64b-32b 간에 정수 33%, 부동소수점 12%의 성능차이가 있다고 가정하겠습니다.
A53 32b int : 405 / 1.33 = 305
A53 32b fp : 327 / 1.12 = 292

32b : 6785 = [(5800 + 5602) x0.4] + [(305 + 292) x클럭 x4코어 x0.4 x0.6] + 1705 x0.2
-> (362 + 323) x클럭 x4 x0.4 x0.6 = 1883 -> 클럭 2.86GHz
더 이상하게 나오네요.

64b 결과가 맞다는 것이고 가장 큰 가능성은 리틀코어 점수 반영 비율이 정확하지 않다는 것입니다.
위의 계산상 30~60% 사이일텐데 이것만으로 A53 클럭을 특정할 수 없습니다.
시도해볼 수 있는 방법은 연산성능을 근거로 해보는 것.

빅코어와 리틀코어의 성능 격차를 일정할 것이라는 가정입니다.

엑시노스5420을 보면
A15 1.9GHz : 3.5 DMIPS/MHz x 1900MHz = 6650 DMIPS
A7 1.3GHz : 1.86 DMIPS/MHz x 1300MHz = 2418 DMIPS
-> A15의 36.4%
이를 그대로 적용하면,

A57 2.47GHz : 4.1 DMIPS/MHz x 2470MHz = 10127 DMIPS
-> 10127 x36.4% = 3686 DMIPS -> 3686 = 2.3 DMIPS/MHz x 클럭 -> 클럭 = 1.6GHz
(ARM의 주장에 따르면 A57 4.1 DMIPS/MHz, A53 2.3 DMIPS/MHz)

A53 쿼드 1.6GHz로 계산해보면,
6785 = [(7756 + 6294) x0.4] + [(405 + 327) x1.6 x4 x0.4 x반영비율] + 2061 x0.2
-> 반영비율 40.2%
리틀코어 점수 반영비율은 40% 정도로 계산되는데 실제 어떨지는 뭐 두고 볼 일.


- 요약
64bit 엑시노스 성능 찌라시.
긱벤치3
싱글 1793
멀티 6785

이하 추정 내용.
64bit 결과.
CPU 구성 : Cortex-A57 쿼드 2.47GHz + Cortex-A53 쿼드 1.6GHz
메모리 대역폭 25.6GB/s

싱글 점수
(괄호 안은 엑시노스5422 대비 상승률.)
정수 : 1939 (+87%)
부동소수점 : 1573 (+75%)
메모리 : 1939 (+88%)
총점 : 1793 (+83%)

멀티 점수
정수 : 8831 (+123%)
부동소수점 : 7162 (+94%)
메모리 : 2061 (+88%)

총점 : 6785 (+107%)

 

 

 

  1. http://gamma0burst.tistory.com/731 [본문으로]
  2. http://gamma0burst.tistory.com/731 [본문으로]
  3. http://browser.primatelabs.com/geekbench3/545659 [본문으로]
  4. http://browser.primatelabs.com/geekbench3/218388 [본문으로]
  5. http://browser.primatelabs.com/geekbench3/52725 [본문으로]
  6. http://browser.primatelabs.com/geekbench3/545659 [본문으로]
  7. http://gamma0burst.tistory.com/731 [본문으로]
  8. http://gamma0burst.tistory.com/712 [본문으로]
반응형

댓글