본문 바로가기
스마트폰/삼성 SAMSUNG

엑시노스9810 긱벤치4 점수 추정. (엑시노스 M3 성능 추정.)

by gamma0burst 2018. 2. 10.

- 엑시노스 M3 아키텍처에 대한 나름 자세한 정보가 나왔습니다.

(링크 : https://reviews.llvm.org/D42387)

아난드텍에서 이 내용을 토대로 작성한 자료를 근거로 엑시노스9810 긱벤치 점수를 추정해보겠습니다.

(링크 : https://www.anandtech.com/show/12361/samsung-exynos-m3-architecture)

 

(왼쪽 : 엑시노스M1/M2 , 오른쪽 : 엑시노스M3)

엑시노스M1/M2와 비교해서 사양이 얼마나 늘었는지 중요한 부분만 간단히 설명하면,

decode 발행 수 +50% 증가. (4->6)

정수 파이프 +33% 증가. (3->4) / 부동소수점 파이프 +50% 증가. (2->3)

로드(Load) 유닛 +100% 증가. (1->2) / 스토어(Store) 유닛 동일. (1->1)

캐시 정보는 불명입니다만 비슷하게 아키텍처 규모를 늘려온 애플의 사례를 봤을 때 L3 캐시가 들어가고, 그에 따라 L2 캐시 용량은 전작(엑시노스8895)의 2MB보다 줄어들 가능성이 높아보입니다.

 

이번 추정은 성능 향상치를 뽑아낼 수 있는 다양한 경우를 시도해보고 그 중에서 가장 타당해 보이는 경우를 선택한 결과입니다.

방법적으로 잘못되었을 가능성이 있고, 실제 결과와 다를 수 있습니다.

 

참고 : 엑시노스M1 아키텍처

(링크 : https://en.wikichip.org/wiki/samsung/microarchitectures/mongoose_1)

 

 

- 정수 연산 성능 증가 폭 추정.

파이프라인 구성을 보면,

M1/M2 : simple(add) + simple(add) + simple & complex(add/mul/div)

M3 : simple(add) + simple(add) + simple & complex(add/mul/div) + simple & complex(add/mul/div)

M1/M2와 비교해서 add 1->1cycle, mul 4->4cycle, div 21->12cycle

 

연산별로 성능 향상치를 보면,

add : 1/1 x3 = 3 -> 1/1 x4 = 4 , +33%

mul : 1/4 x1 = 0.25 -> 1/4 x2 = 0.5 , +100%

div : 1/21 x1 = 0.048 -> 1/12 x2 = 0.083 , +75%

평균 +69%

정수 연산 성능 향상치는 +70% 정도로 추정됩니다.

 

 

- 부동소수점 연산 성능 증가 폭 추정.

파이프라인 구성을 보면,

M1/M2 : fmac/fmul + add/div

M3 : fadd/fmac + fadd/fmac/div + fadd/fmac/div

add 3->2cycle, mul 4->4cycle, div 15->12cycle, fmac 5->4cycle

 

각 파이프 라인별로 cycle당 평균 연산 횟수를 계산해보면,

M1/M2 : fmac 2/5 = 0.4(fmac는 fmul과 중복되어 평균이 의미없음), add/div (1/3+1/15)/2 = 0.2

 -> total 0.4+0.2 = 0.6

M3 : fadd/fmac (1/2+1/4)/2 = 0.5, fadd/fmac/div (1/2+1/4+1/12)/3 = 0.361

 -> total 0.5+0.361+0.361 = 1.22

성능 향상치 1.22 / 0.6 = 2.04

부동소수점 연산 성능 향상치는 +100% 정도로 추정됩니다.

 

 

- 엑시노스9810 긱벤치4 점수 추정.

위의 추정을 토대로 긱벤치4 점수를 구해보겠습니다.

일단 삼성의 발표치를 보면 엑시노스9810 CPU 성능은 전작(엑시노스8895) 대비 싱글 2배, 멀티 1.4배 입니다.

엑시노스8895 발표 당시 긱벤치 싱글 총점, 멀티 총점의 기하평균 값을 기준으로 삼았던걸 보면 이번 기준 역시 긱벤치일 가능성이 높습니다.

(링크 : 엑시노스8895 CPU 성능. (Exynos8895, Galaxy S8) (2017.05.13. update))

엑시노스8895 대비 싱글코어 성능 2배라면 긱벤치 싱글코어 총점 4058점 입니다.

클럭은 발표 클럭인 2.9GHz 기준으로 보입니다. (갤럭시S9에 실제 2.9GHz로 들어갈지 여부에 대해 말이 많지요.)

 

(테스트 결과마다 약간씩 차이는 있겠지만) 엑시노스8895의 긱벤치4 싱글코어 항목별 점수는

Crypto 1257 , 정수 2114 , 부동소수점 1568 , 메모리 2721 , 총점 2029 입니다. (클럭 2.314GHz)

M3 아키텍처 정보를 보면 Crypto 유닛이 포함된 파이프라인이 2배로 늘어 Crypto 성능은 M1/M2의 2배이고 정수, 부동소수점 성능 향상 추정치는 앞서 각각 +70%, +100% 정도로 추정했습니다.

이 값들은 엑시노스8895 점수에 적용하면

M3 2.314GHz에서의 긱벤치4 싱글코어 세부항목 점수는 Crypto 2514 , 정수 3583 , 부동소수점 3193 이고,

2.9GHz에서의 점수를 계산하면 Crypto 3151 , 정수 4490 , 부동소수점 4002 입니다.

메모리 점수를 제외한 이 세 항목만으로 총점을 구하면 3379 입니다.

삼성의 발표치로 추측한 총점 4058 에 맞춰서 계산해보면 메모리 점수는 3401 이고, 이는 엑시노스8895 대비 +25% 수준입니다.

(애플 A10 메모리 점수가 3200점 내외로 비슷.)

 

 

- 요약

1. 엑시노스M1/M2 대비 엑시노스M3 성능 향상치 추정.

긱벤치4 점수 기준 Crypto +100%, 정수 +70%, 부동소수점 +100%, 메모리 +25%

 

2. 엑시노스9810 긱벤치4 싱글코어 점수 추정.

2.9GHz 기준 Crypto 3151, 정수 4490, 부동소수점 4002, 메모리 3401, 총점 4058

 

 

 

댓글26