본문 바로가기
스마트폰/애플 APPLE

애플 A8 사양/성능 분석. (1) CPU

by gamma0burst 2014. 9. 26.
반응형

 

- 애플 A8 (Apple A8) 사양, 성능 분석입니다.

 

- 애플이 아이폰6 발표시 언급한 A8 성능 향상치입니다.

최대 CPU는 50배, GPU는 84배라고 했습니다.

그렇다면 아이폰5S는 어땠을까요.

 

 

CPU는 40배, GPU는 56배였습니다.

 

그렇다면 아이폰6는 아이폰5S 대비 이렇습니다.

CPU 50/40 = 1.25 -> 25% 향상.

GPU 84/56 = 1.5 -> 50% 향상.

 

실제 그런지 보겠습니다.

 

 

- Chipworks의 분해 사진.

(링크 : http://www.chipworks.com/en/technical-competitive-analysis/resources/blog/inside-the-iphone-6-and-iphone-6-plus/)

 

 

 

 

 

파트 넘버, 코드, 게이트 피치(90nm)로 봐서 TSMC 20nm 공정이라는듯.

 

CPU 듀얼코어, GPU 이매지네이션 PowerVR GX6450

 

 

A7 102mm2 -> A8 89mm2, 87% 수준으로 축소.

28nm -> 20nm이니 원래대로면 50%로 줄어야하지요.

87%로 줄었으니 사양이 약간 늘었다는거겠지요.

SRAM 사이즈가 33% 밖에 안 줄었다는게 좀 그렇네요. (0.12µm2 -> 0.08µm2)

 

CPU : A7 17.1mm2 -> A8 12.2mm2, 71% 수준으로 축소.

L1 캐시 : 코어당 64KB -> 코어당 64KB

L2 캐시 : 공유 1MB -> 코어당 512KB

4MB L3 캐시 : A7 -> A8 80% 수준으로 축소.

 

SRAM을 봐서는 70% 정도까지는 줄어들어야하는데 그 정도 입니다.

아난드텍에서는 L1 캐시를 최대 256KB(코어당 128KB로 보는듯)까지 보고 있는듯 한데,

긱벤치의 시스템 정보나 다이의 레이아웃을 봤을 때 L1 캐시 용량 증가는 없는 것으로 보입니다.

다이 면적 측면에서는 사실상 기존 Cyclone 코어와 차이가 없는듯. 

다른 분석에서는 다이 레이아웃을 근거로 L2 캐시가 공유 캐시에서 비공유로 바뀐 것으로 보고 있습니다.

 

GPU : A7 22.1mm2 -> A8 19.1mm2, 86% 수준으로 축소.

면적 감소율이 특히 작은데 사양이 증가했기때문으로 볼 수 있습니다.

G6430과 GX6450이 클러스터 수는 같지만 GX6450에서 FP16 연산 유닛이 증가했기때문에 그것만으로도 면적이 증가할 이유가 되고, 그 외 추가적인 부분이 있을지도 모르겠습니다.

(링크 : 이매지네이션 PowerVR 시리즈6 코어 구성. (Imagination, Rogue))

 

 

- CPU 성능 분석

A8 : http://browser.primatelabs.com/geekbench3/831873 등

A7 : http://browser.primatelabs.com/geekbench3/343861 등

 

   

아이폰6 테스트가 AArch64 로 나오는데(맨 왼쪽) 이건 그냥 긱벤치3.2 이후에는 다 이렇습니다. (맨 오른쪽)

A7 최고 결과가 ARM64 결과인데(가운데), ARM64 결과나 AArch64 결과나 큰 차이가 없습니다.

(바로 밑에서 얘기하겠지만) A7과 A8 사이에 성능 차이가 있는데 이런 모드 차이를 원인으로 보기는 힘듭니다.

 

1.4GHz 결과를 기준으로 총점을 보면,

A8 : 싱글 1642, 멀티 2946

A7 : 싱글 1492, 멀티 2719

 

아이폰5S 클럭인 1.3GHz 결과를 보면,

A7 64bit : 싱글 1439, 멀티 2623

A7 32bit : 싱글 1084, 멀티 1948

 

A7 1.4GHz 기준, 싱글 +10%, 멀티 +8%

아이폰5S 64bit 결과 기준, 싱글 +14%, 멀티 +12%

아이폰5S 32bit 결과 기준, 싱글 +51%, 멀티 +51%

 

어떻게 끼워맞춰도 25% 향상은 안 나옵니다.

애플이 구라쳤네요.

 

정수 결과입니다.

A7과 비교하면 총점은 7% 정도 향상입니다.

일부 항목에서 10~15% 정도 향상이 있고, Dijkstra는 30% 가까운 성능향상이 있습니다.

 

Dijkstra은 64bit로 넘어오면서 오히려 성능이 크게 떨어졌던 항목인데 이번 성능향상 덕에 거의 32bit에 근접하는 결과로 회복되었습니다.

 

부동소수점 결과입니다.

정수보다 더 확실하게 성능향상이 보입니다.

총점에서 10% 올랐습니다.

세부 항목을 봐도 (감소된 항목도 있는 등) 들쭉날쭉했던 정수와 달리 모든 항목에서 점수 상승이 있습니다.

 

 

- 메모리 점수

싱글에서는 18%, 멀티에서 10% 정도의 점수 상승이 있습니다.

메모리 대역폭 상승을 기대하기 힘든 상황에서 점수 상승이 있는건데, 메모리 인터페이스의 개선이 있다고 봐야겠지요.

 

 

- 점수 상승 원인?

Dijkstra는 더 많은 캐시/메모리, 더 높은 캐시 적중률이 필요하다고 하고, 전반적으로 성능이 10% 가까이 상승한걸 봐서 캐시 용량 변화나 속도 상승, 메모리 계층 구조의 트윅 등이 있을지도 모르겠습니다.

아니면 메모리 인터페이스 개선으로 인한 메모리 성능 향상이 원인일지도 모르겠고요.

 

아키텍처 개선이 있을 때 항상 언급되는 분기예측 정확도 향상, 하드웨어 Prefetcher 추가 등이 있을지도.

(링크 : 퀄컴 스냅드래곤 Krait300/Krait 성능 비교.)

 

이유가 뭐든 아키텍처 측면에서 크게 달라진게 없어보이는데 성능이 향상되었다는건 인상적입니다.

 

 

- 정리

Apple A8

TSMC 20nm 공정.

CPU : Cyclone 듀얼코어.

 

A7 대비 평균 10%의 동클럭 성능 향상.

다만, 애플이 말한 아이폰5S 대비 +25% 수준은 아님.

 

 

- 2014.09.28. A8 32bit 테스트 결과.

(링크 : http://browser.primatelabs.com/geekbench3/876741)

따로 표로 정리할 필요는 없어보이고...

64비트-32비트 간 성능 차이는 A7 때와 비슷합니다.

정수 +37%, 부동소수점 +36%, 메모리 +18%

 

 

 

반응형

댓글