본문 바로가기
스마트폰/애플 APPLE

애플 A9, A9X CPU 성능 분석. (Geekbench3) (update 2015.12.07.)

by gamma0burst 2015. 11. 15.
반응형

 

- 아이폰6S/6S 플러스 탑재 애플 A9 긱벤치3 결과 비교입니다.

최근에 올라오기 시작한 아이패드 프로 탑재 A9X 결과도 함께 다루겠습니다.

 

보름만에 올리는거 같네요.

그동안 쌓인 숙제 하나둘씩 처리하겠습니다.

 

링크

A9 : http://browser.primatelabs.com/geekbench3/3558850

A9X : http://browser.primatelabs.com/geekbench3/4156653

 

 

- 사양

애플 A9

Twister 듀얼코어 1.85GHz

L1 캐시 32KB/32KB (명령어/데이터)

L2 캐시 3MB

L3 캐시 8MB

삼성 14LPE/TSMC 16FF

 

애플 A9X

Twister 듀얼코어 2.26GHz

L1 캐시 32KB/32KB (명령어/데이터)

L2 캐시 3MB

L3 캐시 8MB

TSMC 16nm

 

현재까지 긱벤치3에 올라온 보드 정보로는 J98aAP, J99aAP가 있습니다.

현재로는 아이폰6S와 다르게 AP 제조사가 하나라고 볼 수 있습니다.

그리고 iFixit의 분해 사진을 보면 APL1021 로 나오는데 이는 TSMC 제조 제품의 마킹입니다.

(링크 : 애플 A9 삼성,TSMC 모두 제조. (아이폰6S/6S 플러스 탑재))

즉, 현재까지 나온 정보로 보면 A9X는 TSMC 16nm 공정으로 제조된겁니다.

16FF 일지 16FF+ 공정일지는 좀 더 정보가 나와야할듯 합니다.

(마지막에 언급하겠습니다만 16FF일 가능성이 높습니다.)

 

(링크 : https://www.ifixit.com/Teardown/iPad+Pro+Teardown/52599)

 

 

- 동클럭 점수

동클럭으로 환산한 점수입니다.

아키텍처 간 클럭당성능을 비교할 수 있습니다.

 

아키텍처명은 아난드텍에서 얘기하는걸 기준으로 삼았습니다.

A7 : Cyclone

A8, A8X : Typhoon

A9, A9X : Twister

로 보는듯 합니다.

아키텍처명이 뭐든 구분만 되면 문제가 되지는 않겠지요.

 

1. A9 vs A9X

당연한 얘기지만 같은 아키텍처인 A9, A9X의 정수, 부동소수점 클럭당점수는 같습니다.

메모리 점수는 A9X가 +52% 높은데 메모리 사양(대역폭) 자체가 다르기때문입니다.

기존 결과를 보면 대역폭이 2배면 메모리 점수가 1.3배인데, A9X의 메모리 점수는 A9의 1.52배입니다.

기존 결과와 비슷한 패턴을 보인다고 가정하면 A9X의 메모리 대역폭은 A9의 2.72배로 계산됩니다.

 

위에 나온 아이패드 프로 사진을 보면 메모리가 하이닉스의 H9HCNNNBTUMLNR-NLH 로 나옵니다.

이걸 하이닉스의 제품 코드표로 해석해보면,

(링크 : http://www.skhynix.com/cha/support/technicalSupport.jsp#tg01)

16Gb, 듀얼적층, LPDDR4 1600MHz 입니다.

아이패드 프로의 램은 4GB = 32Gb 인데, 보드 이미지를 보면 메모리 칩의 크게 2개있으니 코드와 맞습니다. (16Gb x2 = 32Gb)

아이패드 프로 발표시 이미지에서는 삼성램의 코드가 나왔기때문에 삼성램도 들어갔을겁니다.

(링크 : 애플 발표 근거 A9X CPU 사양/긱벤치3 결과 추정.)

 

어쨌든 사양상 A9X의 메모리 대역폭은 A9의 두 배입니다.

기존 대역폭-점수 패턴과 안 맞지요. +17% 정도 점수가 더 잘 나옵니다.

기존 패턴을 파기해야하는거든가, Twister 아키텍처의 메모리 인터페이스 성능이 우수한걸지도 모르겠습니다.

어쩌면 메모리 다이수가 늘어나면서 성능상 이득이 발생한걸지도 모르겠습니다.

 

2. Typhoon vs Twister

타이푼과 비교하면 정수 성능 +15%, 부동소수점 +20%, 메모리 성능 +27% 입니다.

확실히 성능이 향상된 모습입니다.

 

 

- 원점수

클릭하면 커집니다.

 

 

1. A8 vs A9

애플 발표에서 전작(A8) 대비 CPU 성능 1.7배라고 밝혔습니다.

(링크 : 애플 발표 근거 A9 CPU 사양/긱벤치3 결과 추정. (update 2015.09.12))

점수를 보면 싱글 총점 +57%, 멀티 총점 +52% 입니다.

싱글 기준으로 보면 발표치의 81% 수준입니다. (57/70 = 0.81)

 

이 비율은 이건 A8, A8X의 사례와 비교해도 일관성이 없습니다.

긱벤치3 점수 추정을 위해서는 다른 방법을 찾아봐야할듯 합니다.

 

2. A8X vs A9X

애플 발표에서 전작(A8X) 대비 CPU 성능 1.8배라고 밝혔습니다.

(링크 : 애플 발표 근거 A9X CPU 사양/긱벤치3 결과 추정.)

점수를 보면 싱글 총점 +78%, 멀티 총점 +20% 입니다.

애플의 발표 기준이 싱글성능이라는건 확실해진듯 합니다.

싱글 기준으로 +90%에는 못 미칩니다. 발표치의 87% 수준. (78/90 = 0.87)

 

3. Twister와 14/16nm 공정의 힘.

멀티코어 총점을 보면,

듀얼코어 A9 = 트리플 코어 A8X < 듀얼코어 A9X

싱글코어 성능을 정말 극적으로 올려버린 Twister 아키텍처와 최신 공정의 힘이라고 밖에 볼 수 없습니다.

 

 

- Specint 2K

아난드텍에 올라온 Specint 2K 결과를 보면,

(링크 : http://www.anandtech.com/show/9686/the-apple-iphone-6s-and-iphone-6s-plus-review/4)

A8 1.4GHz 대비 +70%

클럭당점수도 1.418/MHz 로 1.098/MHz 였던 A8 대비 +29% 입니다.

 

 

- 쓰로틀링

1. A9

아이폰6S의 쓰로틀링 자료입니다.

(링크 : http://arstechnica.com/apple/2015/09/a-3d-touch-above-the-iphone-6s-and-6s-plus-reviewed/4/#h4)

간헐적으로 400MHz 떨어졌다가 원래 클럭으로 복귀하지만 전체적으로 10분동안 최대 클럭을 유지하고,

30분이 지나면 클럭이 25% 정도 떨어집니다.

초반에도 클럭 유지가 안 되고, 시간이 지나면 30%이상 클럭이 떨어졌던 기존 제품에 비해 엄청나게 발전되었습니다.

아키텍처와 공정이 모두 영향을 끼친 결과로 보입니다.

 

아이폰6S 플러스 쓰로틀링 경향을 보면,

크기가 큰 덕인지 30분이 지나도 최대 클럭을 유지합니다.

중간에 한 번씩 클럭이 떨어지는건 어쩔 수 없는 부분이겠고요.

 

2. A9X

A9X 쓰로틀링 자료입니다. 

(링크 : http://arstechnica.com/apple/2015/11/ipad-pro-review-mac-like-speed-with-all-the-virtues-and-limitations-of-ios/4/#h2)

비교 대상이 아이패드가 아니라 아이폰6S 네요.

구동시간에 관계없이 최대 클럭을 계속 유지합니다.

아래에서 언급하겠지만 아이패드 프로의 크기 덕에 늘어난 TDP 여유 덕에 (=쿨링이 원활한 덕에) 발열에 쓰로틀링이 거의 나타나지 않는다고 볼 수 있습니다.

그렇다해도 이렇게까지 최대 클럭을 유지할 수 있는걸보면 한계 TDP까지 클럭을 올리지는 않은듯 합니다.

이 역시 아래에서 언급하겠으나 CPU 코어만 놓고 따지면 산술적으로는 최소 10% 정도 클럭을 더 올릴 수 있을걸로 보이기때문입니다.

엄청나게 증가한 GPU 사양=성능=전력으로 인해 CPU에 할당할 수 있는 TDP는 이 정도가 한계였고,

GPU가 구동하지않고 CPU에만 로드가 걸리는 상황에서는 부담없이 최대 성능이 나올 수 있는게 아닌가 싶습니다.

 

 

- A9X , A9 클럭

A8 1.4GHz -> A9 1.85GHz

TSMC 공정 기준으로 보면 20SoC -> 16FF 기준 speed gain +20% 입니다.

(링크 : 애플 A9 논란에 관하여. (삼성, TSMC 공정 비교.))

대입해보면 1.4GHz x1.2 = 1.68GHz, 1.7GHz 가 됩니다.

A9는 이것보다 +10% 더 올라갔습니다.

A8 대비 +32% 올라갔는데, 공정 영향이 +20%, 아키텍처 영향이 +10% 라고 볼 수 있습니다.

 

A8X 1.5GHz -> A9X 2.26GHz

코어 수 차이를 일단 무시하고 보면 +50% 입니다.

A9X 공정이 16FF 라면 앞서 계산한대로 공정 영향 +20%, 아키텍처 영향 10%로 +32%가 설명됩니다.

남은건 +14% 입니다.

 

트리플 코어에서 듀얼코어로 줄었기때문에 단순히 계산해봐도 코어당 소비전력은 1.5배까지 허용됩니다.

게다가 인텔 자료를 보면 기존 아이패드 -> 아이패드 프로 의 화면 크기(=제품 크기) 증가로 TDP 여유는 +30% 증가합니다. (링크 : 애플 발표 근거 A9X CPU 사양/긱벤치3 결과 추정.)

둘을 합치면 코어당전력은 1.5 x 1.3 = 1.95, 2배까지 가능하다는게 됩니다. (A8X 대비)

물론 대충한 가정의 계산이기때문에 실제로는 저것보다는 적을겁니다만 최소 1.5배 이상은 가능합니다.

 

아난드텍의 정보를 자료로 보면 Twister 아키텍처의 가장 큰 변화는 파이프라인 스테이지가 짧아진 겁니다.

덕분에 분기예측 실패시 페널티가 크게 줄어들었는데 이는 성능 증가를 가져오지만 클럭을 올리는데는 불리한 방향입니다. (그럼에도 아키텍처의 영향으로 클럭이 +10% 증가한걸로 추정되지요.)

 

일단 아이폰6S의 CPU 클럭을 봐서는 Twister가 이전에 비해 고클럭에 타겟팅 된 아키텍처라고 볼 수 있는데,

그렇다 해도 전력대성능비에서 최적화된 클럭 구간 상한선은 아이폰6S의 클럭인1.85GHz 내외일겁니다.

그런데 아이패드 프로 클럭은 아이폰6S보다 +22%나 높습니다. (+0.4GHz)

+8% 정도(+0.1GHz) 높아던 전례와 비교하면 큰 차이입니다.

이 정도로 클럭을 올리려면 단순히 클럭만 올리는게 아니라 전압도 같이 올라가야하는건 불보듯 뻔하겠지요.

여기서 참고로 엑시노스7420 커널을 보면 1.9GHz -> 2.1~2.5GHz 까지 올라가는데 전압이 0.1V 올라갑니다.

약간의 차이는 있겠으나 전압이 10% 정도 증가한다고 봐도 무리는 없을겁니다.

0.1V 증가는 전압이 9~10% 증가한 것이고, 순수하게 전압증가로 인한 전력증가만 20% 이상 올라간겁니다. (전력은 전압의 제곱에 비례.)

여기에 클럭 증가 +14%가 더해지면 총 전력증가는 +38% 입니다.

 

앞서 계산한 코어 전력 상한치에는 약간 못 미칩니다만, 엄청나게 올라간 GPU 성능(=전력)을 고려하여 이 정도로 사양을 잡은게 아닌가 추측됩니다.

빠지는 CPU 전력은 GPU로 돌아간거지요.

 

 

- A9X가 TSMC 16FF+ 공정일 가능성?

위에서 보였던 A9X의 고클럭과 전력 여유가 TSMC 16FF+ 공정의 효과라고 생각할 수도 있습니다.

TSMC의 발표대로면 16FF+의 speed gain은 16FF의 +15% 라고 하니까요.

(링크 : 애플 A9 논란에 관하여. (삼성, TSMC 공정 비교.))

 

하지만 현실적으로 어렵지 않을까 싶습니다.

근거가 될 수 있는게 최근에 발표한 하이실리콘의 기린950인데, Cortex-A72 쿼드+ Cortex-A53 쿼드의 옥타코어 구성에 공정이 TSMC 16FF+ 입니다.

그런데 A72 클럭은 2.3GHz 입니다.

상당히 높다고 생각되겠지만 28HPM 공정으로 알려진 스냅620이 같은 CPU 사양에 A72 클럭이 1.8GHz 입니다.

TSMC 자료를 보면 28HPM -> 16FF+ 에서의 speed gain은 1.61배 입니다.

그에 반해 스냅620과 기린950의 클럭차이는 1.28배에 불과합니다.

 

최근까지 16FF+ 공정에서 발표대로의 성능을 내고 있지 못 할 가능성이 높습니다.

Cortex-A72는 ARM에서 14/16nm에서 2.5GHz까지 클럭이 가능하다고 밝힌 적이있고, 심지어 ARM이 16FF+ 공정에 대해 POP까지 재공합니다.

(링크 : ARM Cortex-A72 세부정보 공개. (Update 2015.05.30))

그런 상황에서 클럭이 저 정도에 그친다는건 수율, 공정 성능이 아직까지 완전하지 않다고 볼 수 있습니다.

최근 발표한 기린950이 이런데 그 전에 발표한 A9X가 16FF+ 공정을 썼을 가능성은 낮아 보입니다.

 

A9의 생산 비중을 봐도 그렇습니다.

여러 얘기를 만들었던 A9 제조사 판별앱의 최근 결과를 보면 삼성 : TSMC = 6.5 : 3.5 정도 입니다.

TSMC의 비중이 이렇게 낮아진게 단순히 절대적인 CAPA가 부족해서 일수도 있겠습니다만, 수율이 영향을 끼쳤을 가능성도 있습니다.

그렇다면 16FF 수율도 안정화되지 않았는데 16FF+의 안정적인 수율과 양산을 논할 수 없게 됩니다.

 

여러 정황상 A9X 공정은 16FF로 생각됩니다.

 

 

- 정리

1. 애플 A9

Twister 듀얼코어 1.85GHz

L1 캐시 32KB/32KB (명령어/데이터)

L2 캐시 3MB

L3 캐시 8MB

LPDDR4 2GB 1600MHz 64bit = 25.6GB/s

삼성 14LPE/TSMC 16FF

 

2. 애플 A9X

Twister 듀얼코어 2.26GHz

L1 캐시 32KB/32KB (명령어/데이터)

L2 캐시 3MB

L3 캐시 8MB

LPDDR4 4GB 1600MHz 128bit = 51.2GB/s

TSMC 16FF 추정.

 

3. Twister 아키텍처

Typhoon(A8, A8X) 대비 긱벤치3에서

정수 +15%

부동소수점 +20%

메모리 +27%

 

4. 긱벤치3

멀티코어 총점

듀얼코어 A9 = 트리플 코어 A8X < 듀얼코어 A9X

 

5. 클럭 상승

공정 영향 +20%

아키텍처 영향 +10%

 

6. 쓰로틀링 (긱벤치3 테스트상)

A9 아이폰6S : 대폭 개선.

A9 아이폰6S 플러스 : 거의 없음.

A9X 아이패드 프로 : 없음.

 

 

- 2015.12.07. A9 Specint 2K 결과 추가.

 

 

 

반응형

댓글