본문 바로가기
스마트폰/애플 APPLE

애플 A10X 초기 벤치 분석 / GPU 사양 추정

by gamma0burst 2017. 6. 11.
반응형

- 애플이 WWDC 2017에서 신형 아이패드 프로를 발표했습니다.

10.5/12.9 인치가 발표되었는데 12.9인치는 기존 프로를 대체, 10.5인치는 기존 9.7인치를 대체하게 됩니다.


- A10X

이와 함께 신규 프로세서인 A10X도 공개됐습니다.


6코어 CPU, 12코어 GPU

AP 위쪽, 오른쪽에 A9X 때와 같은 방식의 메모리가 배치되어 있어 메모리 버스가 128bit인걸 알 수 있습니다.

(A10X라고 이름붙인 시점에서 예상 가능한 부분입니다.)


기존 아이패드 프로(A9X) 대비 CPU +30%, GPU +40%



- A10X 긱벤치 시스템 정보

제품 발표 후 얼마 지나지 않아 긱벤치4 결과가 올라오고 있습니다.

(링크 : http://browser.primatelabs.com/v4/cpu/3072255)

 

(왼쪽 : A10X , 오른쪽 : A9X)

시스템 정보상 iPAD7.x로 나오는데 신형 아이패드가 맞을겁니다. (직전 모델이 iPAD6.x)

램은 4GB로 유지되나 L2 캐시가 3MB -> 8MB로 증가했습니다.


A9 -> A10 (아키텍처 변화)의 경우 L2, L3 캐시가 각각 3MB, 4MB로 동일하였고,

A9 -> A9X(플랫폼 변화)의 경우 L2 캐시는 3MB로 같고 A9X에서 L3 캐시가 빠졌습니다.

A8 -> A8X(코어 증가)의 경우 L2 캐시가 1MB -> 2MB로, L3 캐시는 4MB로 같았습니다.


A10X의 L2 캐시 용량이 8MB라는 시스템 정보를 믿는다면 A10에서 2배 이상으로 L2 캐시가 증가한 것인데 이렇게되면 L3 캐시가 빠졌을 가능성이 높아보입니다.

A10에 비해 코어가 하나 더 늘어나면서 L2 용량 증가는 필요한 상황에서 2배만 해도 6MB인 상황입니다.

L3 캐시 용량은 그보다 더 커서 최소 8MB는 되어야하는데 이는 면적 측면에서 부담되는 수준으로 달갑지 않지요. (인텔, AMD의 일반 소비자용 4코어 제품 L3 캐시가 8MB 입니다.)

A9X에서 L3 캐시를 빼는 시도를 이미 해봤으니 L2 캐시를 적당히 더 늘리고 L3 캐시가 없는 구조를 유지했을 것으로 예상됩니다.


발표에서부터 고성능 3코어 + 고효율 3코어 구성이라 밝히고 있어서 A10과 같은, 클러스터 마이그레이션과 유사한 구조로 예상할 수 있고,

실제 시스템 정보에 3코어 표기되어 있어 예상이 맞다는걸 알 수 있습니다.


현재까지 올라온 결과 중 가장 높은 클럭은 2399MHz로 일단 클럭은 2.4GHz로 추측됩니다.

A10의 경우를 보면 초기에 최대 2339MHz로 올라왔고 시스템 정보가 정리된 후에 2340MHz로 표기되고 있습니다.



- 긱벤치 4.1 결과

싱글코어 점수

뒤에서 다시 얘기하겠지만 A10과 같은 아키텍처로 보입니다.

A10에 비해 메모리 대역폭이 2배로 늘어난 덕에 메모리 점수 40% 가까이 상승했습니다.


전례를 봤을 때 애플이 말하는 CPU 성능 향상치는 싱글코어 성능으로 보이는데 긱벤치 싱글코어 총점이 그나마 잘 들어맞습니다.

A9X -> A10X에서 싱글코어 총점은 +23%로 발표치인 +30%와 다소 차이가 있습니다.

현재 올라온 결과보다 점수가 더 올라갈 가능성도 생각해 볼 수 있을듯 합니다.


멀티코어 점수

CPU 코어가 늘어난 효과로 멀티코어 점수도 크게 상승했습니다.


싱글코어 동클럭 점수

2.4GHz로 가정한 값입니다.

Cryto, 정수, 부동소수점 점수가 A10과 거의 같아, 같은 아키텍처를 썼다는걸 알 수 있습니다.

A9 - A9X의 경우를 보면 A9X의 동클럭 점수가 약간 낮게 나오는 경향을 보이는데 A10 - A10X에서는 오히려 A10X의 동클럭 점수가 높게 나오고 있습니다.

2.4GHz로 가정했지만 실제 클럭이 더 높을 가능성이 있어 보입니다.

부동소수점 점수를 기준으로 A10과 같은 동클럭 점수가 나오도록 계산해보면 2.47GHz 정도가 나옵니다.

실제 클럭이 어떨지는 추가 정보를 봐야할듯 합니다.



- GPU : GT7800+ 933MHz ?

 

(왼쪽 : A10X, 오른쪽 : A9X)

GPU 성능은 A9X 대비 +40% 발표했고 A4(iPAD)의 500배라고도 했습니다.

A9X가 A4의 360배라고 했으니 A10X는 A9X의 500/360 = 1.39배로 +40%라는 내용과도 일치합니다.


전례를 보면 최근 발표하는 성능 향상치는 GFX벤치 맨해튼3.0 오프스크린 결과와 상당히 잘 맞습니다.

이를 기준으로 하면 A10X 맨해튼3.0 오프스크린 결과는 117 fps 내외가 됩니다.


CPU 아키텍처가 A10의 것과 같았던 점을 고려하면 GPU 아키텍처도 A10과 같은 식으로 변했을 가능성이 높습니다.

A10의 사례를 보면 A9와 같은 GT7600에 공정 변경과 CPU 구조 변화로 인해 얻어진 전력 여유로 클럭 50% 올려서 성능을 올린 것으로 추측됩니다.

A10X도 마찬가지로 A9X와 같은 GT7800+에 클럭 상승으로 성능을 40% 올렸을 가능성이 높습니다.

그렇다면 클럭은 666 x1.4 = 933MHz정도로 예측됩니다.

(애플 A9, A9X GPU 성능/사양 정리.)



- 제조 공정 : 16FF+ ?

A10과 같은 TSMC의 16FF+ 공정이냐, 아니면 나온 시기가 시기인만큼 최신 공정인 TSMC 10nm 공정이냐의 문제가 남아있는데, (루머 하나 나오지 않는 것으로 보아 삼성 생산은 아닌듯 합니다.)

결론만 먼저 말하면 16FF+ 공정일 가능성이 높아 보입니다.


CPU의 경우를 보면 코어 개수가 늘어났으니 A8 -> A8X의 사례를 참고 할 수 있습니다.

당시 CPU 클럭은 1.4 -> 1.5로 0.1GHz, 7.1% 오르는데 그쳤습니다. (아이폰 -> 아이패드)

이를 참고로 A10 -> A10X에서의 클럭 상승치를 계산해 볼 수 있습니다.

코어가 증가했으니 +7.1%를 반영하면 2.34 x1.071 = 2.507GHz 가 나옵니다.

여기에 만약 공정이 10FF로 바뀌었다면 TSMC가 말했던 성능 향상 10%가 추가 반영되어 2.758GHz가 나옵니다.


같은 아키텍처 변화가 나타난 A9 -> A10 사례를 참고 할 수도 있는데,

1.85 -> 2.26GHz로 +22% 증가했습니다.

16FF -> 16FF+의 공정 변화로 인한 성능 향상치 15%를 빼면 +6.2%로 이게 아키텍처 변화, 빅리틀 도입으로 인한 최대 클럭 향상치가 됩니다.

이걸 참고로 A9X -> A10X에서의 클럭 상승치를 계산해보면 22% 증가한 2.76GHz가 되는데 이건 일단 듀얼코어 기준이 됩니다.

여기에 10FF 공정으로 변화가 있었다면 3.04GHz까지 올라갑니다.

별로 안 맞네요.


A8 -> A8X 사례를 근거로 계산했을 때 2.5GHz가 나왔고 현재까지 올라온 클럭 정보와 유사한 것으로 보아 16FF+로 공정이 유지됐을 가능성이 높다고 봐야할듯 합니다.


GPU의 경우를 보면, A9 -> A10 에서 클럭이 50% 오른데 비해 A10X는 40% 정도만 올라갔습니다.

아무리 빅리틀이 적용되었다해도 고효율 코어 수가 증가하면서 GPU에 추가 할당할 수 있는 전력의 여유가 적어졌을 가능성, 크기가 작은 10.5인치 아이패드에 맞춰 TDP를 결정했을 가능성 등이 예상됩니다.

어쨌든 A9 -> A10과 비슷한 클럭 상승인데 만약 10FF 공정이 적용되었다면 전력이나 면적에서 더 여유가 있어 코어 수를 늘리든가 클럭을 더 올리든가 했을텐데 그런 모습이 보이지 않아 공정이 그대로 유지돼다고 보는게 타당할듯 합니다.


면적도 16FF+의 가능성이 높게 보게 만드는 부분인데 A9X의 면적은 147mm2로 모바일 칩 치고는 굉장히 큽니다.

이런 큰 제품을 수율 안정화가 되지 않은 최신 공정으로 생산하기는 부담이 있을겁니다.

TSMC 10nm 공정은 당장 (가칭) A11 생산과 수율 향상에도 바쁠 시기인데 이와중에 A10X까지 진행하기는 힘들겁니다.

수율이 안정화된 16nm 공정으로 생산하는게 합리적인 선택일듯 합니다.

다만 A9X에 비해 면적이 증가할 가능성이 있는게 걸립니다.

CPU 코어가 늘어났는데 hurricane, zephyr 코어가 1개씩 추가되면 그 면적만 5mm2 정도 됩니다.

거기에 L2 캐시도 크게 늘어났지요.

이미 역대급으로 큰 면적이 더 늘어나게 되는 것인데 A5X가 163mm2를 보여준적이 있어서 공정 변경이 필수적인 수준의 면적은 아닐 것으로 예상됩니다.



- 추정 정리 : 애플 A10X

CPU : Hurricane x3 2.4GHz + Zephyr x3 , 클러스터 마이그레이션 방식

        L1 캐시 64KB/64KB(I/D) , L2 캐시 8MB, L3 캐시 없음.

GPU : GT7800+ 933MHz (12클러스터)

RAM : 4GB LPDDR4 128bit

공정 : TSMC 16FF+





반응형

댓글