본문 바로가기
단신/찌라시 읽기

찌라시 읽기 (3) Apple A8 (가칭) 성능/사양 추정.

by gamma0burst 2014. 6. 18.
반응형


- 찌라시 내용
(가칭) 애플 A8

긱벤치3 - 싱글 1500 / 멀티 2800

긱벤치3 - 싱글 1632 / 멀티 4553
T-Rex offscreen - 31 fps
T-Rex onscreen - 38 fps

긱벤치3 - 싱글 1175 / 멀티 3051
T-Rex offscreen - 40 fps
T-Rex onscreen - 48 fps

긱벤치3 - 싱글 905 / 멀티 2930
긱벤치3 - 싱글 1732 / 멀티 4249
긱벤치3 - 싱글 1219 / 멀티 3110
PowerVR G6630/G6430

긱벤치3 - 싱글 1659 / 멀티 4157
T-Rex offscreen - 42 fps
T-Rex onscreen - 51.2 fps
메모리 성능 5S대비 +57%


- 기존 애플 A7 성능
CPU : Cyclone 듀얼코어 1.4GHz
긱벤치3 64b[각주:1]
정수 : 싱글 1581 / 멀티 3092
부동소수점 : 싱글 1438 / 멀티 2859
메모리 : 싱글 1414 / 멀티 1694
총점 : 싱글 1490 / 멀티 2719

정수, 부동소수점 점수는 멀티 : 싱글 점수비가 2 : 1에 거의 가깝게 나옵니다.
(정수 1.96배, 부동소수점 1.98배)
코어수에 비례해서 점수가 나와준다는 것.

1.0GHz 기준으로 환산.
정수 : 싱글 1129 / 멀티 2209
부동소수점 : 싱글 1027 / 멀티 2042
메모리 점수비 : 멀티 1694 / 싱글 1414 = 1.198 = 1.2


- 긱벤치3 결과 분석
싱글 1500 / 멀티 2800 -> 1.87
싱글 1632 / 멀티 4553 -> 2.79
싱글 1175 / 멀티 3051 -> 2.60
싱글 905 / 멀티 2930  -> 3.24
싱글 1732 / 멀티 4249 -> 2.45
싱글 1219 / 멀티 3110 -> 2.55
싱글 1659 / 멀티 4157 -> 2.51

멀티/싱글 점수비가 최소 2.5 이상입니다.
가능성은 이 정도.

1. 쿼드코어
2. 빅리틀 HMP - 빅코어 x2 + 리틀코어 x4 (ex. 엑시노스5260)

엑시노스5260의 경우 점수비가 2.42 입니다.
쿼드코어로 동작하는 엑시노스5420의 경우 점수비가 3.15 입니다.
찌라시 점수들을 보면 최대 3.24 까지 나옵니다만 다른 결과에 비해 점수가 낮습니다.
제대로 측정되었다고 보기 힘듭니다. 무의미한 결과인거지요.

최대 점수로 계산해보면, 싱글 1732 / 멀티 4553 -> 2.63

쿼드코어일 가능성이 높겠지만, 빅리틀의 가능성도 배제하지 않고 가겠습니다.
쿼드코어로 계산해봐서 잘 안되면 차선책으로 선택해야겠지요.


- 쿼드코어 1.
총점에서 멀티/싱글 점수비가 코어수만큼 나오지 않는건 메모리 멀티 점수가 코어수에 비례하지 않기때문입니다.
실제 위에서 계산했듯이 메모리 점수 멀티/싱글 비는 2 가 아니라 1.2 가 나왔습니다.
즉 총점에서 메모리 점수를 뺀 점수비는 코어수에 비례할 것이라는 것. 아니면 최소한 코어수에 가까워질 것.
엑시노스5420의 경우[각주:2] 비율이 3.92 입니다.
 
A8의 싱글 메모리 점수 a 라고 가정하면,

4553 - 0.2 x1.2a = 4 x (1732 - 0.2a) -> a = 4241
(메모리 점수에 0.2를 곱하는건 총점에서 메모리 점수의 반영비율이 20%이기때문.)

말도 안 되는 점수가 나왔습니다.
4배가 너무 컸기때문이고, 이는 멀티코어에서 최대성능이 측정되지 않았다는겁니다.
그렇게되면 찌라시의 점수로 메모리 점수를 추정하는건 불가능하니 5S 대비 +57% 라는 내용을 적용하겠습니다.

아이폰5S 긱벤치3 메모리 점수 - 싱글 1462 / 멀티 1766 -(+57%)-> 싱글 2295 / 멀티 2773

총점 : 싱글 1732 / 멀티 4553
메모리 : 싱글 2295 / 멀티 2773
-> 정수+부동소수점 : 싱글 3183 / 멀티 9996

애플 A7 1.4GHz의 정수+부동소수점 싱글 점수가 = 정수 1581 + 부동소수점 1438 = 3019
3183/3019 = 1.05

A7과 같은 아키텍처 기반에 클럭만 1.05배 올랐다고 볼 수 있습니다.
클럭 : 1.4GHz x1.05 = 1.48GHz
1.5GHz로 볼 수도 있겠지만 그대로 1.4GHz 일수도 있다고 보는데 일단 1.5GHz로 보겠습니다.
멀티코어 점수는 A7의 멀티/싱글 점수비를 그대로 사용하면 될듯.


- 쿼드코어 2. : 메모리 점수 +57%가 가능한가?
그런데 메모리 성능이 57%나 오르는게 가능할까요.
A5 -> A6 에서 긱벤치 메모리 점수가 5배 가까이 올랐고, A6 -> A7 에서는 37% 올랐습니다.
이 경우의 공통점은 아키텍처가 대폭 변경되었다는겁니다.
(A5 : Cortex-A9, A6 : Swift, A7 : Cyclone)
A6 -> A7 의 경우 64bit의 영향도 있으나 32bit -> 64bit 는 +10% 수준[각주:3]이기때문에 결국 아키텍처의 영향도 있는 것으로 봐야합니다.
그런데 위의 계산을 보면 알 수 있듯이 찌라시대로 메모리 성능 +57%를 가정했더니 아키텍처가 같은 것으로 결론이 났습니다.

즉, 찌라시의 긱벤치 점수와 메모리 성능 +57% 라는 내용이 서로 모순됩니다.
메모리 성능이 오르기 위해서는 아키텍처 변경이 필요한데, 메모리 성능 향상을 가정하면 아키텍처 변경이 부정당합니다.
반대로 아키텍처 변경을 가정하면 점수를 역산하면 메모리 성능 향상이 부정당합니다.

이 모순을 해결하려면 아키텍처 변경없이 메모리 점수가 크게 올라야합니다.
그러려면 메모리 대역폭이 늘어나야 하고요.
그런데 메모리대역폭이 두 배로 늘어도 메모리 점수는 +30% 늘어나는 수준입니다.[각주:4]
메모리 대역폭 증가만으로 +57%는 어렵습니다. 

과거에 루머에서 그래픽을 위한 별도의 램같은걸 얘기했는데 실제로 그럴지는 의문입니다.
그러기위해서는 상당한 추가비용을 감수해야하는데, 메모리에서 가성비를 엄청나게 챙기는게 애플입니다.
(64bit AP 써놓고 아직도 램 1GB로 버티고 있는게 애플입니다.)
그렇게 하리라 예상하기가 어렵습니다.


- 쿼드코어 3.
다른 가정을 도입하겠습니다.
찌라시 내용은 최대성능이 측정되지 않은 것이고, 아키텍처는 A7과 동일한 Cyclone이고, 그렇기때문에 메모리 점수도 A7과 동일하다고 가정하겠습니다.
그러면 이렇게 됩니다.

총점 :
싱글 1732 / 멀티 4553
메모리 점수 : 싱글 1414 / 멀티 1694
-> 정수+부동소수점 점수 : 싱글 3623 / 멀티 10535 -> 점수비 2.90

A7 1.4GHz 정수+부동소수점 점수 : 싱글 3019 / 멀티 5951

싱글점수는 +20%, 멀티점수는 +77%
일단 클럭은 1.4GHz x 1.20 = 1.68 = 1.7GHz로 보입니다.
그리고 1.7GHz 쿼드코어라면 멀티점수는 10535가 아닌 14282가 나와야합니다.
10535 기준으로 멀티/싱글 점수비를 보면 2.90 = 3 입니다.
즉, 트리플코어라면 딱 맞는 점수라는겁니다.

이걸 놓고 몇 가지 가설이 가능합니다.
1. 쿼드코어가 아니라 트리플코어다.
2. 쿼드코어지만 쓰로틀링시 1코어를 끄고 3코어만 동작한다. (이건 실제 찌라시에 있었던 내용입니다.)
3. 쿼드코어 로드시 클럭이 75% 수준(= 1.3GHz)으로 떨어진다.

쿼드코어를 가정한 해석은 이 정도로 하고 빅리틀의 가능성을 검토해보겠습니다.


- 설마 빅리틀?
위에서 말했듯이 빅리틀이라면 빅코어2 + 리틀코어4 구성일 가능성이 높습니다.
멀티/싱글 점수비를 보면 엑시노스5260가 최대 2.42인데, 찌라시 내용상 A8은 최대 2.79 입니다.
이건 싱글점수의 비율이 낮거나, 멀티점수의 비율이 높다는겁니다.
그런데 이미 A7이 코어당 성능이 최고수준이기때문에 A8에서 싱글코어 성능이 떨어진다고 보기는 힘듭니다.
멀티점수의 비율이 높다고 봐야할 것이고, 그러기위해서는 리틀코어의 성능이 Cortex-A7보다 높다고 볼 수 밖에 없습니다.
이미 Cyclone이 64bit 아키텍처이기때문에 여기에 빅리틀을 조합한다면 Cortex-A53이 될 수 밖에 없기도 합니다.

구체적으로 계산해보겠습니다.
앞서 메모리 점수의 큰 상승은 현실적으로 어렵다는 결론을 얻었기때문에 이번에도 메모리 점수는 A7과 동일하다고 가정하겠습니다.

총점 :
싱글 1732 / 멀티 4553
메모리 점수 : 싱글 1414 / 멀티 1694
-> 정수+부동소수점 점수 : 싱글 3623 / 멀티 10535 -> 점수비 2.90

A7 1.4GHz 정수+부동소수점 점수 : 싱글 3019 / 멀티 5951
-> 빅코어 클럭 1.7GHz

여기까지는 동일합니다.
해석이 다를뿐이지요.

이전 포스팅에서 64bit에서 Cortex-A53의 클럭당 점수를 다음과 같이 예상했습니다.[각주:5]
A53 64b int : 405
A53 64b fp : 327
-> Cortex-A53 1.0GHz 정수+부동소수점 : 732

싱글 3623 인데 듀얼코어이니 멀티 7246 -> 빅코어 점수
정수+부동소수점 멀티 점수 10535 중 리틀코어 점수는 10535 - 7246 = 3289

빅리틀에서 리틀코어의 점수는 100% 반영되지 않습니다.
엑시노스5260은 60% 수준이었고, 엑시노스5422는 26%, 64bit 엑시노스 추정치는 40%[각주:6] 였습니다.
빅코어 클럭이 1.7GHz로 추정되었으니 리틀코어 클럭은 이보다 낮을겁니다.
Cortex-A53 쿼드코어 1.7GHz 점수를 계산해보면
-> Cortex-A53 쿼드 1.7GHz 정수+부동소수점 : 4978
리틀코어 점수가 4978보다는 낮겠네요.

위에서 계산한 3289점이면 Cortex-A53 클럭은 1.12GHz 입니다.
리틀코어 점수 반영비율을 대입하면,
26% 라면 4.3GHz - 이건 말도 안 되지요.ㅋ
40% 라면 2.8GHz - 이것도 마찬가지.
60% 라면 1.9GHz - 그래도 1.7GHz 보다 높습니다.

기존 빅리틀 프로세서의 사례를 대입했을 때 만족할만한 클럭이 나오지 않습니다.
100% 다 반영된다고 보고 1.1~1.2GHz로 생각하는게 가장 타당합니다만, 그런 사례가 아직까지 없다는게 문제.
게다가 애시당초 Cyclone 코어가 빅리틀이 가능한지도 불분명합니다.
쿼드코어 도입에도(=코어 수 늘리기에) 소극적인 애플이 빅리틀 기술을 사용할 가능성 자체가 매우 낮은게 사실입니다.
따라서 빅리틀의 가능성은 매우 낮다고 봐야할듯 합니다.


- GPU
T-Rex offscreen - 31 fps
T-Rex onscreen - 38 fps

T-Rex offscreen - 40 fps
T-Rex onscreen - 48 fps

PowerVR G6630/G6430

T-Rex offscreen - 42 fps
T-Rex onscreen - 51.2 fps


- 잠깐 쉬어가는 해상도 추정/검증.
사실 온스크린-오프스크린 비율로 해상도 추정하는건 거의 안 맞는데 그냥 해보면,
31/38 = 0.816
40/48 = 0.833
42/51.2 = 0.82
-> 평균 0.823

오프스크린 픽셀 수 1920 x 1080 = 2073600
2073600 x 0.823 = 1706874
아이폰5S처럼 화면비가 16:9 라면 해상도는 1742 x 980
1600 x 900 (
믿거나 말거나) 혹은 루머대로 1704 x 960 (1136 x 640의 1.5배라나...)
루머가 아주 뜬금없지는 않은듯...


- 다시 GPU로 돌아와서...
기존 성능을 보면,
애플 A7 - G6430 450MHz - 티렉스 오프스크린 26.4 fps
가장 만만한건 현재 G6630 이겠지요.
그런데 최대값을 주목할 필요가 있습니다.

T-Rex offscreen - 42 fps

이건 스냅드래곤805 Adreno420과 동일한 성능입니다.
물론 이걸로 차기 아이폰에 들어갈 AP가 스냅805라는건 아닙니다.
그렇다면 긱벤치3 멀티점수가 4000점을 넘을 수가 없습니다.

다만, 저 성능이 28nm로 뽑을 수 있는 최대성능일거라는겁니다.
발열, 소비전력 등을 고려했을 때 28nm 공정으로 낼 수 있는 최대 성능과 일치하는 수준의 성능이라는 찌라시 내용.
이건 A8의 공정이 20nm가 아닌 28nm 일 가능성이 있다는걸 보여줍니다.

애플이라면 해당 공정에서 최대 성능을 뽑아내기위해 노력할겁니다.
28nm에서 최대 성능이 티렉스 42 fps인 상황인데, A8이 20nm라면 저것보다 더 높은 성능이 나왔어야 하고요.
차후에 아이패드 등에서 더 높은 성능으로 넣기위해서 성능을 약간 낮춘다는 가정도 가능하나,
A7의 사례를 봤을 때 그럴 가능성은 낮아보입니다.
똑같인 A7이 들어간 아이폰5S와 아이패드의 GPU 사양(클럭)은 같았습니다.

결국 GPU 성능을 봤을 때, A8은 28nm 가능성이 있습니다.
만약 그렇다면 G6630은 들어가기에 무리가 있습니다.
아무리 다이사이즈에 신경을 쓰지 않는 애플이라 하더라도 더 이상 다이사이즈를 늘릴 수는 없을겁니다.

그렇다면 G6430의 오버클럭버전?
위에서 말했듯 기존 성능이 450MHz, 26.4 fps 입니다.
42 fps가 나오려면 산술적으로 700MHz에 육박해야합니다.
이론적으로는 가능하지만 현실적으로 받아들이기 힘든 사양입니다.
애플 AP의 특징인 多코어 低클럭 트랜드에도 맞지 않습니다.

그렇다면 대안이 필요하겠지요.
여기서 생각해볼 수 있는 것이 GX6450 입니다.

G6430이 PowerVR 시리즈6 GPU 이고, GX6450은 PowerVR 시리즈6XT GPU입니다.[각주:7]
이 둘의 결정적인 차이는 FP16 연산성능이 다르다는겁니다.
1클러스터당 FP16 연산성능이 시리즈6은 96 Flops/cycle, 6XT는 128 Flops/cycle로
6XT가 +33% 높습니다.
이거라면 동클럭 성능을 올릴 수 있는 거의 유일한 수단으로 보입니다.
GX6650을 생각할 수도 있겠으나 앞서 말했듯이 다이사이즈를 늘리는건 어려워보이니 같은 클러스터 수를 갖는 GX6450이 한계로 보입니다.

시리즈6XT 계열의 클럭당성능을 정확히 알 수 없지만 대략적으로 추정해보면 FP16 연산 성능 증가에 맞추어 기존 시리즈6 대비 +33%로 가정하겠습니다.
그렇다면 GX6450 450MHz의 성능은 26.4 fps x 1.33 = 35.2 fps가 됩니다.
찌라시에 나온 42 fps 라면 537MHz 입니다.
오차 생각하면 500~550MHz 정도 되겠네요.

정리해보면 이렇게 됩니다.
28nm 공정으로 추정.
GX6450 500~550MHz
T-Rex offscreen 42 fps


- 애플 A8 추정정리
1. CPU
Cyclone 기반  1.7GHz
코어 구성 및 동작 가능성.

- 트리플코어. (가능성 낮음.)
- 쿼드코어. 쓰로틀링시 1코어를 끄고 3코어만 동작.
- 쿼드코어 로드시 클럭이 75% 수준(= 1.3GHz)


2. 메모리
메모리 점수는 기존 A7과 동일한 것으로 추정.
-> LPDDR3 32bit x2 1GB

3. GPU
GFX벤치 T-Rex offscreen 결과로 보아 28nm 공정으로 추정.
GX6450 500~550MHz
T-Rex offscreen 42 fps (A7 대비 +59%)


- p.s 이 긴 글을 찌라시 근거라고 해서 잡담란에 넣어야하다니......ㅜㅜ




  1. http://browser.primatelabs.com/geekbench3/343861 [본문으로]
  2. http://browser.primatelabs.com/geekbench3/327478 [본문으로]
  3. http://gamma0burst.tistory.com/731 [본문으로]
  4. http://gamma0burst.tistory.com/732 [본문으로]
  5. http://gamma0burst.tistory.com/731 [본문으로]
  6. http://gamma0burst.tistory.com/732 [본문으로]
  7. http://gamma0burst.tistory.com/704 [본문으로]
반응형

댓글