- ARM에서 Cortex-A75/A55, Mali-G72 를 발표했습니다.

이미지 출처는 아래와 같습니다.

(링크 : http://www.anandtech.com/show/11441/dynamiq-and-arms-new-cpus-cortex-a75-a55 http://www.anandtech.com/show/11459/arm-announces-malig72-bifrost-refined-for-the-highend-soc)




- Cortex-A75

이전에 나왔던 로드맵 대로라면 코드네임 프로메테우스(Prometheus)에 해당합니다.

750mW 이상 구간은 추가성능 헤드룸으로 잡은걸 봤을 때 Ares는 아닌듯 합니다.




 

(왼쪽 : Cortex-A73, 오른쪽 : Cortex-A75)

2-wide decode -> 3-wide decode

dispatch 최대 4 -> 6 µops/cycle

각 파이프라인이 공유하던 issue queue를 파이프라인별 분리.

파이프당 최대 issue 8 µops/cycle로 증가.

NEON/FP 측 dispatch 최대 2 -> 3 µops/cycle


A73 대비 SPECINT +22%, SPECFP +33%, 긱벤치 +34%

긱벤치 기준이 싱글코어 총점이고 정수, 부동소수점 항목 클럭당점수 상승치가 SPECINT/FP와 같다고 가정하면, 메모리 점수는 +57% 상승했고 A75 2.4GHz 기준 긱벤치4 싱글코어 총점 2500점 정도로 계산됩니다.

다만 A57, A73의 경우 SPECINT가 상승하는만큼 긱벤치 정수 점수가 오르지는 않았습니다.

(SPECINT/FP는 아키텍처 사양 변화가 거의 그대로 결과에 반영되는 경향이 있는듯.)

SPECINT2000이 11% 오를 때 긱벤치 정수 점수는 3~4% 오르는데 그쳤습니다.

이런 추세라면 긱벤치 기준 상승치는 정수 +13% 내외, 부동소수점 +23% 내외로 볼 수도 있겠으나 어디까지나 추측의 영역이고 실제 벤치마크 결과가 나와봐야 확실해질듯 합니다.


화면이 큰(=방열 면적이 큰) 제품에서는 TDP 여유도 커지기 때문에 코어당 전력 최대치가 더 올라가고,

그에 따라 성능(=클럭)이 더 올릴 수 있다는겁니다.

0.75W에서 2W면 전력이 2.7배나 늘어나는데 클럭은 8% 밖에 늘어나지 않는건 전력 효율상 좋은건 아니지만요.

아래 그래프를 보면 10nm에서 A75 타겟 클럭이 3.0GHz인듯한데 이 정도가 전력 효율이 보장되는 한계 클럭으로 보입니다.


그래프 높이로 성능비를 계산해보면 A57 : A72  : A73 : A75 = 1 :  1.3 : 1.5 : 1.92 입니다.

아래 클럭을 써서 동클럭 기준으로 환산하면 1 : 1.14 : 1.13 : 1.35

A73 대비 A75가 +19%로 위에서 나왔던 SPECINT2006과 비슷한데 정확한건 불명.



- Cortex-A55

이전에 나왔던 로드맵 대로라면 코드네임 아난케(Ananke)에 해당합니다.

머큐리(Mercury)는 Cortex-A35에 해당하는 포지션.


 

(왼쪽 : Cortex-A53, 오른쪽 : Cortex-A55)

Load/Store 강화


A53 대비 전력 효율 +15%

A53 대비 SPECINT +18%, SPECFP +38%, 긱벤치 +21%



- Mali-G72

유출됐던 로드맵대로면 G71이 Mimir였으니 G72가 찌라시에 나오는 헤임달(Heimdallr)일 가능성이 높아 보입니다.

(Heimdallr로 표기할지, Heimdall로 표기할지 모르겠지만 영어권 경향 생각하면 Heimdall로 할듯?)



2017년 디바이스 대비 성능 1.4배.

2017년 디바이스라면 엑시노스8895 얘기일 가능성이 높습니다.

성능 얘기는 뒤에서 다시 하지요.



발전된 렌더링 기술로 대역폭 감소.


동일 공정 노드, 비슷한 조건에서

에너지 효율 +25%

최대 MP32

성능 밀도 +20%


전력 효율이 +25%인데 GPU에 할당되는 최대 전력이 거의 바뀌지 않는걸 고려하면 최대 성능이 +25% 올라갔다고 봐야합니다.

성능이 +25% 올라갔는데 성능 밀도가 +20%만 올라갔다는건 면적이 +4.2% 정도 증가했다는 해석이 가능합니다.


동일 공정에서 성능 +25%라고 했는데 여기에 추가로 10LPE -> 10LPP에서의 성능 게인 +10%를 반영하면 +37.5%가 됩니다.

(동일 공정 노드라는게 10LPE와 10LPP 간의 비교일 수도 있겠으나 비슷한 조건을 맞췄다니 클럭 차이가 없는 조건의 결과라고 보면 같은 공정 간 비교라봐도 무리는 없을듯.)

G71 발표 때 보면 성능 1.5배라고 했는데 실제 거기에 가장 잘 들어맞았던게 맨해튼3.0 +46% 였습니다.

(링크 : ARM Mali-G71 발표. (코드네임 : 비프로스트, Bifrost))

성능 1.4배라는게 맨해튼3.0 기준 +37.5% 얘기일지도 모르겠습니다.

엑시노스8895(64.3 fps)의 1.375배라면 맨해튼3.0 기준 88.4 fps가 됩니다.

(+40%라면 90 fps)


G71 발표시 나왔던 내용과 차기 엑시노스 내용이 나름 잘 맞아들어갔기에 이번에도 차기 엑시노스를 추측해볼만 합니다.

차기 엑시노스(엑시노스9810?)는 현재 삼성의 공정 이행 추세상 10LPP 공정일 가능성이 높은데 엑시노스8895의 10LPE와 비교해서 면적 감소는 없습니다.

엑시노스8895의 G71MP20이 성능을 위해 한계까지 면적을 늘린 결과로 생각되는데, G72가 G71 대비 면적이 +4.2% 정도 증가했다면 MP수는 오히려 줄어들어야 합니다.

20 / 1.042 = 19.2 , MP19로 나옵니다.


오늘 올라온 엑시노스9610 찌라시를 보면 A73 x4 + A53 x4 구성인데 엑시노스9610 CPU 성능이 이 정도라면 그보다 상위 라인업인 엑시노스9810 CPU 성능이 8895 대비 크게 오를 가능성이 높습니다.

(A73 쿼드라면 엑시노스M2 쿼드와 라인업 차이를 둘 만큼 성능 차이가 크지 않음.)

그러기 위해서는 CPU 규모가 커져야 할 것이고 GPU에 할당되는 면적이 줄어들 가능성이 있어, 계산상 MP19 지만 실제 더 줄어들 가능성도 있습니다.


위에서 했던 가정대로라면 동클럭에서 G71MP20 -> G72MP19 ? 에서 성능이 +25% 라는게 됩니다.

MP19 라면 MP1 당 성능이 G71 대비 +32%

MP수를 더 낮춰서 계산해보면 MP18 : +39%, MP17 : +47%, MP16 : +56% 입니다.

실제 동클럭 조건이 아니고 G72쪽 클럭이 더 높을 경우까지 고려한다해도 T880 -> G71에서 성능 향상이 +25% 정도였던걸 감안하면 MP18 미만일 가능성은 낮아 보입니다.

 

 

 

신고
Posted by gamma0burst Trackback 0 : Comment 24

댓글을 달아 주세요

  1. addr | edit/del | reply 2017.06.06 21:45

    비밀댓글입니다

  2. addr | edit/del | reply 흡혈귀왕 2017.06.06 23:42 신고

    다이 사이즈가 늘었다면 9810에선 MP구성이 좀 줄어들 가능성도 있겠군요.

    어찌됬던 8895대비 최대 40% 성능 향상까지도 바라볼수있어서 긍정적이네요.
    마침 삼성에서 필요하던 머신러닝 기능까지 들어갔으니....

    자체 GPU로 넘어가기전까지 충분히 단물빠질때까지 플래그쉽에서
    충분히 쓸수있을테니깐요...

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2017.06.07 21:10 신고

      자체 GPU라도 제품화가 지연되면 ARM에 성능으로 잡혀서 다음 제품 기다리는 악순환이 되지 않을까 하는 걱정도 좀 듭니다.

  3. addr | edit/del | reply ㅇㅇ 2017.06.07 01:25 신고

    오늘 애플서 나온 신작 아이패드 프로에는 a10x 프로세서가 들어갔더라고요
    이 제품의 성능은 어느정도로 보세요?

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2017.06.07 21:07 신고

      오늘 긱벤치가 나와서 뒷북같긴한데 CPU 성능 +30%는 긱벤치 싱글총점 기준일거고, 그래픽 +40%는 맨해튼3.0 기준일거 같습니다.

  4. addr | edit/del | reply Favicon of http://rubp.tistory.com BlogIcon RuBisCO 2017.06.07 14:53 신고

    여전히 ARM 레퍼런스 아키텍쳐는 시궁창이군요. 정수 파이프 한쌍짜리 잔디깎이라니. 내년은 글렀고 내후년을 기다리면 또 희망고문을 당해야 하는건가요.

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2017.06.07 21:08 신고

      싱글킹 애플 애용해주세요.

    • addr | edit/del 흡혈귀왕 2017.06.07 21:29 신고

      중이 싫으면 절을 떠나라고
      싱글킹 그래픽킹 애플 이용하는게 답이죠..

    • addr | edit/del Favicon of http://rubp.tistory.com BlogIcon RuBisCO 2017.06.08 21:16 신고

      인질(?)들이 안드로이드와 윈도우즈 양쪽 전부 잡혀있으니 버릴 수가 없어서 참 슬픕니다.

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2017.06.09 21:14 신고

      인질을 잡고 있는 안드로이드와 윈도우즈가 문제인가, 인질을 구할 생각이 없는 ios가 문제인가.

  5. addr | edit/del | reply ㅂㅈㄷ 2017.06.08 07:02 신고

    근데.. a10x가 정말 10nm일 가능성이 높은가요?

    a10x의 성능향상폭이 생각보다 낮길래요. 원래 a10은

    14nm/16nm 1세대공정에서 16nm 2세대공정으로 0.5세대 업그레이드인데도

    성능향상폭이 a10x만큼 나와주지않았습니까? 근데 16nm 1세대공정에서

    10nm공정으로가는데 cpu는 코어수+1이라서 그렇다쳐도 gpu 40%향상은

    좀 갸우뚱하네요 a10의경우 a9와 비교할시 전력소모가 상당히 높았는데

    이번 a10x는 a9x수준의 발열,전력소모로 제어하기위해 그런건지..

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2017.06.09 21:38 신고

      CPU는 초기 벤치가 올라와서 자세한 얘기는 조만간 다룰 예정이지만 일단은 16FF+ 공정인걸로 보입니다.

  6. addr | edit/del | reply ㅇㅇ 2017.06.09 08:27 신고

    A55의 성능향상폭은 조금 아쉽게 느껴지네요..
    긱벤치 기준 21% 정도면 낮은거는 아니지만 4년만에 아키텍쳐 교체인만큼 더 신경써 줄수 있었을것 같은데요
    스냅드래곤 625 . 헬리오 P20 같은 A53으로 구성된 저전력 프로세서가 모바일 디바이스에서 배터리 효율과 성능을
    모두 만족 시켰던 점을 감안했을때 A55를 53대비 50% 정도 고성능 으로 만들었다면 플래그쉽 이나 하이엔드 에서도
    A55를 메인으로 한 AP가 나오지 않았을까 합니다.

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2017.06.09 21:41 신고

      A53 옥타가 하이엔드 라인에 들어갔던건 당시 64비트 빅코어(A57)를 제대로 다룰 수 있는 업체가 거의 없었지만 어쨌든 64비트 AP가 필요했던 현실의 어쩔 수 없는 결과물이라고 봐야 할겁니다.
      성능이 충분해서 선택된게 아니었던거지요.
      후에 A72, A73처럼 쓸만한 빅코어가 나오자 A53 옥타가 미드레인지급으로 격하된 것만 봐도 알 수 있지요.

      A55는 어디까지나 적당한 성능에 높은 전성비를 유지해야하는 라인이고 그럼에도 성능이 올라갔다는건 의미있다 봐야겠지요.

  7. addr | edit/del | reply 2017.06.09 23:02

    비밀댓글입니다

  8. addr | edit/del | reply CoLLecTor 2017.06.10 12:47 신고

    이번작들은 dynamic iq가 기대됩니다.
    1+3이나 1+4같은 구성으로 중저가형 이하 라인업에도 빅코어의 탑재를 기대해 볼 수 있으니요.

  9. addr | edit/del | reply ㅁㅇㄹㅇ 2017.06.20 21:58 신고

    ARM 뭐하고있나~~
    애플처럼 좀 해봐라~~

  10. addr | edit/del | reply asdf 2017.06.27 17:48 신고

    한가지궁금한게요 arm주장대로라면 a73은 레퍼런스 2.8까지 올려도 큰 무리가없다는건데 물론 제조사들마다 사정이 있겠습니다만 2.8은고사하고 2.5정도되는 클럭도 보기가 힘든걸까요? 분명 arm주장대로라면 a73은 a72에비해 전력효율도 꽤 좋을테고 크기축소도있을텐데 10nm인거 감안하면 별 차이안나는 수준같기도하고... 개인적으론 a57에서 a72로왔을때 그 전력효율증가를 기대했는데 a73은 뭐가 크게 변한건지 모르겟네요.. 다른 팀에서 설계를 했다는데 음.. 스냅드래곤835도 클럭이 낮구요..

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2017.06.28 10:18 신고

      ARM에서 A73 2.8GHz 기준은 10nm 공정이었지요.
      비교군이 16nm A72 2.5GHz인데 실제 기린955가 그 사양이고요.

      지금 문제는 A73 성능을 판단할 제품이 기린960 밖에 없다는건데......
      기린(화웨이 제품)이 그렇게 ARM 설계를 공들여서 다듬어서 만드는건 아니어서 기린960만 보고 판단하기는 어렵습니다.
      그런 부분이 전력에서도 나오는데, 기린960 GPU 전력이 사양대비 과도한걸 보면 알 수 있지요.
      이래저래 기린960이 아키텍처를 판단하는 기준이 되기 어렵다고 봅니다.
      (ARM 설계가 그 모양이라는 비판에는 할 말이 없겠지만요.)

      A72 -> A73에서 동클럭 성능 차이가 거의 없다는건 ARM 발표때부터 어느 정도 예상된 것이었고 실제 긱벤치 결과도 동클럭에서 큰 차이가 없었습니다.
      ARM이 강조한 것도 전성비였고요.
      그런데 위에서 말한대로 기린960이 저 모양이라......

      타사의 A73 제품이 나와봐야 정확한 결론을 낼 수 있을겁니다.
      마침 A73 사양 엑시노스가 나온다는 루머가 있으니 나온다면 참고가 될거 같네요.

  11. addr | edit/del | reply 2017.08.01 19:07

    비밀댓글입니다

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2017.08.03 08:09 신고

      ARM 자료의 긱벤치4 +34%가 A73 2.4GHz - A75 2.8GHz 비교라면 A75 2.8Ghz에서 긱벤치 싱글코어 총점이 2500점 밖에 안 나옵니다.
      3GHz로 클럭이 올라간다해도 2700 내외로 올라가는 정도로 보이네요.



티스토리 툴바