- ARM에서 Cortex-A72의 상세 정보를 공개했습니다.

엠바고가 걸려있었나 봅니다.

 

- 변경 내용을 하나하나 뜯어보는건 별 의미가 없어보입니다.

그래서 실제 성능이 어떻게 나오느냐가 중요한거니까요.

 

 

분기예측(Branch Prediction)이 Cortex-A72의 가장 중요한 확장 포인트.

 

BTB(Branch Prediction Buffer)는 가까운 범위로 분기하는 small branch에 대해 최적화.

Large branch에 대해 BTB 크기는 2000개를 store 할 수 있지만, Small branch에서는 BTB를 분할하여 4000개 store

현실적으로 많은 분기가 small branch이기때문이라고.

 

분기예측 알고리즘 개선 : misprediction 50% 감소, speculation 25% 감소.

* prediction : 분기 방향, 목적지를 예측.

* speculation : 분기 결과를 예측.

메모리 전력 최적화.

 

분기명령이 없는 분기 윈도우를 사전에 감지. 큰 basic block 내의 16B에서 분기예측기능을 off

-> 전력 낭비 감소.

(기존에는 전체 윈도우마다 예측 기능을 실행.)

 

디코더/리네임 스테이지에서 루프 버퍼(Lopp Buffer) 제거.

* 루프 버퍼 : 디코딩 된 uOPs(micro-ops)를 캐시. 루프로 같은 명령을 반복할 경우 캐시된 uOPs를 읽어냄.

A57에는 32 엔트리의 루프 버퍼가 있었으나 A72에서는 매우 작은 용량의 버퍼만 남기고 삭제.

전력 효율성 측면에서 유용하지 않았다고.

 

명령 dispatch 증가 : 최대 3 -> 5 uOPs, 파이프라인 가동효율 증가.

 

기존 A57

디코더 최대 3 uOPs 발행 -> 디스패치(Dispatch) 유닛 최대  3 uOPs dispatch 발행

 -> 큐(Queue) 최대 3 uOPs/cycle

 

A72

디코더 최대 3 macro-ops 발행 (최대 5 uOPs 발행, 여려개의 uOPs를 묶어 macro-ops 발행)

 -> 디스패치(Dispatch) 유닛 최대 3 macro-ops 발행 -> 큐(Queue) 최대 5 uOPs/cycle

 

macro-ops 디코드 비율은 8% 정도.

기존 대비 8% 더 많은 micro-ops가 처리된다는거. (성능향상이 10% 정도인건 이 때문?)

 

FP/SIMD 파이프라인 레이턴시 감소.

FMUL : 5 -> 3 사이클.

FADD : 4 -> 3 사이클.

FMAC : 9 -> 6 사이클.

파이프라인 최대 19 stage에서 16 stage로 감소.

 

 

 

 

 

- 성능

3.5배라던 대책없는 내용도 보강이 되었습니다.

클럭 표시까지는 해줬네요.

A57이 14nm에서는 2.3GHz까지 가능한가봅니다.

여전히 2.6배, 3.5배 하는 수치는 믿기가 힘듭니다.

 

총 에너지 소비량 자료도 보강되었습니다.

성능에서 A15 1.6GHz = A57 1.3GHz = A72 1.1GHz 라고 합니다.

그러면 A72는 A57 대비 클럭당성능이 +18% 라는 얘기가 됩니다.

A57은 A15 대비 클럭당성능 +23%

 

동일 노드에서 A72는 A57 대비 -22% 로 그래프에는 나오는데,

화웨이 자료로 A57 1.3GHz, A72 1.1GHz 전력을 비교해보면 A72가 A57 대비 -30% 정도로 나옵니다.

(링크 : Cortex-A72 성능, 전력 자료. (source : 화웨이))

얼추맞다고 봐도 될듯 합니다.

 

그리고 이 그래프대로라면 동클럭 전력은

28nm -> 20nm : -12.5%

28nm -> 16FF+ : -50%

20nm -> 16FF+ : -43%

TSMC 16nm 공정이 언제 양산될지도 모르는 상황이라 현재로는 믿거나 말거나 참고사항.

 

동클럭 성능 비교.

SPEC2006, 긱벤치 등등이 종합된거라 구체적으로 따질거리가 없습니다.

 

인텔 제온과의 비교입니다.

1/3의 전력으로 제온과 같은 성능을 낼 수 있다는건데, 굳이 이런 얘기까지 나오는거보니 서버쪽을 노리나 봅니다.

 

인텔 코어M과의 비교입니다. (A72 2.5GHz 예상치)

긱벤치 결과는 아마 맞긴할겁니다.

현재 올라온 A72 2.0GHz 결과로 보건데 2.5GHz라면 코어M과 싱글스레드에서는 비슷한 결과가 나올겁니다.

코어M이 2코어4스레드이고, A72는 4코어로 잡았으니 당연히 멀티스레드는 A72가 높겠지요.

그런데 어차피 긱벤치에서 X86 점수가 그렇게 잘 나온다고 보기 힘들기때문에 이걸 동등한 비교로 보기는 힘듭니다.

(개인적으로는 X86과 ARM을 긱벤치로 비교할거면 X86 점수를 두 배로 놓고해야 어느정도 동등해진다고 봄.)

 

그래도 주목되는건 SPECint/fp 결과.

아무리 코어M이라도 싱글스레드에서는 비교적 쓰로틀링에서 자유로울텐데 그 상태에서 A72가 80% 수준으로 나옵니다.

클럭이 20% 높은데 성능이 80% 수준이라면 A72의 클럭당성능이 코어M의 64% 수준이라는게 됩니다.

컴파일러 최적화의 영향이 있기때문에 구체적인 수치에 대해서는 논란의 여지는 있습니다만, ARM이 X86 많이 따라왔다는데는 이견이 없을듯 합니다.

 

싱글스레드에서 A72가 1W 미만이라고 하는데, 이건 ARM이 코어 설계시 코어당 소비전력을 600~750mW 선으로 잡기때문에 나온 얘기인듯 합니다.

실제로는 다른 부분까지 다 포함해서 1W는 가볍게 넘어갑니다.

 

 

- update 2015.05.30

http://pc.watch.impress.co.jp/docs/column/kaigai/20150529_704264.html

 

 

Posted by gamma0burst Trackback 0 : Comment 49

댓글을 달아 주세요

  1. addr | edit/del | reply 감사 2015.04.26 02:14

    언제나 감사히 보고 있습니다. 앞으로도 좋은 글 많이 써 주세요 ㅎ

  2. addr | edit/del | reply 피노키오 2015.04.26 05:31

    그러네요 Core-M이 저정돈 아닌데... 1.1Ghz기준 90%정도가 맞는거 같아요

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2015.04.26 21:44 신고

      긱벤치 컴파일러 조건이 그렇게 각 아키텍처별로 최적화가 잘 된게 아니라고 하는걸봐서는, 단순 비교는 힘들듯 합니다.

  3. addr | edit/del | reply BlogIcon 어라? 2015.04.26 10:13

    그런데 폰사진에 HTC를 쓰고, 공정은 16FF를 위주로 하는걸 보니 삼성은 A72를 안쓰는 모양이네요.

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2015.04.26 21:45 신고

      그렇다고 HTC가 A72 쓴다는 보장도 없는 상황이지요.
      공정은 POP 지원하는게 16FF+ 라서 나오는걸거고요.
      삼성이랑 직접 엮기에는 약간 무리인듯.

  4. addr | edit/del | reply BlogIcon 매니아 2015.04.26 11:13

    삼성이 올히 하반기 나올걸로 예상되는 차기엑시노스에 저걸 쓰느냐 마느냐가 관건이네요.. 삼성은 대체로 하드웨어적인 최신기술은 꽤나 느린편이라...(애플이나 중국 기업만큼 빠르진않죠) 차기 엑시노스가 a57이면 경쟁력이 떨어질텐데말이죠..

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2015.04.26 21:47 신고

      다른 제품들 공정생각하면 A57 재탕해도 문제없을거란게 제 생각.
      다른 업체들 A72라고 해봤자 빨라야 내년초에나 제대로 물건 나올듯 하니까요.
      28nm로 가면 그보다 빠를수는 있겠지만 그랬다가는 성능에서 14nm A57에 크게 앞서기 힘들거고요.

  5. addr | edit/del | reply 지나가던폰덕 2015.04.27 01:52

    어쨋든 공정 싸움이네요. 퀄컴이 스냅810에서 Cortex-A57만 Cortex-A72로 바꾼 땜빵용 내놓는다고 일부 찌라시서 그러는데 그래도 20nm일테고 이 경우 엑시노스 5433을 생각하면 잘해야 엑시노스 7420하고 동급 내지 하위호환일 것 같아요. 게다가 이건 성능 국한이고 전력까지 따지면....

    이러니 삼성의 Cortex-A57 잔류설까지 나오죠.......... 상황만 보면 잔류해도 나쁘지 않아 보이는데 불안한건 14nm로 나올 Kryo CPU(퀄컴 타이판)... 요 친구가 잘 나온다면 내년에 판세가 또 뒤집힐 것 같네요.

  6. addr | edit/del | reply Favicon of http://www.daum.net BlogIcon 궁금증 2015.04.27 11:33

    다른 얘기지만 궁금한게 있어서 질문을 드립니다. 아직까지 4k를 커버할 gpu는 존재 하지 않죠??

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2015.04.28 01:20 신고

      UHD 지원은 GPU 성능보다는 AP와 디스플레이 사이의 인터페이스 문제가 더 중요합니다.
      단순히 UHD를 위한 AP 성능만 놓고보면 현재로도 불가능한 수준은 아닙니다.
      이미 동영상 디코딩은 4K를 충분히 커버하고 있지요.
      3D에서 괜찮은 실성능이 나오냐는 문제가 있지만 현실적으로 어차피 게임 등 3D 앱이 진짜 4K를 지원하기보다는 업스케일링을 선택하기때문에 크게 무리는 없을걸로 보입니다.

      가장 중요한 문제는 2D 처리에서 만족할만한 수준으로 전력을 낮출 수 있느냐가 될듯.

  7. addr | edit/del | reply BlogIcon 플리즈 2015.04.27 15:59

    루머 대로 삼성이 내년 상반기내에 자체 엑시노스를 양산해, 제품에 탑재하여 출시한다면, a72는 넘어갈 확률이 높겠네요. 자체 설계 ap의 성능이 아주 좋다면 라인업의 공백을 메꾸기 위해 나중에라도 나오긴 나올 지도 모르겠네요.

    자체 설계 프로세서가 시장안착에 성공한다면, 어떻게 될까요? 삼성도 애플처럼 자체 설계 위주로 가게 될까요??

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2015.04.28 00:54 신고

      커스텀 코어는 방향상 고성능을 향할 수 밖에 없으니 플래그쉽-하이엔드 정도가 한계일겁니다.
      그 밑으로는 들어가기 힘들지요.

      궁극적으로 삼성도 자체 설계 위주를 목표로 할겁니다.
      지금같은 구조에서는 ARM도 리스크의 하나로 볼 수 있는 상태이고, 자체 설계는 성능뿐만 아니라 개발과정의 리스크 감소에도 긍정적인 영향을 줄 수 있겠지요.

  8. addr | edit/del | reply BlogIcon 컴퓨터공돌이 2015.05.31 01:43

    자체 성능향상이 없다하더레도 파이프라인 구조가 개선된것만 봐도 체감성능은 엄청 크게 향상될것처럼 보이는군요.

    개인적으로 이미 스냅드래곤 s4 pro이후로 성능차이를 체감하지 못하고 있긴 하지만 그래도 뭔가 성능이 좋아진다하면 가지고 싶어지는 ㅎㅎ

    현재 오드로이드 (Exynos탑제 개발보드)를 제 개인서버로 돌리고 있는데 A72쓰면 괜찮을꺼 같기도 하군요.

    내년이 기대됩니다 ㅎㅎ

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2015.05.31 16:37 신고

      전력과 소비전력을 최적화한 마이너 업그레이드 버전이라고 봐야할듯 합니다.

  9. addr | edit/del | reply BlogIcon wanderer 2015.05.31 07:29

    흥미로운 내용 잘 보았습니다. 하나 궁금한게 있는데요, 긱벤치가 x86에서 불리하다는 말이 많던데 그 이유가 무엇인지 간략하게 설명해 주실수 있나요?

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2015.05.31 16:45 신고

      불리하다기보다는 실제 ARM과의 성능 격차를 제대로 반영하지 못 한다고 봅니다.
      구체적인 예를 들면 같은 우분투에서 디코딩, 인코딩 등 벤치마크 결과를 종합해서보면 동클럭에서 실버몬트 듀얼이 A15 쿼드와 비슷한 수준인데, 긱벤치3에서는 실버몬트와 A15이 거의 1:1로 점수가 대응됩니다.

      긱벤치로 x86 과 ARM을 비교하려면 x86 점수를 두배 가산해야된다라고 얘기했지만, 사실 제대로 하려면 긱벤치로 x86과 ARM을 비교하지 말아야지요.
      다른 벤치마크도 많은데 굳이 안 맞는걸로 비교할 필요는 없어보입니다.

  10. addr | edit/del | reply BlogIcon 성당기사단장 2015.05.31 17:41

    전에 ARM개발자 포럼에서 보니까 우분투랑 린팩 등은 인텔 컴파일러를 써서 더 잘나온다더군요. 안투투도 인텔 최적 컴파일러 쓰다가 말많아지니까 공용? 컴파일러로 바꿨다고 하고 긱벤치도 동일한걸로..

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2015.05.31 22:21 신고

      그렇게 최적화 따지면서 정작 벤치마크에서는 최적화를 안 하다니......

    • addr | edit/del BlogIcon 성당기사단장 2015.06.01 14:11

      ARM도 있긴있는데 거의 안쓰나보더라구요. icc안쓰고 붙으면 인텔이 점수가 떨어지긴 합니다. 실제로 데탑에서 그렇게 욕먹던 불도저 cpu정보를 인텔로 바꾸면 벤치마크 프로그램이 인텔로 인식해서 컴파일러가 작동되서 벤치마크 점수가 확올라간다죠.쿨럭

    • addr | edit/del BlogIcon 성당기사단장 2015.06.01 14:17

      찾아보니까 인텔 컴파일러가 작동하게 속인 AMD cpu가 76프레임 나오다가 속이니까 127프레임으로 상승..인텔은 반대로 속이기전 147프레임에서 속이니 88프레임으로 줄었네요.

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2015.06.02 01:03 신고

      이런거보면 진정한 성능 비교라는게 의미가 있나 싶습니다.
      애초에 불가능한 목표일지도...

    • addr | edit/del BlogIcon 성당기사단장 2015.06.02 14:59

      그냥 GCC나 비주얼? 몬가 그거 쓰는게 가장 그나마 공정하다더군요.

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2015.06.04 01:41 신고

      컴파일러 중에서 GCC가 그래도 많이 쓰이는 편이더라고요.

    • addr | edit/del BlogIcon 2015.06.05 20:48

      비쥬얼 c++는 arm쪽 최적화가 그닥... 무슨 미지원하는 명령어가 그리 많은지 게다가 윈도 전용이고요
      x86 최적화는 gcc보다 월등합니다. 그래서 긱벤치도 맥(gcc)이랑 윈도 점수 격차 줄이느라고 고생했다고도 하고요(리눅스는 점수격차 줄이는데 실패한건지...)

      gcc 역시 x86쪽이 아무래도 버프를 받는 느낌은 있지만... 제일 공평하죠

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2015.06.06 00:49 신고

      근본적으로 명령어가 다르니까 아키텍처가 달라지는거니 당연한거지요.
      아톰이 안드로이드에서 생각보다 힘을 못 쓰고, 윈도우에서는 그럭저럭 괜찮다는 소리 듣는 것도 그런거랑 연관성이 있을듯 합니다.
      (정말 그런지 정확히는 모르겠지만......)

  11. addr | edit/del | reply BlogIcon A TNT 2015.05.31 18:01

    마이너 업글 치고도 저정도면 동일공정에서 전성비 상승이 ㄷㄷ한데요...

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2015.05.31 22:20 신고

      화웨이 자료 기준으로는 1GHz 초반 RTL 기준으로 전성비가 20% 정도 올라갑니다.
      그런데 RTL에 저클럭 기준이라 실제 2GHz가 넘어갈 출시 예상 제품들에서도 저 정도로 전성비가 높아질지 모르겠습니다.

  12. addr | edit/del | reply BlogIcon CoLLecTor 2015.06.01 15:01

    중간에 1.9배 2.6배는 얼추 긱벤치로 대입해보면 비슷해 보입니다. 28n의 A15는 5410같고, 5410의 700대 점수의
    1.9배를 5433 / 7420을 클럭 올리면 2.6배도 나올 수 있을거 같습니다.. 3.5배면 거의 싱글스레드 2500대가 나온다는 말이네요...ㄷㄷ

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2015.06.02 01:16 신고

      밑에 클럭 표기되어있지요.
      실제 사양이랑 안 맞는건 확인할 수 있을겁니다.

      그리고 실제 A72 싱글점수가 2500이 안 나오지요.
      2000점도 안 나옵니다.
      2GHz에서 1600점대 나오는데 LPDDR3인거 고려해서 LPDDR4로 가정하고 그래프에 나온 클럭 2.5GHz로 가정해도 2000점 내외가 나올걸로 추측됩니다.
      http://gamma0burst.tistory.com/822

  13. addr | edit/del | reply BlogIcon A TNT 2015.06.03 17:03

    엑시노스 7580이 나왔는데 한번 정리해주시면 감사하겠습니다

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2015.06.04 01:40 신고

      벤치마크가 추가적으로 나와야지 지금 결과 한두개로 얘기하자면 내용이 너무 부정확해질듯 합니다.

  14. addr | edit/del | reply wfsd 2015.06.04 11:54

    하지만 삼성은 노트5에 a72가아닌 a57을 넣겠죠 ㅠㅠ a72를 넣는다면 좋을텐데요 전력소모도 낮고 성능도 더 높은데 아무리 삼성이 마개조해도 a72만할가요..

    • addr | edit/del BlogIcon A TNT 2015.06.04 16:37

      예전에 다른회사들이 8960쓰다가 스냅s4 pro로 넘어갈때 4412써서 타이밍 엇갈린 상황이랑 비슷하긴 한데 내년에 엑시노스 M1이 LPP공정으로 나올거라서 별로 상관 없긴 합니다

    • addr | edit/del BlogIcon A TNT 2015.06.04 16:39

      그리고 애초에 요즘 나오는 폰들 보면 알수있듯이 다들 디자인이나 월 요금같은거나 물어보지 AP에 관심가진 사람은 없고 실제로 AP 별로 안좋은거 끼워서 내도 전체적인 판매량은 별 지장없는게 여러 사례로 보여져서 별 필요 없긴 할거같네요

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2015.06.05 01:40 신고

      A72라도 제품화가 돼야 경쟁을 하든말든 할테니까요.
      A72 쿼드코어가 나오지 않는 이상 A72가 나온다해도 절반의 승리가 될 수 밖에 없을듯 합니다.

    • addr | edit/del 미르 2015.06.05 05:08

      엑시노스 7430이 재설계인걸로 아는데? 삼성에서 테스트 중이라는데
      잘나오면 좋겠네요.지역별로 7422와 7430이 나왔으면 합니다

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2015.06.06 00:46 신고

      AP 제조사가 다른 것도 아닌데 사양이 차별적으로 나올 가능성은 없습니다.
      가칭 7430 이라는 것도 나올 때나 의미가 있는거.

  15. addr | edit/del | reply BlogIcon 감수심 2015.06.09 23:34

    1.9배, 2.6배, 3.5배 하는 건 적혀 있다시피 피크 성능이 아니라 지속적인 성능을 비교했을 때 그렇다는 얘기 같습니다.

  16. addr | edit/del | reply diex3all 2015.06.23 18:45

    흠..지나가던 눈팅러인데, A57 20코어 2.5Ghz 가 30W라고 주장하는거 솔직히 믿을수가 없군요. 현재 돌아다니는 가장 좋은 삼성공정의 엑시노스 7420도 더 낮은 클럭에서 더 높은 전력을 소모하는데 얘만 해도 풀로드시 7W를 넘게 씁니다.
    여기다가 대규모 L3 캐시 등을 증설하기 시작하면 20코어에 30W라...흠;; 클럭 2.5Ghz를 안가도 그 envelop은 맞추기 힘들어 보이는데;;

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2015.06.23 19:02 신고

      그렇죠.
      아예 고클럭으로 최적화하면 얼추 맞출 수 있을 것 같기도 한데 나오지 않으면 의미없는 얘기겠지요.

    • addr | edit/del diex3all 2015.06.25 08:58

      사실 전 파워도 HP 라이브러리를 쓴다고 한들 맞출수 있을지도 조금 의문이 듭니다. ARM이 추정치에 16nm공정을 기준으로 20코어에 L2, L3 인터커넥트를 다 합쳐 30W라고 주장하는데, 이와 가장 비슷한 엑시노스 7420이 빅코어당 이미 1.5W는 쓰고 있다고 봅니다. 이후 공정최적화와 클럭이 똔똔되어 2.6Ghz에서도 1.5W쓴다고 가정해도 45W는 가겠지요. 설령 이게 최적화되어 나올 때 쯤이면 인텔에선 하스웰이 아니고 스카이레이크가 기어다니겠지요.

      사실 전력은 전력이고 성능도 문젠데(성능은 전적으로 아키텍쳐와 클럭차이니까) 당장 아난드텍 APM X-Gene 1벤치를 보면 웹성능 이런 테스트에서 제온이 5배 스코어로 털고 있는 장면도 보입니다(그러나 APM PR에서는 하스웰과 동급이라고 주장했죠).

      사실 이미 ARM기반 서버 1세대 벤쳐는 망했고, 페이스북도 ARM기반 서버 연구하다가 "싱글성능이 나빠서 반응성이 너무 안좋다"는 이야기를 자기 페북에 올렸던 기억이 납니다.

      그래서 사실 서버쪽에서 ARM이 제온이랑 비교하는건 영 믿음이 가지 않습니다.

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2015.06.25 20:03 신고

      슬라이드에도 있지만 RTL 기준 얘기니까요.
      슬라이드에 성능비교에 쓰인 기준도 아마 ARM 성능이 최대로 나올 수 있는걸 선택했겠지요.

      ARM 기반 서버향도 결국 대책없는 싱글성능을 효율적인 병렬화로 커버해야하는데, 그게 그렇게 쉬웠으면 x86부터 진작에 멀티코어로 방향을 잡았겠지요. (다른 요인도 있었겠지만......)
      성능 부족을 감수할 정도로 전성비가 좋으면 그래도 메리트가 있을텐데 몽블랑이나 서버 성능 보면 제온대비 전성비가 그렇게 좋은 것도 아니고요.
      SW, HW적으로 준비가 좀 더 필요해보입니다.

    • addr | edit/del diex3all 2015.06.25 23:56

      몇일 전에 나온 아난드텍 브로드웰 기반의 제온D 리뷰를 보면, 그야말로 인텔이 선제공격하는것이 느껴집니다.

      어차피 ARM 서버가 당분간 데이터센터 코어로 들어갈 가능성은 제로니까 결국 저강도 웹서버 벤치가 중요할텐데, 제온D가 E3 L을 2배 수준으로 탈곡(!)하고, E3가 ARM 기반 X-Gene을 또 4배 차이로 터는 안습한 상황이;;

      이래저래 인텔이 경쟁이 없어서 노력을 안하네 이런 소리들을 하지만, 사실 아무말 없이 정말 중요한 전쟁터에서 칼을 갈고 나온게 느껴집니다. ARM진영도 좀 더 분발할 필요가 있어 보입니다. ARM도 최신 공정을 이미 점령한 스마트폰따위가 아니라, 서버 시장에 먼저 투입해야 할 것 같은데, 문제는 ARM 서버 시장에 진출한 플레이어는 대부분 대기업이 아니고 벤쳐라는 점이겠지요;;

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2015.06.27 20:18 신고

      중요한 전쟁터라기보다는 마지노선이라고 봐야겠지요.
      서버시장이 털리면 데스크탑 시장 뺏기는건 시간문제일테니까요.
      그러니 그 전에는 신경도 안 쓰던 시장에까지 라인업을 확장하고 대응하는거고요.
      위 리플에도 썼지만 아직까지 ARM이 서버에서 힘을 쓰려면 준비가 더 필요해보입니다.

  17. addr | edit/del | reply BlogIcon wegg00 2015.07.30 18:45

    A72를 저클럭으로 쿼드코어 제품을 만들면 어떨까요 a57에 비해서 1ghz 초반대에서 전성비 20% 향상 이라는데
    퀄컴같은 회사에서 스냅 815 이런 제품을 a72 14nm 공정으로 써도 좋을거 같아요
    엑시 5433 에서 20nm a57 코어가 생각보다 전력을 덜 먹어서 신기했는데 여기서 전성비 향상+미세공정+최적의 클럭 까지 맞춘다면 배터리를 확실히 잡아주는 고성능 ap가 나올수 있을거 같은데 말이죠

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2015.07.31 19:48 신고

      A72 저클럭이 되면 이렇게 됩니다.
      절대 성능으로는 미들레인지 라인과 경쟁.
      미들레인지 라인은 절대성능보다는 원가, 전성비가 주요 셀링 포인트.
      A72는 기본적으로 고성능 타겟이기때문에 전성비에서 불리.
      다이사이즈도 커져서 원가에서 불리.
      14nm 등 고급공정을 쓰면 다이사이즈는 줄겠으나 공정원가 상승, 수율 저하 등으로 역시나 원가경쟁력 상실.
      미들레인지 라인에서 최신 공정을 쓰지않는게 그런 이유에서 입니다.