http://vr-zone.com/articles/intel-pushes-medfield-atom-socs-at-mwc/15047.html
http://www.anandtech.com/show/5592/intel-atom-z2580-z2000

MWC 2012에서 인텔이 스마트폰용 32nm 아톰 SoC (Medfield)의 라인업을 추가했습니다.




기존에 공개되었던 Z2460 외에 하이엔드용인 Z2580, 로우엔드용인 Z2000 이 추가되었습니다.

ATOM Z2580
- CPU
 Saltwell 기반 듀얼코어
(하이퍼스레딩 지원, 2코어 4스레드)
 1.3GHz/1.8GHz (기본클럭/터보부스트클럭)
 1MB L2 캐시
- GPU : SGX544MP2 533MHz
- 공정 : 인텔 32nm HKMG LP
2013년 상반기 출시 예정.

ATOM Z2460

- CPU
 Saltwell 기반 싱글코어
(하이퍼스레딩 지원, 1코어 2스레드)
 1.3GHz/2.0GHz (기본클럭/터보부스트클럭)
 512KB L2 캐시
- GPU : SGX540 400MHz
- 공정 : 인텔 32nm HKMG LP
2012년 상반기 출시 예정.

ATOM Z2000
- CPU
 Saltwell 기반 싱글코어
(하이퍼스레딩 미지원, 1코어 1스레드)
 1.0GHz
 512KB L2 캐시

- GPU : SGX540 320MHz
- 공정 : 인텔 32nm HKMG LP
2013년 상반기 출시 예정.


링크에 가면 각 칩과 매치되는 베이스밴드칩에 대한 내용도 있는데, 이 부분은 패스하겠습니다.
(구체적으로 따져봤자 결국 쓸때는 통신사의 노예...)
하나씩 보겠습니다.


- Z2580
CPU는 듀얼코어입니다.
성능만 놓고보면 현재 양산되서 판매되고 있는 ARM 기반 AP는 올킬입니다.

하지만 메드필드 탑재 제품이 언제 나올지 미지수이고, ARM 기반 제품 중에서는 Cortex-A15 기반 쿼드코어 제품이 출시 예정이기때문에, 제품이 나오게 된다면 ARM 기반과 아톰기반 간에 어느 정도 경쟁은 가능할 것으로 보입니다.
(Cortex-A9 로는 아톰과 경쟁이 안 됩니다. Cortex-A15 쿼드코어 정도되어야 아톰 듀얼코어와 경쟁이 가능한 수준)

성능상은 아톰이 앞서겠지만, 전력에서 Cortex-A15 기반이 앞설 것으로 보입니다.
고성능 고전력의 아톰이 점점 소비전력을 낮추고 있고, 저성능 저전력의 ARM이 점점 성능을 올리고 있는게,
서로 닮아가는 형국입니다.

GPU도 현재 기준에서는 엄청납니다.
SGX544MP2 533MHz 라는건 엄청난 스펙이지요.
(공정의 힘으로 무식하리만치 클럭을 올리는건 예나지금이나 변함이 없는 인텔 스타일입니다.)

애플의 A5 덕분에 SGX543MP2 가 유명한데, SGX544와 SGX543은 기본적으로 같은 것으로 알려져있습니다.
차이라면 SGX544는 DirectX 9 를 완벽하게 지원하고, 그로 인해 윈도우즈 8 플랫폼에 적합하다는 것 정도입니다.

결국 동클럭 성능은 SGX543MP2 나 SGX544MP2 나 같다는 얘기인데,
Z2580 의 SGX544MP2 의 클럭은 533MHz 로 아이패드2 탑재 A5 의 SGX543MP2 의 클럭의 2배 이상입니다.
스펙상으로 아이패드2 보다 그래픽 성능이 2배 이상 높다는 얘기입니다.


- Z2460
기존에 알려진 것보다 (터보부스트시)클럭이 2.0GHz 로 높아졌습니다.
소비전력에 여유가 생겼거나, 1.6GHz 로는 성능이 부족하다고 판단했거나, 둘 중 하나인듯.

GPU 성능은 이전 포스팅을 참조하세요.
(
인텔 Medfield 플랫폼 (Penwell SoC) 성능 분석.)


- Z2000
터보부스트도 없고, 하이퍼레스딩도 없습니다. 거기에 클럭은 1GHz
ARM11 같은 저성능 제품과 경쟁시킨다고 하는데, 그럴만합니다.
720P encode, 1080P decode 를 지원합니다.

GPU는 Z2460 과 동일하지만, 클럭은 320MHz 로 낮습니다.
그래픽 성능은 OMAP4460, 4430 과 비슷할 것으로 보입니다.




2013년 22nm 공정을 아톰에 도입할 것이라고 밝히고 있지만, 그게 이루어질지는 의문입니다.





반도체 공정에는 크게 HP, LP 공정이 있습니다.
HP 공정은 고성능을 목표로 하는데,
상대적으로 많은 누설전류로 인해 소비전력 증가가 있지만 클럭상승은 유리합니다.

LP 공정은 저전력을 목표로, 적은 누설전류, 낮은 클럭으로 저전력이 가능하지만,
클럭이 어느 수준을 넘어가면 오히려 HP공정보다 소비전력이 높아집니다.


위 그래프를 보면 45nm 선에서 32nm 선으로 가는 화살표가 두개씩인데,
가로 방향이 HP 공정이고, 세로 방향이 LP 공정입니다.
가로 방향은 동일 누설전류를 유지하는 대신, 동작시 전류증가시켜 클럭상승을 꾀하는 방향이고,
세로 방향은 동일 클럭에서 누설전류를 감소시키는 방향을 택하여, 동일 성능에서 소비전력이 감소되도록 하는겁니다.

일반적으로보면 HP 공정보다 LP 공정이 더 늦게 안정화됩니다.
LP 공정 적용제품이 HP 공정 적용제품보다 늦게 나온다는거지요.

로직쪽에서 공정과 양산에서 최고라는 천하의 인텔의 경우를 봐도 그렇습니다.
32nm 공정이 적용된 최초의 제품인 클락데일이 출시된게 2010년 1월이고,
본격적으로 데스크탑과 노트북에 32nm 공정 제품이 적용시킨 샌디브릿지 출시가 2011년 1월입니다.
32nm LP 공정인 아톰(Cedar Trail)은 2012년이 되어서야 하나 둘씩 시장에 나타나고 있습니다.

이는 인텔 외에 TSMC 등 HP, LP 공정을 둘 다 운영하는 팹이라면 공통적으로 나타나는 현상입니다.

TSMC도 최신 공정이 적용된 제품 중에서 HP 공정을 쓰는 GPU 같은 것들이 먼저 나오고,
LP 공정을 쓰는 AP 같은 것들은 상대적으로 늦게 나옵니다.


인텔에서 22nm 공정이 적용되는 제품은 아이비브릿지로 알려져있는데, 현재 알려진 출시 시기가 2012년 2분기입니다.
이전의 패턴으로 보면, 22nm LP 공정이 적용된 아톰은 빨라야 2013년 상반기, 늦으면 2014년 상반기나 되어야 시장에서 구경할 수 있다는 해석이 가능합니다. (발표가 아니라 출시를 말하는 것)



Posted by gamma0burst Trackback 0 : Comment 15

댓글을 달아 주세요

  1. addr | edit/del | reply lightspirit3 2012.03.02 00:41

    아톰에도 터보부스트가 적용되는군요..

    z2580 성능은 정말 ㄷㄷ 이란 느낌인데, 2013년 상반기라면..;;
    쿠다코어 테그라4가 공개될 시기가...

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2012.03.02 02:07 신고

      테그라2 나 테그라3 보면, 쿠다코어(통합쉐이더)가 들어가봤자 별 볼일없을 가능성도 있어보입니다.

      통합쉐이더라도 스펙이 높아야 성능이 높아지는데, 테그라2, 3 를 보면 GPU가 강하다는 엔비디아의 이미지에 비해 상당히 부실한 스펙이지요. 테그라존으로 성능부족을 극복하고 있지만요.
      통합쉐이더의 경우 GPGPU 지원때문에 다이가 커지는데, 테그라에서 작은 다이를 추구하는 엔비디아가 다이 사이즈 증가를 감수하면서 쿠다코어 수를 늘릴것 같지도 않고요.

    • addr | edit/del lightspirit3 2012.03.02 17:31

      그런가요..

      저번에 스마트폰용은 a15쿼드코어 + 최소 24쿠다코어에 태블릿용은 a15 옥타코어 + 64코어 쿠다코어라고 주워듣긴했지만, 딱히 확실하진 않으니..

      뭐, 나올 시기 가까이 가봐야 알 수 있겠죠?


      테그라2,3 그래픽 성능은 확실히;;;;

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2012.03.02 18:46 신고

      저도 그걸 보긴했는데, 루머일뿐이니 판단하기 애매하지요.
      다이 사이즈란 측면에서보면 28nm에서 불가능은 아니라고 봅니다.
      64쿠다코어보다는 오히려 옥타코어쪽이 더 어려울듯.

  2. addr | edit/del | reply Favicon of https://hazeview.tistory.com BlogIcon Br22z3 2012.03.02 09:30 신고

    이럴 때 인텔 입장에선 ARM이 발표 시기와 실제 양산시기의 간극이 엄청나게 차이난다는 게 안심할 수 있는 점이겠어요.
    뭐 제대로 된 경쟁을 볼 수 있는 게 2014년 즈음이면... 그때는 ARMv8 기반 AP와 22나노 아톰, 즉 ARM과 인텔의 전면전을 볼 수 있겠네요.

    LP공정이 말은 저전력 공정이라고 되게 쉬월 것 같이 느껴지는 데, 역시 전력을 잡는다는 게 쉬운 일이 아니군요. 천하의 인텔도... 하긴 애초에 ARM 영향력이 그렇게 커진 이유가 뭐겠어요...ㅎㅎ

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2012.03.02 16:30 신고

      성능보다는 전력이 더 중요하기때문에, 아톰이 ARM과 경쟁하려면 최소 2세대는 공정이 앞서야한다고 생각했는데, 엉뚱하게 ARM 고성능쪽으로 가닥을 잡으면서 소비전력이 커집니다.;;

      덕분에 머지않아 본격적인 아톰과 ARM기반 AP의 경쟁이 시작될듯.

  3. addr | edit/del | reply Cinep 2012.03.02 11:06

    항상 올려주시는 자료들 잘 보고 있습니다~. 한가지 궁금한 점이 있는데 아톰의 성능이 ARM 기반 AP에 비해 성능이 월등한가요? A15 기반도 쿼드가 아톰 듀얼과 경쟁 가능한 정도면 상당한가 보네요 ㅎㅎ

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2012.03.02 16:31 신고

      감사합니다.

      리눅스나 우분투에서 아톰과 Cortex-A9 제품을 벤치마크한 리뷰가 있는데, 보면 아톰듀얼이 Cortex-A9 듀얼에 크게 앞섭니다.

      린팩결과를 봐도 부동소수점 연산 성능이 계산상 아톰듀얼 1.6GHz 와 Cortex-A15 쿼드 2.5GHz 가 비슷하게 나오고요.

  4. addr | edit/del | reply 항상응원중 2012.03.04 14:36

    이번에도 좋은정보 감사합니다
    외국에 좀 다니느라 바빠서 자주 못오네요 ㅠㅠ

  5. addr | edit/del | reply 사랑해 2012.05.05 20:46

    LP공정에서 일정클럭을 넘기면 오이려 HP공정 보다 전력소모가 배가 된다하셧는대
    외 배가 되나요? 이런건 알곤있섯지만... 전혀안나오네요...

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2012.05.05 22:31 신고

      정확히는 모르겠지만, 일단 아는 범위에서 추측해보겠습니다.
      (이런게 뭐 비밀이라고 정보가 없는건지... 직접적으로 알려주는 곳이 없네요. 써놓고도 맞는지 모르겠음.)

      일단 각 회로가 동작하기위해서는 회로 블록에 클럭 신호가 공급되어야합니다.
      간단하게 보면, 클럭신호소스에 각 블록이 병렬로 연결되어있는거지요.
      이론적으로는 문제가 없지만,
      현실적으로는 클럭소스와 회로블록 간의 물리적 거리차이로 인한 지연차가 생깁니다.
      쉽게 말하면 가까운 블록과 먼 블록에 신호가 도착하는 시간에 차이가 생겨서 한 클럭으로 동시에 동작하는데 지연이 생기는겁니다.
      클럭이 100MHz 라면 클럭 주기가 10ns 지만, 1GHz면 1ns 입니다.
      지연한계가 50ps (0.05ns) 미만으로 제한됩니다.
      클럭이 상승하면 지연한계가 더 빡빡해(짧아)집니다.

      이걸 해소하려면, 가장 간단한 방법은 클럭소스에서 모든 블록까지의 거리(배선)를 같게 만들면 됩니다.
      하지만 이 방법은 배선량을 폭발적으로 증가시키기때문에 실제로 사용이 불가능합니다.
      현실적으로는 몇개의 블록을 묶어서 그 교차점에 클럭신호를 공급하여 공유하는 식으로 타협하지요.
      이렇게 타협을 해도 문제가 생기는데, 회로 자체가 늘어나기때문에 배선의 저항과 커패시턴스가 증가하고, 소비전력의 증가로 이어집니다.

      여기서 LP공정과 대상 제품의 특징을 보겠습니다.
      1. 낮은 제조 단가.
      2. 저전력.

      단가를 낮추려면 공정 단계를 줄여야하고, 이를 위해서는 회로의 층수를 줄여야합니다.
      (마스크 개수 등이 단가에 영향을 끼치므로...)
      결국 배선이 복잡해져서는 안 되는거지요.

      배선의 복잡도를 낮추면, 결국 앞서 말한 신호지연 등의 이유로 클럭 상승에 한계가 있습니다.
      무리해서 클럭을 올리기위해서는 (0과 1사이의) 더 강한 신호차이가 필요하기때문에 전압이 상승하고, 소비전력이 증가합니다.
      설계 단계부터 고클럭을 상정하고 제조한 회로와, 그렇지 않은 회로 중,
      고클럭에서 어느 회로의 소비전력이 더 낮을지는 불보듯 뻔하겠지요.

      낮은 단가를 만족하기위해서는 고성능(고클럭)을 포기해야합니다.

      쓰다보니 저전력은 낮은 단가에 딸려오는 덤같은 느낌이 있네요.

    • addr | edit/del 사랑해 2012.05.05 23:55

      아하 그렇군요.
      즉 LP공정은 전력 소모를.낮추기위해 설계등을 간단히.햇기에 HP공정등 고클럭을 염두해둔 제품보다 차이가있단거군요.
      즉 설계를단순히하고 햇기에 클럭을 높일렴 과다전력이 소모된단거네요.. ㄱㅅ합니다^^

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2012.05.06 00:10 신고

      저도 정확히 몰라서, 아는 범위에서 썼는데 혹시나 다른 정보있으면 알려주세요.ㅎ

  6. addr | edit/del | reply 사랑해 2012.05.06 00:57

    넵^^