- ISSCC2015에서 발표하기로 알려졌던 엑시노스5433에 대한 내용이 올라왔습니다.

(링크 : 엑시노스5433 관련 단신. (Exynos5433))

(링크 : http://pc.watch.impress.co.jp/docs/column/kaigai/20150323_694058.html)

다른 곳은 거의 안 올리는데 pcwatch는 올리더군요.

confidential이나 NDA같은게 안 걸린건지 뭔가 있는건지 모르겠습니다.

 

-

링크 내용 자체가 잘 정리돼있어서 간단하게 정리하는 식으로 다루겠습니다.

중간중간에 사족도 좀 붙일거고요.

링크에서는 내용 흐름에 맞게 순서를 섞었던데 여기서는 슬라이드 페이지 넘버 순대로 하겠습니다.

 

- 내용

ARMv8 기반

삼성 20nm 공정.

1st 쿼드코어 CPU 클럭.

2nd 쿼드코어 CPU 클럭.

헥사코어 GPU

를 종합하면 이게 엑시노스5433이란걸 쉽게 알 수 있습니다.

면적에 대한 얘기는 뒤에서 하겠습니다.

 

발표 개요입니다.

설계 기술에 대한 내용이 대부분입니다.

 

20nm는 28nm 대비 전력효일이 20~30% 높음.

Gate-Last 방식.

 

Gate-Last 방식으로 Short channel effect를 억제했다는건,

공정상 이득 (Source/Drain Implant시 고온이 가능해짐, Gate Metal 형성시 저온이 가능해짐, 더미 게이트가 제거시 채널에 e-SiGe층에 의한 compressive stress가 커지고 Ion 증가 등등)

PMOS eSiGe, NOBS SMT(Stress Memorization Technology)를 통한 stress optimization

인듯한데 자세한건 모르겠습니다.

(소자 성능 개선을 위한 기술들입니다.)

 

RTL configuration 완료시점에서 32비트 ARMv7(CA15인듯) 대비 유효 게이트 수 +35.5%

(= 면적과 소비전력이 늘어남.)

 

최고 클럭 목표별로 다른 트랜지스터 구성을 시뮬레이션.

(왼쪽 : 전력 vs 최대클럭, 오른쪽 : 전력제한하에서 최대클럭)

Fmax1에서 Fmax4로 갈수록 클럭은 올라가지만 전력도 급상승. (왼쪽)

누설전류가 큰 (Low Vt) 트랜지스터 수도 급증.

제한된 전력에서 가능한 최대클럭은 Fmax2가 최대. (오른쪽)

 

Fmax2가 전력효율에서 최적. (1.08V에서 1.9GHz 달성.)

 

이 외에 물리설계 최적화 등으로 32비트 코어 대비 25% 증가된 전력으로 억제.

(25%라는 값. 엑시노스5430과 엑시노스5433의 동클럭 CPU 전력차이와 일치합니다.

엑시노스5430 : CA15, 커널 정보로 계산된 전력.

엑시노스5433 : CA57, 커널의 전압, 클럭 정보 + 아난드텍 측정 결과를 통해 개인적으로 추정한 전력상수 로 계산된  전력.)

 

CPU2 (CA53)은 전력효율을 높이는데 집중.

코어면적을 줄이고 배선길이를 짧게해 배선저항 감소.

누설전류를 낮추는데 주력해서 1.3GHz

 

GPU는 Mali-T760MP6

삼성이 20nm에서 6코어를 취한건 전력한도 내에서 최적의 성능을 얻을 수 있는 숫자가 6코어였기때문.

 

GPU 코어는 물리설계 저전력화도 이루어짐.

ARM GPU 코어에서 Flip-flop이 다이나믹 전력 중 36% 소비.

저전력 Flip-flop cell을 개발해 이 부분 전력을 30% 이하로 감소.

Flip-flop을 분산시키는 설계 최적화.

 

빅/리틀 코어 모두 DVFS를 사용.

SRAM이 데이터를 유지할 수 있는 업 레벨 전압이 로직보다 높다는 것이 문제.

SRAM이 DVFS로 전압을 낮추는 것에 제한이 됨.

듀얼 레일을 사용해서 셀 전압과 로직 전압을 분리.

대가로 약간의 딜레이, 누설전류가 따라옴.

 

다이 이미지입니다.

CA57 쿼드코어 면적이 14mm2, CA53 쿼드코어 면적이 4mm2

T760MP6 면적이 25mm2 입니다.

총 면적은 107mm2 정도로 보입니다.

 

28nm CA15 쿼드코어 면적이 19mm2 입니다.

(링크 : 삼성 엑시노스(Exynos) 5410 분해 사진.)

 28nm -> 20nm라면 면적이 이론적으로 절반수준으로 줄어야하는데, 여기서는 74% 수준으로 줄어드는데 그쳤습니다.

공정이 미세화된다고 이론대로 쉬링크되지 않는 것도 이유겠고, CA15에서 CA57로 바뀌면서 CPU 코어가 확장되었기때문도 이유가 될겁니다.

 

삼성 공정을 보면

28LPP 로직 CPP 114nm, 메탈피치 90nm

20LPE 로직 CPP 90nm, 메탈피치 80nm (메탈피치는 위의 자료에서도 나와있지요.)

(링크 : http://www.samsung.com/us/business/oem-solutions/pdfs/Web_DAC2012_20nm_demo-ah.pdf)

(링크 : http://www.samsung.com/us/business/oem-solutions/pdfs/Web_DAC2012_32_28nm_demo-ah.pdf)

산술적으로 면적은 70% 수준으로 감소합니다.

(최근 공정미세화 트랜드가 대게 이 정도입니다. 풀노드로 넘어가도 70~80% 수준에 그칩니다.)

 

그렇다면 CA15 -> CA57로 인한 면적증가는 5% 수준에 불과합니다. (크게 잡아도 10%수준?)

앞서 언급한 게이트 증가(35.5%)에 비하면 거의 늘어나지 않은 수준인데, 이걸 설계 최적화의 결과물로 봐야할지......

 

pcwatch에서는 삼성 20nm 공정이 두 가지가 있는데, 엑시노스5433에 적용된건 20LPE이고, 메탈피치가 64nm인 20LPM이 있다고 합니다.

메탈피치 64nm는 커먼 플랫폼(common platform)에서 나온 내용으로 삼성이 이를 자사 공정에 적용했는지 여부는 불명입니다.

개인적으로는 14nm로 빠르게 넘어가는걸 선택한 삼성에서 굳이 20nm에서 추가 공정을 개발할 정도로 힘을 들였을까하는 생각입니다.

 

 

- 요약

ARM RTL 그대로 쓰기 힘들어서 엄청나게 손 봄.

 

 

 

신고
Posted by gamma0burst Trackback 0 : Comment 39

댓글을 달아 주세요

  1. addr | edit/del | reply BlogIcon A TNT 2015.03.25 02:02 신고

    저기술로 몽구스를 몇년간 준비하면 엄청나겠네요 7430에는 a72가 나올지 몽구스가 나올지 궁금합니다
    그리고 야요이 생일인데 아이마스 리뷰 달리시는건 어떨까요

  2. addr | edit/del | reply 헤에 2015.03.25 02:32 신고

    저번에 올려주신 5433 커널정보에는 1.9GHz에서 전압 1.2625V, 소비전력이 1938mW인데

    오늘 올라온 자료를 보면 1.9GHz에서 전압이 1.08V, 1.8GHz에서는 1.03V인걸 보면

    아난드텍에서 측정한 소비전력 5433 싱글 1.8GHz - 1480mW, 5430 싱글 1.8GHz - 750mW가 얼추 맞겠네요 ㅎㄷㄷ

    감마님은 어떻게 생각하시는지요?

    P.S 이 자리를 빌어서 감사 글도 남깁니다. 항상 올려주시는 글 잘 보고 있습니다. 감사합니다.

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2015.03.25 03:07 신고

      아난드텍 측정 자료로는 5433 1.73W, 5430 1.48W 로 봐야할겁니다.
      차라리 이 쪽이 커널 정보하고도 잘 맞고요.
      아난드텍이 말로는 추정치라고 하는데 기준을 모르겠습니다.

  3. addr | edit/del | reply Favicon of http://biasedit.tistory.com BlogIcon JordanK 2015.03.25 03:00 신고

    이게 웬 마개조... ps. 그럼 이제 퀄컴 좀 덜 까일려나요...?

  4. addr | edit/del | reply BlogIcon ㅁㅁ 2015.03.25 08:02 신고

    빅리틀을 만들기 위한 과정.GML


    GML : 공밀레

  5. addr | edit/del | reply BlogIcon Standing S6 2015.03.25 10:14 신고

    커스텀 아닌 커스텀 같은 너어어... ARM이 여러모로 똥을 질펀하게 쌌네요;;;

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2015.03.25 11:58 신고

      ARM은 무슨 생각으로 타겟공정을 잡는지 모르겠습니다.
      저렇게 할거면 한세대 더 높게 잡아야할거 같은데.

  6. addr | edit/del | reply 2015.03.25 11:24

    비밀댓글입니다

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2015.03.25 11:59 신고

      64비트가 이렇게 빨리 나올줄 몰랐지요.
      다음에 나올 것도 여러모로 의미가 있어서 기대 중.

  7. addr | edit/del | reply 2015.03.25 12:09

    비밀댓글입니다

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2015.03.25 12:28 신고

      그렇네요.;;;
      수정했습니다.

      삼성 14nm 공정이 14LPE/LPP가 있는데 아무래도 7420은 LPE일겁니다.
      후속 제품 공정은.....
      28nm 사례를 보면 후속 공정 AP가 들어간 제품이 출시될 때까지 텀이 1년정도입니다.
      그렇게보면 14LPP는 내년 초라는 계산이 나오고, (전례를 봤을 때 올해 3분기에 나올) 노트5에 들어갈 제품은 14LPE를 유지할 가능성이 높다고 봅니다.

  8. addr | edit/del | reply 흡혈귀왕 2015.03.25 13:07 신고

    전 노트5에 달릴 엑시노스 GPU 성능 상승폭이 기대됩니다.

    그동안 사례를보면

    엑시노스5420은 엑시노스5410대비 그래픽이 2.1배 향상
    엑시노스5433은 엑시노스5422대비 그래픽이 50% 향상(OpenGL ES3.0 기준에선 1.8배 향상?)
    엑시노스7420은 엑시노스5433대비 그래픽이 53% 향상

    대충 그동안 사례보면 최소 50% 이상은 상승하고 있군요
    (엑시노스5420 -> 5422, 5430은 좀 예외지만)

    대충 노트5에 달리는놈이
    엑시노스7420의 GPU성능대비 50% 성능만 향상되도 진짜 엄청날듯하네요

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2015.03.26 00:36 신고

      이번 경우는 5410 -> 5420 과 유사하네요.
      공정은 같을거고, GPU 아키텍처가 변할 가능성이 있고.

      사실 50%까지 기대하지도 않습니다.
      예전이랑 달라서 이제 초반부터 한계에 가깝게 성능을 쥐어짜는 스킬이 늘어서, 역으로 후속작이 성능을 높이기 힘들어진듯 합니다.
      5433 -> 7420도 공정미세화 덕에 저렇게 오른거니까요.

  9. addr | edit/del | reply BlogIcon 지나가던폰덕 2015.03.25 13:45 신고

    어제 이것저것 바빠서 관련 찌라시 못봐서 뭔 내용인지 몰랐는데 결론은 ARM이 미끄덩거린게 연쇄효과를 냈다는 거군요... 이런.....

    지금 이게 테그라 X1의 HMP 미작동도 연관이 있으려나요??

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2015.03.26 00:34 신고

      테그라X1은 엔비디아가 원해서 선택한걸로 보이더군요.
      애초에 HMP할 생각이 없었던듯 합니다.

  10. addr | edit/del | reply BlogIcon 매니아 2015.03.25 23:38 신고

    한가지 궁금한게 hmp같은 경우 동기식이냐 비동기식이냐 입니다.. hmp지원 cpu가 나오기전에는 비동기식으로 자유자재로 코어를꺼버리고 클럭도 제각각으로 동작할거같았는데 막상 노트4로 이것저것 실험해보니 동기식인지라.. cpu z에서는 아예 a57은 a57대로 클럭이 동일하고 a53은 a53대로 클럭이 동일하게 표기되고 다른 어플들에서는 a57은 각각 비동기식으로 클럭이 작동하고(크게는아니고 각각 100~200mhz밖에 차이안나는거보아 어플오류일수도있음) 공통점으로는 스냅처럼 코어오프가없이 8개의 코어가 전부 작동한다는 것인데 이건 상당히 비효율적이아닌가싶네요..

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2015.03.26 00:53 신고

      이 부분에 대해 전에도 얘기한 적이 있는데 선택을 한겁니다.
      전력이냐, 반응속도냐.
      (커스텀 아키텍처 시절 스냅은 코어오프 지원합니다.)

      삼성에서 쓰는 방식은 모든 코어가 클럭은 같게 유지하면서 로드만 서로 다르게 가져가는겁니다.
      그래서 클러스터 별로 코어끼리 클럭이 같게 가는거고요.
      이 방식의 장점은 반응속도가 빠르다는겁니다.
      완전히 꺼진 코어를 다시 켜서 클럭올리는 시간 생각하면 당연한거지요.
      전력에서 비효율적이지 않을까 싶긴한데 그렇다고 클럭이 최대로 고정된 것도 아니고 전력 절감을 위한 기술이 있는대로 들어가 있는 상태이니 크게 문제없으리라고 봅니다.
      실제 제품화되서 별 문제가 없다는게 가장 큰 증거겠지요.

    • addr | edit/del BlogIcon 매니아 2015.03.26 19:06 신고

      a53같은공우 항상 켜져있어도 되지만 a57은 코어오프 지원햇으면 어땟을까싶네요.. 그럼 배터리 조금 더 오래갔을듯한데.. 디스플레이전력소모 개선되고했는데도 노트3랑 웹서핑외에는 배터리가비슷하니..

    • addr | edit/del BlogIcon 매니아 2015.03.26 19:08 신고

      제가 이런소리를 하는이유는.. 4412같은경우 클럭만 동기식이고 코어오프는 지원하는 반비동기식이었는데 퍼포먼스가 상당히 괜찮았던지라... a57이야 누설전류도 낮고 상관없겟지만 음악이나 고화질동영상도아닌데 a57계속 4개를 돌리면 조금 불리하긴하겟죠..

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2015.03.27 01:03 신고

      선택에 따른 득실에 대해 테스트 자료같은게 없으니 뭐라 판단하기 애매합니다.
      A57도 그냥 켜져있는거지 태스크 분배는 별개의 문제라서 돌아간다고 볼 수도 없고요.
      리틀코어가 다이나믹 전력 잡는데 주력하고, 빅코어 누설전력 잡는데 주력하는건 다 그런 이유인듯.

  11. addr | edit/del | reply BlogIcon 플리즈 2015.03.26 02:02 신고

    이 정도 수준의 마개조를 보고도 삼성은 설계능력이 없다고 호언장담하는 분들에게 코웃음만.. 5410이 욕을 그렇게 먹었지만, 실상은 삼성이라 쓸만큼 뽑았던 거고, 5433은 더 하군요. A57을 쓴 칩셋이 왜 이렇게 없었는지 알 것 같아요.. 설계능력이 없다면 기대와는 전혀 다른 물건이 나오기 때문에 그랬나 봅니다;;
    퀄컴은 자체 설계까지 하는 곳인데, 왜 이런 불상사가 나온 걸까요 정말???? 으음;; 덕분에 삼성 커스텀 코어에 대한 기대감이 올라가네요.

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2015.03.26 11:44 신고

      일반적인 설계 프로세스를 모르니 저개 마개조인지 어떤지 모르겠습니다만, 최소한 사람들이 생각하는 것처럼 레고조립하듯이 날로 먹을 수 있는게 아니라는건 확실해보입니다.

      퀄컴은 문제가 해결된 제품이 나오는지 여부에 따라 판단이 달라질듯 합니다.
      나온다면 티어가 낮은 것도 있고해서 일정이 빡빡한데 무리해서 출시 앞당기다가 저렇게 됐다고 볼 수 있겠고,
      안(못) 나오면 진짜 설계능력 문제라고 몰아가도 할 말이 없어지는 상황이 올 수도.;

  12. addr | edit/del | reply 2015.03.26 15:59

    비밀댓글입니다

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2015.03.27 01:08 신고

      낸드 지원은 아마 그럴겁니다.

      스냅이 안 먹는건 무선사 의지 문제겠지요.
      스냅410 64비트 지원 이력은 이미 있습니다.
      긱벤치에서 msm8916 aarch64 로 검색하면 제품 쭉 뜹니다.
      소니, TCL, 레노버, 모토로라, 샤오미 등등 있네요.
      실제 출시 제품인지, 출시제품이라도 적용됐는지는 차치하더라도 64비트 지원은 이미 가능한 상태인듯.

  13. addr | edit/del | reply Favicon of http://rubp.tistory.com BlogIcon RuBisCO 2015.03.26 22:35 신고

    손을 대단히 많이 봐야 했었다면야 퀄컴이 엿을 먹게 된것도 그럴만 하군요.

  14. addr | edit/del | reply BlogIcon ㅁㅁ 2015.03.29 00:20 신고

    퀄컴 : 와 시바 잠깐만

  15. addr | edit/del | reply BlogIcon 2015.04.17 20:46 신고

    이번 a57은 어찌 롤리팝같네요...

    설계에 문제가 있어서 문제도 생기고, 제조사들도 도입이 늦거나 다음버전으로 미뤄버리는...

    근데 퀄콤커널이 스케쥴링이나 최적화가 더 잘되있다는 말이있던데... 사실일까요?

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2015.04.17 22:21 신고

      A72가 어떤 업체에서 어떻게 나오느냐에 따라 A57이 문제인건지 업체가 문제인건지 확실해지겠지요.

    • addr | edit/del 맹자도 2015.04.17 22:36 신고

      이번에 퀄컴커널이 망해서 스냅 810이 망한거 아닌가염? LG가 두달만에 뒤통수 쳐서 스냅 810 문제 있는건 거의 기정 사실화 됬죠. 그렇게 강력하게 문제 없다고 주장하더니. 삼성하고 LG두회사가 스냅 810 문제 있다고 보이콧 해버렸으니. 최적화가 더 잘되있느냐 따질게 아니라 이번 분기 어떻게 넘기느냐가 문제인상황이죠. 그리고 A57이 퀄컴이 하나 망했다고 문제가 있다고 보기는 힘든게 그래봐야 현재 A57로 제조 하는 회사는 삼성하고 퀄컴 2개 뿐이라는거죠. 퀄컴하나 망한거 가지고 A57이 문제가 있다고 우기기에는 표본이 너무 적은 상황.

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2015.04.17 22:38 신고

      커널문제였으면 sw 문제라는건데 해결했겠지요.
      지금까지 그게 안 되고 있는거고요.
      솔직히 현재 상황만으로 판단하면 hw 문제로 보는게 맞습니다.

    • addr | edit/del BlogIcon 2015.04.17 23:48 신고

      미디어텍이나 락칩같은 회사들도 a72를 내네 어쩌네 하는거 보면 a57쪽에서 문제가 많았던것 아닐까요?
      그리고 이번 문제는 커널이 아니죠... 커널에 문제가 있다면 좀 다른증상도 동반됬을겁니다
      하긴... 공용커널에 램누수버그가 있는거 보면 엑시커널보다 딱히 나은게 없을 수도 있겠군요...

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2015.04.18 00:35 신고

      A72 내니 어쩌니 하는 얘기가 진짜 제 때, 제대로 나와준다는걸 보장하는게 아니니까요.
      샘플이 언제 나오니 하면서 몇달 전부터 얘기만 잘 하다가 막상 그 때되면 제품화 안 되는게 일상인게 이 판이라 두고 봐야 합니다.

  16. addr | edit/del | reply TNAME 2015.12.08 13:44 신고

    댓글 읽어보다 궁금한게 생겨서 댓글 남깁니다
    노트4는 코어 전체가 작동중이고
    갤s6는 어떤가요



티스토리 툴바