http://techon.nikkeibp.co.jp/article/EVENT/20130220/266913/?ST=p_bizboard
http://www.anandtech.com/show/6768/samsung-details-exynos-5-octa-architecture-power-at-isscc-13

아직 pcwatch에서 정보가 올라오지 않았지만 지금까지 확보된걸 올리겠습니다.
앞으로 추가 정보가 올라오면 갱신될겁니다.

-
ISSCC 2013에서 삼성이 발표할 것으로 알려진 엑시노스 관련 내용은 크게 두 가지입니다.
1. 28nm High-K Metal gate heterogeneous Quad-core CPUs for high performance and
energy-efficient mobile application processor

2. 72. 5 GFLOPS 240 Mpixel/s 1080p 60fps Multi-format video codec application
processor enabled with GPGPU for Fused multimedia application


하나씩 보도록 하지요.


1. 28nm High-K Metal gate heterogeneous Quad-core CPUs for high performance and
energy-efficient mobile application processor


삼성은 빅리틀 기술을 채용한 28nm 공정 SoC를 발표했습니다.
엑시노스5 옥타로 알려져있는 제품이겠지요.
빅리틀은 고성능 CPU 클러스터와 저전력 CPU 클러스터를 동일한 칩에 집적하여 처리부하에 따라
두 클러스터를 전환하면서 동작하는 기술입니다.




고성능 CPU 클러스터는 Cortex-A15 기반 쿼드코어.
최대 클럭 1.8GHz
크기 19mm2
삼성 28nm LP HKMG

저전력 CPU 클러스터는 Cortex-A7 기반 쿼드코어.
최대 클럭 1.2GHz
크기 3.8mm2
삼성 28nm LP HKMG

1MHz당 소비전력은 Cortex-A7 이 Cortex-A15 의 1/6 수준입니다.

32nm 공정의 Cortex-A9 쿼드코어가 9mm2 내외였던걸 생각하면 Cortex-A15 쿼드코어의 크기는 상당한 규모입니다.
ARM 자료에 따르면 28nm Cortex-A7 싱글코어가 0.45mm2 (L2 캐시 제외)인데,
쿼드코어(L2 캐시 포함) 3.8mm2 이면 ARM 자료에 크게 다르지 않은 수치로 보입니다.






그래프에서 스위칭 레벨은 7500 DMIPS 정도이고, 그 때 소비전력은 470mW 정도입니다.
그래프에서 Cortex-A15 최대 성능의 28000 DMIPS 정도이고, 그 때 소비전력은 5250mW 정도입니다.

Cortex-A7의 성능이 1.9 DMIPS/MHz 이고, 쿼드코어 1.2GHz라면 9120 DMIPS 입니다.
7500 DMIPS라면 Cortex-A7 쿼드코어 1.0GHz 정도의 이론성능 수치입니다.

Cortex-A15의 성능이 3.5 DMIPS/MHz 이고, 쿼드코어 1.8GHz라면 25200 DMIPS 입니다.
28000 DMIPS라면 Cortex-A15 쿼드코어 2.0GHz 정도의 이론성능 수치입니다.

발표 클럭과 자료상의 클럭이 안 맞는 이유에 몇가지 가능성이 있습니다.
1. 빅리틀의 예시를 보여주기위한 자료로 발표된 클럭과 다른 셋팅의 결과이다.
2. 삼성이 만들어서 일반적인 Cortex-A15, A7과 성능이 다르다.

2번의 경우라면 모순에 빠집니다.
발표한 클럭의 결과라고 가정하고 계산해보면,

삼성의 Cortex-A15는 3.9 DMIPS/MHz 로 레퍼런스보다 10% 이상 높은 성능이고,
삼성의 Cortex-A7은 1.6 DMIPS/MHz 로 레퍼런스보다 20% 가까이 낮은 성능이니까요.
둘 다 높든가, 둘 다 낮아야지 하나는 높고, 하나는 낮은 경우는 이상하지요.

1번의 경우로 보는게 타당합니다.
그렇다면 그래프의 자료는 Cortex-A15 2.0GHz 쿼드코어, Cortex-A7 1.0GHz 쿼드코어를 기준으로 작성된 것으로 생각됩니다.

앞서 1MHz당 소비전력은 Cortex-A7 이 Cortex-A15 의 1/6 수준이라고 했습니다.
그래프대로라면,
Cortex-A7은 1000MHz/470mW = 2.13MHz/mW
Cortex-A15는 2000MHz/5250mW = 0.38MHz/mW
(각각 쿼드코어 기준)
2.13 / 0.38 = 5.6
1/6 수준이라는 발표 내용과 들어맞습니다.
그래프가 Cortex-A15 2.0GHz 쿼드코어, Cortex-A7 1.0GHz 쿼드코어를 기준으로 작성된 것이라는 추측이 틀리지 않았다는 반증이기도 합니다.

그런데 삼성이 발표한 스펙의 클럭은 각각 1.8GHz, 1.2GHz 였단 말이지요.
산술적으로 소비전력은 Cortex-A15 1.8GHz 쿼드코어가 약 4700mW,
Cortex-A7 1.2GHz 쿼드코어가 약 560mW 가 됩니다.
Cortex-A15 1.8GHz 는 25200 DMIPS 이고, 그래프 상에서 그 성능 포인트를 찾아보면 전력은 약 4500mW 입니다.

(풀로드 6W라는 소리가 있던데 그렇지 않다는거.)



(코어마다 파워게이팅)



다중 문턱전압(Multi Threshold voltage, MTCOMS), DVFS(Dynamic Voltage and Frequency Scaling),
바디 바이어스(Body Bias), CPU 코어 당 파워게이팅(Power Gating) 등의 방법으로 소비전력을 줄였습니다.


DVFS는 전압과 클럭을 조절해서 동적 소비전력을 줄이는 기법입니다.
파워게이팅이 함께 적용되면서 부하에 따라 동작하는 코어 수를 조절하는 방식도 사용합니다.

파워게이팅은 시스템에서 동작하지 않는 블록에 전원 공급을 차단함으로써 전력소모를 줄이는 기술입니다.
PMU(Power Management Unit, 전력관리유닛)를 통해서 제어되는데, 스위치 트랜지스터가 turn-on 되면 블록에 전원이 공급되고 turn-off 되면 전련 공급이 차단됩니다.
스위치 트랜지스터의 동작 상태에 따라 블록의 on/off가 결정되기때문에 스위치 트랜지스터는 낮은 누설전류를 가져야합니다.
누설전류가 작은 트랜지스터는 Vth가 높은 소자이기때문에 다중 문턱전압 CMOS(MTCOMS) 공정이 필요합니다.

다중 문턱전압 CMOS(MTCOMS)는 클럭과 소비전력을 최적화하기위해 다양한 문턱전압(Vth)을 갖는 트랜지스터(TR)로 칩을 구성하는겁니다.
문턱전압은 inversion layer를 형성하는데, 낮은 Vth를 갖는 소자는 스위칭속도(클럭)가 빠르지만 누설전류가 큽니다.
높은 Vth을 갖는 소자는 누설전류가 작지만(일반적으로 낮은 Vth 소자의 1/10 이하) 스위칭속도가 느립니다.
SoC 내의 블록 전체를 단일 Vth 소자로 만들면 누설전류가 많아지거나 원하는 클럭에 맞출 수 없는 문제가
발생하는겁니다.

그렇기때문에 블록 내에서 critical path에는 낮은 Vth를 갖는 소자를 사용하고,
그렇지 않은 path에는 높은 Vth 소자를 사용해서 원하는 클럭과 낮은 누설전류를 달성합니다.



(하이브리드 클럭 메쉬)

6 트랜지스터 구성의 고속 커스텀 SRAM은 센스 앰프 회로의 통계적 편차와 셀 전류의 편차를 고려한 센싱 기술과 결합하여 동작 속도와 소비전력, 칩 면적의 균형을 갖게 되었습니다.

H형 회로 블록을 칩 위에 균일하고 대칭적으로 배치하는 하이브리드 클럭 메쉬(Hybrid Clock Mesh) 구조를
도입하여 고속 동작시 클럭 스큐(Clock Skew)를 줄였습니다.

클럭 스큐는 물리적인 거리 차이 등의 이유로 각 부분에 클럭 신호가 도착하는 타이밍이 어긋나는 현상을 말합니다. 

삼성은 발표에서 엑시노스5 옥타를 상용화하기위한 커스텀 라이브러, 타이밍 트윅, 공정 기술 선택의 가치를 강조했다고 합니다.
(쓸만하게 만드느라 고생했다는거...)


다이 사진도 공개했습니다.


(간단하게 레벨만 조정해본거)


2. 72. 5 GFLOPS 240 Mpixel/s 1080p 60fps Multi-format video codec application
processor enabled with GPGPU for Fused multimedia application


이 내용은 엑시노스5 옥타와 관련된 내용으로 생각했는데 엑시노스 5250 에 대한 내용이었습니다.
1.7GHz 듀얼코어 CPU와 72.5 GFLOPS의 연산 성능을 가진 AP에 대한 내용이라고 하는데 이건 엑시노스 5250 이니까요.
발표된 내용 중 확인된건 다음과 같습니다.

GPU 병렬처리의 전력 효율이 CPU 대비 10.7배.
CPU, GPU, 메모리 시스템, 내부 로직의 네 영역에 각기 다른 DVFS를 적용해 소비전력 절감.
12.8GB/s의 메모리 대역폭.
삼성의 32nm HKMG 공정으로 제작.


- 2012.02.23. 소비전력 추정 수정.



Posted by gamma0burst Trackback 0 : Comment 25

댓글을 달아 주세요

  1. addr | edit/del | reply 흡혈귀왕 2013.02.21 23:56

    저 다이사이즈의 경우 전체 사이즈인건가요 아님 짤린건가요?ㅎㄷㄷㄷ
    그나저나 아난드텍은 여전히 자기들의 정보통에 의하면 sgx544mp3일것이다라 하고있네요ㅋ

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2013.02.22 00:01 신고

      다이사이즈는 다이사진에서 하얀 박스쳐놓은 부분 얘기겠지요.
      SGX544MP3 부분은 시간이 지나면 정리되겠고요.
      맞으면 '대박' 틀리면 '그러면 그렇지' 할 준비하고 그냥 그러려니...

    • addr | edit/del 흡혈귀왕 2013.02.22 00:15

      아아~ 말을 잘못했습니다~
      저 다이사진이 다이 전체 사진인지 궁금했던거에열~
      늘 정사각형만 보다가 길두란 놈으로 봐서연

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2013.02.22 00:19 신고

      그럴리가 없지요.ㅎ
      직사각형 형태가 있기는한데 (대표적인게 인텔 CPU) 그건 그거 나름의 설계사상이 반영된거라서 일반화하기엔 좀 무리가 있습니다.

  2. addr | edit/del | reply 흡혈귀왕 2013.02.22 00:08

    그나저나 다이사진 왼쪽 상단이 상당히 여백의 미군요....
    뭔가 제마음의 공허함을 느끼게 해주는듯한ㅋㅋ

    전체 사진좀 뽑아주면 GPU어느정도 추정할수있을터인데 아쉽네요

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2013.02.22 00:20 신고

      저게 노는 공간은 아닐테니까요.
      전체 사진나오면 추정 수준이 아니라 무슨 GPU인지 다 나올걸요.

  3. addr | edit/del | reply ㅇㅇ 2013.02.22 14:39

    Mali450탑재할수도있다는 루머가있던데 그냥 루머겠죠?

  4. addr | edit/del | reply 라일락 2013.02.22 14:58

    생각보다 전력소모가 안높네요. a15쿼드 돌리면 사단날줄 알았는데....솔저정도면 배터리 용량 좀 크게 잡으면 커버가 가능한 수준정도 될 것 같아요. 루머론 6~9W 사이일거라고 생각됐었는데, 근데 루머로 스냅800도 2.3Ghz수준이라면 6w가 넘어가는 수준이라고 하는 것 같은데 만약 그렇게 되면 비슷비슷한 수준이 되겠네요. 그나저나 a7도 말도 안되게 저전력이긴 하네요. 뭐 저렇게 저전력이...쿨럭

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2013.02.22 17:21 신고

      저 전력은 말 그대로 피크값이라 의미가 없습니다.
      실제로 3D 게임이라도 계속 풀로드가 안 걸려요.

      아난드텍에 5250 소비전력 벤치를 봐도 초기에 잠깐 2.5W까지 뛰었다가 그 다음에는 0.5~1W 사이에서 왔다갔다합니다.
      Cortex-A15만 있는 5250이 이정도면 빅리틀에서는 평균전력이 더 떨어질테니 문제없지요.

  5. addr | edit/del | reply 맹자도 2013.02.22 16:04

    사실 발표한걸로만 보면 결고 krait에 밀릴거 같지 않은데(적어도 배터리에 있어서는) 역시 CP가 문제인거려나요. 아니면 아직 migraion이 월활하지가 못해서?

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2013.02.22 17:14 신고

      CP 통합에서 문제난거같은데 그러면 그냥 안 하면 그만이지요.
      다이까지 다 나온 마당에 AP에 큰 문제있겠습니까.

  6. addr | edit/del | reply lightspirit3 2013.02.22 20:13

    음.. 근데 스위칭이...

    어느 한 점을 기준으로 스위칭이 이뤄지는게 아니라 어느정도 겹치도록 둔 범위가 있고, 그 범위를 벗어나야 스위칭 되는게 아닌가요?

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2013.02.22 20:28 신고

      특정 지점에서 전환이 되어야지요.
      범위가 겹치면 그 영역에서 어떨때는 a7로 돌고 어떨때는 a15로 돌텐데 그건 문제가 있지않을까요.

    • addr | edit/del lightspirit3 2013.02.22 20:39

      반대로 특정 지점에서 전환이 되면 그 부근을 오가게 되면 너무 잦은 전환이 이뤄지지 않을까요?
      흠, 그럴 경우는 별로 없으려나요..

      뭔가 유사한 관련 내용을 본 적이 있는 것 같은데.. 착각이려나요;;

    • addr | edit/del lightspirit3 2013.02.22 20:44

      아, 아무래도 예전에 포스팅하신 글 중 이걸보고 그런 생각이 들었던 것 같네요.

      http://gamma0burst.tistory.com/526

      '빅코어가 800Mhz, 사용률 70% 이하일 때 리틀코어로 전환'
      '리틀코어가 1.0Ghz, 사용률 95% 이상일 때 빅코어로 전환'

      전환 알고리즘이 이런식이라면 겹치는 구간이 어느정도 있지 않을까요.

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2013.02.22 20:53 신고

      성능을 보면 오히려 두 구간 사이에 약간 간격이 있지요.
      단순 계산이지만,
      빅코어 800MHz 70%면 1960 DMIPS 이고, 리틀코어 1.0GHz 95%면 1805 DMIPS 니까요.
      사용률을 배제해도 각각 2800 DMIPS, 1900 DMIPS 이고요.

    • addr | edit/del lightspirit3 2013.02.22 21:08

      아, 계산상으로 그렇게 되나요..

      그걸 전혀 생각하질 않았네요..ㅎㅎ;;

  7. addr | edit/del | reply Favicon of https://random-ad.tistory.com BlogIcon JordanK 2013.02.22 22:44 신고

    그러니까 그냥 CP를 만들어서 따로 장착하라고 삼성!!

  8. addr | edit/del | reply 등대지기 2013.02.25 11:08

    3월 14일 언팩행사가 확정됬다고 합니다.
    예상대로 전작의 시점에서 1년이 안되는 시기에 갤럭시S4가 발표될 것 같네요
    갤럭시S3인경우는 홍보동영상으로 힌트좀 얻었었는데
    이번에는 정보누출을 최대한 막는다는 느낌이 있습니다.
    기대감이 큰 제품인만큼 실망이 클것으로 예상되네요.
    개인적으로는 갤럭시S3인 경우 자연을 모티브로 했었으니
    이번 갤럭시S4는 건강,힐링을 모티브로 하지 않을까합니다. ㅋㅋ
    감마님은 이번 갤럭시S4에 대한 루머중 어떤점이 실제로 적용 될 것이라고 생각하시나요?
    SGX544Mp3,옥타코어,400ppi,FHD아몰래드,플랙서블디스플레이,다른OS,색상및디자인, 등등...

  9. addr | edit/del | reply 맹자도 2013.02.25 15:52

    갤럭시s3가 5월 3일에 공개된걸 생각하면 약 315일 만이군요.