http://isscc.org/program/index.html

 


반도체 회로 설계 컨퍼런스인 ISSCC (IEEE International Solid-State Circuit Conference) 2013 이
2월 17일~21일에 열립니다.
이번 프로그램 중에 다음과 같은 것이 있습니다.

- 28nm High-K Metal gate heterogeneous Quad-core CPUs for high performance and energy-efficient mobile application processor
(samsung electronics)


정황상 엑시노스5 쿼드코어입니다.
기존에 알려진 엑시노스 5450 이 아니라 엑시노스 5440 이라는 정보도 나왔는데, 사실 이름이 크게 중요한건 아니고요.
28nm HKMG 공정인데, heterogeneous 즉, 이(異)종결합이라는게 구체적으로 무엇이냐는겁니다.
상식적으로 ARM에서 heterogeneous 라고 부르는건 big.LITTLE 을 말하는겁니다.
Cortex-A15, Cortex-A7 의 결합이지요.
high performance and energy-efficient 라는 표현을 고려한다면 더더욱 그렇습니다.


(
http://pc.watch.impress.co.jp/docs/column/kaigai/20111130_494357.html)

주황색 곡선은 고성능 Cortex-A15의 DVFS 곡선,
파란색 곡선은 Cortex-A7의 DVFS 곡선입니다.
(DVFS(Dynamic Voltage and Frequency Scaling) : 부하에 따라 전압과 클럭이 변화.)

Cortex-A7은 전력 효율이 높습니다.
최대 성능에서 Cortex-A15와 같은 수준의 성능이면서 전력 사용량은 낮습니다.
부하가 낮을 때는 Cortex-A15로는 도달할 수 없는 초저전력이 가능합니다.
하지만 Cortex-A15의 모든 성능 범위를 커버할 수는 없습니다.


(
http://pc.watch.impress.co.jp/docs/column/kaigai/20111130_494357.html)

big.LITTLE 모델은 두 가지입니다.

좌측의 방식은 태스크 전환입니다.
Cortex-A15의 최저 클럭까지 DVFS로 내려갔을 때, Cortex-A7을 가동하여 태스크를 넘기는 방식입니다.
Cortex-A15에서 실행하던 OS나 어플리케이션을 그대로 Cortex-A7로 옳깁니다.
OS 측에서 보면 같은 CPU에서 다른 전압과 클럭으로 바꾸는 것과 같기때문에 OS측의 특별한 기능 지원이 필요가 없습니다.
지금 상태에서 제품만 있으면 바로 적용이 가능한 것이지요.

우측의 방식은 다릅니다.
Cortex-A15, Cortex-A7 을 동시에 모두 사용하는데,
부하가 높은 태스크는 Cortex-A15에 할당하고, 부하가 낮은 태스크는 Cortex-A7에 할당합니다.
코어 활용 측면에서는 이쪽이 더 효율적이지만, OS측에서의 지원이 필요하기때문에 당장 적용할 수는 없습니다.
(어느 쪽이든 테그라3 의 보조 코어 방식과는 개념과 동작에서 다릅니다.)

일단 태스크 전환 방식만을 적용했을지, 아니만 향후 OS 지원을 대비해서 두 가지 모두 가능하게 해놓았을지 여부도 지켜봐야할 부분입니다.

엑시노스 5440 이 Cortex-A15, Cortex-A7 의 이종결합, big.LITTLE 이라면 관건은 Cortex-A7 코어가 얼마나 필요한가 하는겁니다.
Cortex-A15 4코어의 태스크를 그대로 받아야하니 4코어가 필요하다고 봐야겠지만, Cortex-A7 로 전환될 정도로 부하가 낮은 상태에서 굳이 4코어가 필요한가하는 의문도 있습니다.
이 부분은 big.LITTLE 알고리즘에 따른 것일텐데 구체적인 것을 모르니 결론내기가 어렵네요.
다만 분명한건 다이 사이즈 문제로 4코어가 무리인건 아니라는겁니다.
28nm 공정에서 1코어가 고작 0.45mm^2 입니다.
4코어라고해도 1.8mm^2 에 불과하고, 이는 전체 다이 사이즈의 5% 미만으로 생각됩니다.




또 다른 내용도 있습니다.

- 72. 5 GFLOPS 240 Mpixel/s 1080p 60fps Multi-format video codec application processor enabled with GPGPU for Fused multimedia application
(samsung electronics)

부동소수점 연산 성능, GPGPU 언급을 봤을 때, Mali-T604 에 대한 내용같습니다.
실제로 엑시노스 5250 의 Mali-T604 533MHz 의 부동소수점 연산 성능은 72.5 GFLOPS입니다.
픽셀 성능이 240 Mpix/s 라는걸 확인할 수 있습니다.

또 한 가지 보이는게 GPGPU에 대한 언급입니다.
최근에 ARM기반 슈퍼 컴퓨터 프로젝트인 몽블랑 프로젝트의 프로토타입에 엑시노스 5250 이 선정되었다는 기사가 나왔는데, 목표 성능을 달성하기위해서는 GPGPU가 필수입니다.
(ARM기반 슈퍼 컴퓨터 프로젝트, 몽블랑(Mont-Blanc))
이번 프로그램에서 그와 관련된 부분이 언급될 가능성이 있다고 봅니다.

또 다른 부분은 엑시노스 5440 의 GPU가 무엇인가하는 부분입니다.
ISSCC 2013 상황만 보면 엑시노스 5440 의 GPU는 Mali-T604 입니다.
지난 ISSCC 2012 를 생각해보면 그렇습니다.
다들 엑시노스 4412 의 GPU가 Mali-T604 일 것이라 예상했지만, Mali-400MP4 로 정보만 나왔을뿐 Mali-T604 에 대한 언급은 없었습니다.
결국 엑시노스 4412 의 GPU는 Mali-400MP4 였고요.

전례를 봤을 때, 이번 ISSCC 2013 에서 언급이 없는 Mali-T658 등이 엑시노스 5440 에 들어가리라고 생각하기는 어렵습니다.
물론 그렇다고 한다면 엑시노스 5250 과 GPU 에서 별 차이가 없게되는데, 이렇다면 둘 중 하나일겁니다.
엑시노스 5250 은 그렇게 많이 사용하지 않고 넘어갈 것이다.
혹은 533MHz 이상으로 클럭을 높일 것이다.
단정지을 수 없으니 지켜볼 부분입니다.


- 출시 시기?
지난 해 2월 말에 있었던 ISSCC 2012 에서 엑시노스 4412 에 대한 내용이 발표되었고, 탑재 제품인 갤럭시S3 가 발표된 것이 5월 초 였습니다. 날짜로는 10주 정도였지요.
이와 같은 패턴으로 ISSCC 2013을 통해 엑시노스 5440 를 발표하고, 2분기 마감 한 달전인 5월 중에 엑시노스 5440 을 탑재한 갤럭시S4 를 발표, 출시한다는 시나리오도 상상해볼만 합니다. 

-
저것 말고도 다른 업체들의 흥미로운 정보가 꽤 있는데, 시간날 때 천천히 봐야겠습니다.



Posted by gamma0burst Trackback 0 : Comment 11

댓글을 달아 주세요

  1. addr | edit/del | reply 맹자도 2012.11.26 08:59

    개인적으로 658은 현재 시점으로 너무 오버 스펙이 아니었나 합니다. 604로도 충분할듯. 클럭수 올리고, 솔직히 604가 생각보다 성능이 안나온 편이므로 반년가까이 뒤에는 훨씬 최적화 되서 탑재 되겠지요. 이걸로 충분히 a6x의 GPU는 넘어설것이고 설령 아이폰5s가 루머대로 상반기에 또 나온다고 해도 그 성능은 a6x와 엇비슷한 수준이겠지요.

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2012.11.26 14:55 신고

      a6x와 비슷하려면 말도 안 되는 신적화가 이루어져야하는지라;;
      비슷하게 갈 수 있을지 모르겠습니다.

  2. addr | edit/del | reply 플리즈 2012.11.26 10:19

    5440은 그냥 예전부터 알려져왔던 엑시노스5 쿼드 코어고(예전부터 5450의 존재에 대한 루머는 유명했으니까요.), 이번 ISSCC에서 발표되는 것은 빅리틀 구조라는 말도 있고요. (58??, 54??) 갤럭시 S4 발매 즈음에 양산되서 탑재해 나오지 않을까하는 생각이.

    저 헤테로 지니어스 쿼드 코어 구조에 대한 루머도 많더라고요. a15*4 + a7*4 의 옥타 코어 형태의 쿼드 코어(실제 돌아가는 건 4개의 코어 뿐이니까), 각각 두개 들어가서 그냥 물리적인 코어 수로 쿼드코어라는 이야기도 있고.. 아직 태스크 전환 방식 외에는 안드로이드에서 지원을 하지 않을텐데 어떤 방식의 쿼드 코어인지 궁금하네요. OS 업그레이드까지 염두해두고 있다면 2+2의 쿼드코어 구조로 나올 것 같기도하고.요.. 안드로이드에서도 내년 버전에는 빅리틀을 지원하지 않을까하는 생각도 들고요.

    • addr | edit/del 맹자도 2012.11.26 14:41

      2+2 구조면 우리는 그걸 쿼드라고 부르지 않죠. 광고를 그렇게 한다면 모를까 학술에서 쿼드라고 한이상 최소한 a15는 쿼드일겁니다.

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2012.11.26 15:00 신고

      일단 2+2 를 놓고 쿼드코어라고 하지는 않겠지요.
      굳이 한다면 2+2 라고 할지 모르겠네요.
      테그라3 를 4+1 이라고 하는 것처럼요.
      어쨌든 가능성은 낮다고 봅니다.

      빅리틀 방식도 노멀하게 예측한다면 당연히 태스크 전환 방식이겠지요.
      부하에 따른 태스크 분담은 태스크 분할 기능을 구현하는데 어려움이 있을 것 같은데, OS지원도 제대로 없는 상황에서 혼자서 앞서서 이 기능을 지원하는건 좀 오버인 것 같습니다.
      타사에서 Cortex-A15 기반 제품이 많아진 다음에 내놓는게 좋을거란 생각도 듭니다.

  3. addr | edit/del | reply 2012.11.26 11:06

    비밀댓글입니다

  4. addr | edit/del | reply 흡혈귀왕 2012.11.26 15:52

    위에 비밀글 내용 궁금해열 감마님~ 짐작하건데 관계자분 댓글 같은데 ㅋㅋㅋ

    근데 T604 상대적으로 픽셀 성능이 좀 낮지않은가 생각되네요....
    Mali-450MP가 3.8Gpix/s인데 말이죠....

    왤까나....아참 전에 ARM 개편된 로드맵중 Mali-T658이 내년 2분기에 릴리즈 될 예정
    이었다가 T658이 사라지고 내년 2분기에 Mali-T624 가 릴리즈된다고 나와있더군요...

    아마 요놈이 엑시노스54xx의 GPU가 아닐지....

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2012.11.27 00:50 신고

      통합쉐이더 방식의 단점이지요.
      쉐이더 수가 늘면 연산성능은 늘어나도, 아웃풋단이 늘거나 효율이 향상되지 않는한 그래픽 성능은 그대로.

      그래도 통합쉐이더의 활용 효율이 더 높으니 픽셀 성능이 낮다고 문제될건 없을겁니다.
      폴리곤 성능이 심하게 떨어지는 것보다는 나으니까요.
      GPGPU 활용 측면도 있고요.

      Mali-T624 를 상황에 맞춰서 해석할 수는 있습니다.
      5250 과의 성능 차별화가 필요하긴한데, 그 방향은 그래픽 성능일겁니다.
      연산 성능이 거의 의미없는 모바일 기기에 들어가는 GPU 일테니까요.
      그렇다면 연산 성능 향상이 큰 Mali-T658(혹은 678)을 넣기에는 수지가 안 맞지요. 쓸데없이 커지는 다이사이즈 등등.
      Mali-T624 의 정보 중에 T604 대비 50% 성능 향상이 연산 성능이 아닌 그래픽 성능 측면으로 본다면 가장 효율적으로 그래픽 성능을 올릴 수 있는 방법이되겠지요.

      어쩌면 엑시노스5 쿼드코어 제품은 빅리틀 여부, GPU 종류로 나눠진, 모바일 기기용과 연산용(슈퍼컴퓨터용이라든지)의 두 가지가 있을지도 모르겠습니다.