엔비디아의 CES2013 Press conference가 있었습니다.
내용은 크게 3가지.
테그라4 와 LTE 모뎀, 모바일 게이밍 플랫폼(Project Shield), 그리드 게이밍 시스템.

물론 여기서는 테그라4 (Tegra4) 를 보겠습니다.
전에 사양이 유출되어서 다룬 적이 있는데 얼마나 다를지 보겠습니다.
(
엔비디아 테그라4 스펙 유출.)

이전에 포스트를 통해서 언급했던 내용은 아주 자세히 쓰지 않겠으니, 궁금하면 확인해보시길.
일부 내용은 아난드텍 출처.
(
http://www.anandtech.com/show/6550/more-details-on-nvidias-tegra-4-i500-5th-core-is-a15-28nm-hpm-ue-category-3-lte
http://www.anandtech.com/show/6552/more-nvidia-icera-i500-details-28nm-hp-category-3-lte-at-launch-4-later)




TSMC 28nm HPL 공정.
다이 이미지는 실제와 다를겁니다. 테그라3 때처럼요.
다이 사이즈는 80mm2 정도라고 합니다.

- CPU
Cortex-A15 기반 쿼드코어.
4-Plus-1 코어.
클럭은 동기식.

클럭은 최대 1.9GHz 라고 합니다.
5번째 코어는 테그라3 처럼 다른 4코어와 공정이 다르다고 합니다. (LP공정인듯)
4-Plus-1 코어는 테그라3와 유사한 것으로 (같다고 봐야지요.) 윈도우즈 RT에서 테그라4도 보조 코어를 제대로 활용하지 못 할 것으로 예상.
그리고 4-Plus-1 은 빅리틀 아닙니다.
클럭은 동기식이라고 합니다.
디자인이 간단해지고 효율이 좋아지며, 캐시 액세스 효율이 좋아진다고 합니다.
다이 사이즈를 줄이는데 있어서 동기식 설계도 한 몫 했을겁니다.

- GPU
72코어

쉐이더(엔비디아는 코어라고 부르지요.)는 통합 쉐이더가 아니라고 합니다.
버텍스와 픽셀 쉐이더의 비율은 정확하지 않지만 대다수는 20-bit 픽셀 쉐이더라고 합니다.

이것이 사실이라면 근본적으로 테그라3 때와 달라진게 없습니다.
연산 성능 따지는 것도 의미가 없어졌습니다.
GPGPU가 가능해야 성능을 따지든 말든하지요.
(케플러 기반은 희망사항일뿐이었나.)
그냥 쉐이더 숫자만 늘어난거지요.
데스크탑용 GPU에서 말하는 방식으로는 18코어가 되겠고요. (72/4)
기반이 되는 G70 계열 GPU에서 버텍스, 픽셀 쉐이더 비율이 1:2~1:3 이고, 테그라3는 1:2 였지요.
1:2 이면 버텍스 24, 픽셀 48
1:3 이면 버텍스 18, 픽셀 54

테그라3 6배, 테그라2 20배 성능에 맞춰 클럭을 계산해보겠습니다.
(케플러 기반으로 계산했던 것보다는 훨씬 현실적이네요.)

버텍스 24, 픽셀 48
- 테그라3 6배 기준 최대 600MHz 내외
- 테그라2 20배 기준 최대 667MHz 내외

버텍스 18, 픽셀 54
- 테그라3 6배 기준 최대 533MHz 내외
- 테그라2 20배 기준 최대 593MHz 내외


실제로 통합쉐이더인지 아닌지, 성능은 어떤지는 나와봐야 알 일.
버텍스 쉐이터 24개, 픽셀 쉐이더 48개라고 합니다.
(
http://pc.watch.impress.co.jp/docs/news/event/20130111_581395.html)


 

넥서서10과 웹페이지 표시 속도를 비교했는데, 해상도, 브라우저 등등 변인통제가 제대로 되지 않아서 신빙성은 상당히 떨어집니다.
엔비디아가 자체 벤치에서 이상한 짓을 한 전적이 있기때문에 성능 부분에 대해 속단은 금물.
테그라3 때는 코어 듀오보다 빠르다는 내용으로 구설수에 오르기도 했고...
(
엔비디아의 쿼드코어 SoC, 코드네임 KAL-EL 발표.)


 


(HDR같은 이미지 처리 엄청 빠름. 이라는 내용.)



2011년 5월에 Icera를 인수하더니 드디어 제품이 나왔습니다.

- i500 Soft Modem
TSMC 28nm HP HKMG 공정.
8개의 프로세서가 있고 각 프로세서 별로 파워게이팅이 가능해서 소비전력 절감 효과.
일부 기능을 소프트웨어로 처리해서 일반적인 하드웨어 모뎀칩에 비해 40% 다이 사이즈 감소.
(Icera의 기술이라고 함.)
65nm LP 공정(TSMC가 아니라고 함.)의 새로운 transceiver와 pair

UE Category 3 LTE (100 Mbps downlink on 20 MHz FDD-LTE) 지원.
향후 소프트웨어 업그레이드로 UE Category 4 LTE 지원 가능.
WCDMA/HSPA+ side, DC-HSPA+ (42 Mbps downlink) 지원.
VoLTE를 포함한 음성모드 지원.
(3GPP 규격은 대부분 지원하는듯.)


- 2013.01.11 CPU, GPU 정보 추가.



Posted by gamma0burst Trackback 0 : Comment 24

댓글을 달아 주세요

  1. addr | edit/del | reply 흡혈귀왕 2013.01.07 22:50

    그렇다면 단순 페르미나 케플러기반이 아닌 G70기반에서
    쉐이더유닛만 추가시킨거일수도 있단 말씀이시군요?
    코어는 싱글로드시 1.9GHz로 동작하고 쿼드로드시 1.8GHz이 맞는듯한데

    GPU 성능이 궁금하네요....테그라3대비 6배성능만 지켜준다면야 뭐...
    브라우저 장난질은 제가볼땐 넥서스10은 크롬으로하고 테그라4는
    스톡브라우저로한듯하네요...

    제가 늘 주장하는 모바일 크롬 재앙설....ㅎㄷㄷㄷㄷㄷ;;

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2013.01.07 23:00 신고

      쿼드코어 로드 클럭은 불명입니다.
      계산이나 설명의 편의를 위해서 0.1GHz 낮다고 하는데, 실제 클럭 프로파일보면 그건 테그라3 중 일부의 경우입니다.
      실제는 테그라3 모델마다 상당히 다른 클럭 설정을 갖고 있습니다.

      GPU 부분에 대해서는..
      통합쉐이더가 아니라면 G70 기반일수 밖에 없겠지요.
      G80부터는 통합쉐이더니까요.
      사실 최적화만 잘 시킨다면 통합쉐이더보다는 버텍스/픽셀 쉐이더 구조가 그래픽 성능 올리기 쉽지요.
      아웃풋단 병목도 없고요.
      테그라존처럼 게임 업체와 손잡고 최적화된 게임으로 승부보려는 엔비디아이니 통합쉐이더가 아니라고 딱히 아쉬울건 없을 것 같단 생각입니다.
      당장 GPGPU가 필요한 것도 아니고.

  2. addr | edit/del | reply 흡혈귀왕 2013.01.07 23:03

    이번에 엔비디아에서 강조하는 이미지프로세싱관련에서
    엔비디아의 포토그라피 엔진과 CPU+GPU 연산을 더해 프로세싱 속도를 기존대비 10배로 올렸다는거
    같던데 기왕이면 최소 G80기반 이상이었음 좋겠습니다.

    뭐 G70 기반이라면 테그라3 대비 6배 성능만 확실히 지켜준다면 상관없고....

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2013.01.07 23:18 신고

      CPA(Computational Photogrphy Architecture)의 기본 컨셉은 원래 직렬 처리하던 이미지 처리를 병렬 처리한다는 개념이지요.
      여기에 GPGPU가 필수인건 아닙니다.
      ISP를 비롯한 이미지 처리의 근간은 픽셀성능인데, 이건 굳이 GPGPU가 아니어도 충분히 가능하지요.
      오히려 이미지 처리에 통합쉐이더 사용하는 경우가 드물지요.

  3. addr | edit/del | reply 흡혈귀왕 2013.01.07 23:22

    아난드텍 애네들 틀린전적이 좀있어서 개인적으로 틀리길바라고있음..ㅋㅋㅋ
    OpenGL ES3.0과 다이렉트X11 및 OpenCL1.2 임베디드용 정도 지원되길 바랬거든요.........

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2013.01.07 23:30 신고

      보니까 현장에서 관계자에게 얻은 정보같아서 틀릴 가능성은 낮아보임.

      엔비디아는 이번 세대까지는 GPGPU에 관심이 없는걸지도 모릅니다.
      프로젝트 덴버가 ARMv8 기반인데 이건 확실히 다음 세대 대상이지요.
      슈퍼컴퓨터 대상인 에셜론도 (아직 구상단계지만) 2016~18년 예상이고요.

  4. addr | edit/del | reply 흡혈귀왕 2013.01.07 23:37

    그러고보니 엔비디아가 공식적인 언급으로 덴버코어외에
    맥스웰의 경우 차세대 모바일 테그라, 지포스, 쿼드로 자사 모든 제품에 다 쓰일거라
    했는데 내년 테그라5나되서야 GPGPU 기능 생길지도 모르겠네요...

  5. addr | edit/del | reply 흡혈귀왕 2013.01.08 00:25

    그런데 감마님 전공이 어떤 전공이신가효?ㅎㄷㄷㄷ
    반도체 Soc쪽이신건가욜?

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2013.01.08 00:35 신고

      전자전기공학부.
      학부라서 전공은 자기가 알아서 해야되는데 (반도체) 소자 했어요.

      블로그질에는 전공보다 독학이 더 중요하지만요.;;

  6. addr | edit/del | reply 흡혈귀왕 2013.01.08 00:43

    역시 그쪽이셨군요ㅎㄷㄷㄷ 저도 구글링으로 한계가있다보니
    저같은 범인은 감마님 블로그로 도움 굉장히 많이 받고있습니다~!

  7. addr | edit/del | reply 흡혈귀왕 2013.01.08 01:49

    LG 컨퍼런스 감상 느낌: LG이런 개.....!!!! @#$@#$ 날 속여?!!ㅋㅋㅋㅋ

  8. addr | edit/del | reply 맹자도 2013.01.08 09:39

    테그라야.. 제가 AP 관심 가져온게 테그라2때부터인데 발표대로 나온적이 단 한번도 없었지요. 테그라2때도 뻥카, 테그라3 때도 뻥카... ... 실성능 뿐만 아니라 발매시기나 기타 잡다한건 모두 다 틀어지는걸 보면 목표를 높게 잡아 놓고 그걸 발표하는게 아닐까 하는 의구심이... ...

    • addr | edit/del 흡혈귀왕 2013.01.08 10:47

      뭐 적어도 테그라3는 테그라2대비 정말 3배급 그래픽성능으로 나왔으니.....

    • addr | edit/del 맹자도 2013.01.08 13:15

      아 말이 좀 과도하게 쓰여졌나. 뭐 그래도 맞는 내용도 많지요. 제말은 뻥카가 많이 껴 있다는거죠.

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2013.01.08 15:52 신고

      그래픽 성능 얘기는 믿을만하지요.
      문제라면 초기 제품에서 과거에 언급했던 최대 성능이 안 나온다는 것뿐.

      유출 슬라이드가 어느 정도 맞아떨어져서 6배, 20배 얘기를 맞는 것처럼하는거지 엄밀히따지면 6배, 20배가 맞다는 보장은 없습니다.

  9. addr | edit/del | reply Favicon of http://blog.naver.com/mercucu1111 BlogIcon A TNT 2013.01.08 11:00

    테그라3 지퓨 구조는 버텍스랑 픽셀이 1:2아니엇나요
    그리고 버텍스셰이더랑 픽셀셰이더 가 전체 18개인데 1:3비율은 불가능할거같네요

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2013.01.08 15:50 신고

      물론 18개로 센다면 그렇겠지요.
      테그라3 와 동일한 구성으로 갈 것이라는게 가장 예측하기 쉽기도 하고요.
      GPU에서 18코어에 가장 가까웠던게 17코어인데 버텍스5 픽셀12 의 구성입니다.
      그래서 1:3 구성도 가정해본거고요.
      어디까지나 예측이니 더 극단적인 비율로 갈수도 있고...
      확실한건 아닙니다.ㅋ

  10. addr | edit/del | reply IT를 좋아하는 학생 2013.01.17 22:49

    버텍스와 픽셀 쉐이더의 비율은 정확하지 않지만 대다수는 20-bit 픽셀 쉐이더라고 합니다. 이말이 무엇인가요?

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2013.01.18 01:13 신고

      버텍스 쉐이더와 픽셀 쉐이더 설명은 전에 했던 질문 답변 참고하시고요.
      전체 72코어 중에 몇개가 버텍스 쉐이더이고 몇개가 픽셀쉐이더인지 불확실하다는겁니다.
      하지만 대다수가 픽셀쉐이더인건 확실한거고요. (저 글 쓸때 당시 기준이고 현재는 확실히 밝혀졌지요.)

      20-bit는 픽셀쉐이더가 처리할 수 있는 데이터 타입을 말하는 것 같습니다.
      20bit 부동소수점 연산이 가능하다는 의미인듯.

    • addr | edit/del Favicon of http://blog.naver.com/mercucu1111 BlogIcon A TNT 2013.01.21 12:26

      24:48비율이라네요
      물론 이건 ALU수라서 실제로는 6:12지만요
      근데 32bit FP연산이 아닌 20bit라니
      그런건 처음보네요

  11. addr | edit/del | reply Favicon of http://californiadrivingticketsandduitickets.devhub.com/http:// BlogIcon sacramento lawyer 2013.08.23 06:32

    가격은 최근 감소했다. 이것은 여전히 좋은 제품입니다.