http://www.chiphell.com/thread-616838-1-1.html

칩헬에서 테그라4 (코드명 웨인)의 스펙 슬라이드를 공개했습니다.
물론 무조건 신뢰할 수는 없습니다.

참고 정도.


(테그라 로드맵)
익히 알려져있듯이 코드명은 미국 DC 코믹스 히어로 이름이지요.
전작인 테그라3의 칼엘은 슈퍼맨이었고, 테그라4의 웨인은 배트맨.
가로축의 연도표시는 무시하는게 좋습니다.
엔비디아가 로드맵 못 지키는게 하루이틀 일도 아니고...



이 로드맵은 지켜질지 모르겠지만 일단 웨인은 태블릿, 슈퍼폰, 태블릿 이상의 노트북 타겟의 제품입니다.
Grey에 Tegra+Icera라고 써있는 것으로 보아 베이스밴드칩(모뎀)이 통합된 것으로 생각됩니다.
Icera는 베이스밴드칩 제조업체로 엔비디아에 인수되었지요.
스마트폰과 일부 슈퍼폰에는 쓰이는듯.
그렇다면 웨인은 모뎀까지는 통합되지 않았나봅니다.

스펙을 보겠습니다.


- CPU : 4+1 코어 Eagle
이글은 Cortex-A15 의 코드명입니다.
Cortex-A15 쿼드코어이고 테그라3 처럼 보조(컴패니언) 코어를 갖고 있습니다.
빅리틀을 사용하지 않나봅니다.

- GPU : 72코어
72코어로 성능은 테그라2의 20배, 테그라3의 6배라고 합니다.
이전에 엔비디아는 테그라3 성능이 테그라2 3배라고 했으니, 위 설명대로면 테그라4는 테그라2의 18배입니다.
20배는 뭐 그러려니 해야겠습니다. 확실한 자료도 아닌데 그 정도야.ㅋ

테그라4 GPU는 케플러 기반으로 알려져 있습니다.
산술적으로는 12코어인 테그라3의 6배 스펙이지만 그렇다고 무조건 실성능이 6배가 나오는건 아닙니다.
통합쉐이더 방식이기때문에 최종적인 그래픽 성능은 텍스처 유닛에 의해 결정됩니다.

케플러 아키텍처에서 코어와 텍스처 유닛의 비율은 12:1 입니다.
테그라2, 3에서 코어를 세는 방식은 일반적인 그래픽 카드의 GPU와는 달랐습니다.
파이프 라인 하나를 코어로 계산하지요.
일반적인 GPU는 4개의 파이프라인 묶어 하나의 코어로 합니다.
그런 식으로하면 테그라4의 코어 수는 실제 18코어인거지요.

하지만 테그라4 GPU가 케플러 기반이면 얘기가 달라집니다.
구조적으로 바뀐 탓에 이전처럼 1/4 해버릴 수가 없습니다.
케플러 기반 그래픽 카드도 이전 세대와 비교해서 갑자기 코어 수가 늘어났지요.
(GF110 480코어 -> GK104 1536코어)
일단 72개라는 저 수치를 그대로 써야겠습니다.
그에 따라 텍스처 유닛 수는 6개(=72/12)가 됩니다.
테그라3는 2개였지요.

이제 경우의 수를 따져보지요.
테그라2 GPU 클럭은 300, 333, 400MHz 가 있고, 테그라3 GPU 클럭은 416, (520), 600MHz 가 있습니다.

테그라2의 20배, 테그라3의 3배를 갖는 경우의 수.
1040MHz - 테그라2 300MHz 대비 20.8배, 테그라3 520MHz 대비 6배
1200MHz - 테그라2 400MHz 대비 18배, 테그라3 600MHz 대비 6배
1333MHz - 테그라2 400MHz 대비 20배, 테그라3 600MHz 대비 6.7배

1GHz가 넘습니다.
1.2GHz가 가장 적합해보입니다만...
그래픽 카드에서도 꺼려하는 고클럭이 적용될지 모르겠지만 계산상 그렇습니다.

클럭이 너무 높다면 연산성능 기준일지도 모르겠습니다.
테그라3 전례를 봤을 때 가능성이 낮지만요.
연산성능 기준이면 667~889MHz 입니다.
테그라2 20배, 테그라3 6배에 정확하게 일치하지 않습니다.
그래도 1GHz 보다는 현실성있네요.



- 메모리 : 듀얼채널
드디어 싱글채널에서 벗어났습니다.
DDR3L, LPDDR3, LPDDR2 지원.
DDR3L은 태블릿 이상에 적용되고, LPDDR3는 스마트폰에 적용됩니다.
크롬북을 비롯한 태블릿과 그 이상의 제품의 소비전력이 높은건 DDR3L 채용때문입니다.
LPDDR3 에 비해 소비전력이 크게 높습니다.
AP를 포함한 전체 소비전력에 영향을 끼칠정도로 말이지요.

- 비디오 : 1440p 지원
2560 x 1440 재생 지원합니다.
테그라3 부터 동영상 문제는 거의 해결되었고 저정도 사양이 동영상때문에 속썩이면 문제가 있는거지요.

- 디스플레이
2560 x 1600 지원.
1080p 120Hz 는 3D 지원용이겠지요.
4K x 2K (4096 x 2160) 지원.
DSI 8 레인 - 1920 x 1080 60fps 지원에 4레인이 필요하니까 위에서 말한 사양을 지원하려면 8레인은 필요합니다.

- 소비전력

(1) 28nm HPL 공정
TSMC로 생각됩니다.
TSMC의 설명으로는 HP 공정과 비슷한 성능(클럭)에 HP, LP 공정보다 낮은 누설전류(50% 이하)를 갖는다고 합니다.
테그라3에서 40nm HP, LP 공정을 둘 다 썼으니 HPL이 좋은 선택이긴합니다.

(2) 5th Battery Saver core
컴패니언(Companion) 코어대신 이런 이름을 쓰려나 봅니다.
원리는 빅리틀하고 다르지요.
빅리틀을 왜 사용하지 않는지 모르겠지만 서버 시장을 노리는 것일지도 모르겠습니다.
그럴거면 Cortex-A7 코어 4개가 추가로 있는 것보다는 Cortex-A15 코어 1개가 더 있는게 낫지요.

(3) PRISM
픽셀, 프레임, 장면별로 디스플레이 패널의 백라이트를 조절하여 소비전력을 줄이고, 백라이트를 줄였을 때 색을 보정해서 기본 영상과 비슷한 색을 보여주는 기술입니다.
테그라3에도 적용된 기술인데 효과가 있을지 모르겠네요.

- 이미징 : 350Mpixel/s 이상
사양만 보면 2560 x 1600 (1600p) 60fps 이상도 가능하겠네요.
인코더, 디코더 사양 봤을 때 2560 x 1440 (1440p) 60fps 가 최대 지원일듯.

1920 x 1080 (1080p) 120fps 도 가능.

- 슬라이드의 신뢰도가 확실하지 않기때문에 실제 제품과 다를 수 있습니다.



Posted by gamma0burst Trackback 0 : Comment 19

댓글을 달아 주세요

  1. addr | edit/del | reply 흡혈귀왕 2012.12.22 04:39

    오~ 드디어 포스팅해주셨군요~
    실질적인 성능도 성능이지만 엔진과의 궁합도 기대중입니다.
    테그라2나 3도 본질적 성능은 낮았지만 엔진과 궁합이 아주좋아서...
    특히 유니티3d엔진 4.0부터는 아예 테그라3 GPU에 대한 프로파일링도 지원되거든요~

    GT610~GT620 사이 급의 그래픽 성능만되도 크게
    선빵하지않을까 생각되네요....
    크라이텍이나 에픽에서 현재 모바일용 크라이엔진3.0과 언리얼엔진4.0도 준비중이고....

    전부터 엔비디아가 모바일용 차세대 언리얼엔진4.0을
    위해 퀄콤과더불어 에픽과 접촉했다고했죠....

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2012.12.22 18:37 신고

      GT610~620 수준은 안 될 것을 봅니다.
      pixel fillrate, texel fillrate 둘 다 떨어져서요.

      유니티 엔진 얘기 많이하시던데 혹시 넥슨 근무하세요?
      유니티 엔진 사용한 게임 상용화한건 넥슨 밖에 없어서요.
      삼국지를 품다. 던가...

  2. addr | edit/del | reply 흡혈귀왕 2012.12.22 19:01

    ㅎㅎㅎ 넥슨 아니고 현재 취업준비중이고 포트폴리오로
    유니티게임 만들고 있습니다 ㅋ

    감마님은 어느정도 스펙 되실거라보시나요?
    전 대충 픽셀성능 4.5Gpix/s에 버텍스 500Mtri/s에
    부동소수점연산 100GFLOPs정도만 되도 정말 좋을듯합니다.

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2012.12.22 20:56 신고

      얘기들어보니까 유니티엔진쓰기 힘들다고하던데 개발할만한가요?
      그래서 다른 업체들도 넥슨이 유니티엔진쓰고 있는거 주목하고있다고하는데, 정작 넥슨은 이제 좀 뭐가뭔지 알 것 같다는 분위기라고 하고.

      스펙은 클럭을 알아야 예상할 수 있는데 본문에서 말한 스펙대로면 6 Gtexel/s 정도되겠지요.
      (통합쉐이더오면서 텍셀, 픽셀 성능으로 따지는듯.)
      케플러기반 그래픽카드의 실제 텍셀 성능이 이론 성능의 75~80% 정도인데, 테그라2는 50~55% 였습니다.
      효율까지 고려하면 테그라4는 최대 3.5 Gtexel/s 정도겠네요.
      (아이패드4 가 2.1 Gtexel/s 였습니다.)

      부동소수점 연산은 클럭에 따라 다르겠지만 800~1200MHz 라면
      115~137 GFLOPS 정도.

  3. addr | edit/del | reply 흡혈귀왕 2012.12.22 21:26

    유니티 엔진은 뭐랄까...다루기 굉장히 쉽습니다.
    툴자체도 굉장히 잘되어있고 범용언어인 C#과 자바스크립트라서 쉽게 배울수있구요~
    저의 경우 사실 하드코딩을 잘 못하거든요^^;;
    C/C++강의 시간때는 어떻게든 배워서 점수를 따긴했지만 그래서 눈을 돌린게
    3D모델링과 유니티인데 물건이더군요~ 게임내 오브젝트와 매쉬데이터 관리하기도 쉽구요~
    게임내 스크립트도 그렇게 많이 작성 안하거든요......

    무엇보다 게임개발기간및 제작비도 확줄고 크로스플랫폼 만들기 좋고
    마우스 클릭한번으로 PC(윈도, 맥 리눅스), 웹, 플래시, iOS, 안드로이드 할거없이 다 빌드되거든요...
    PS3, XBOX360, Wii도 지원되고 조만간 마이너업데이트로 WiiU도 지원될거랍니다.

    안드로이드 빌드 세팅에선 각 AP에 맞게
    DXT(Tegra)
    PVRTC(PowerVR)
    ATC(Adreno)
    ETC2 or RGBA16(Mali, OpenGL ES2.0)
    등등 따로 설정해서 그 해당 AP의 GPU에 맞게
    빌드해줄수도있음

    넥슨말고도 유니티쓰는 업체 꽤 있습니다~
    삼국지를 품다말고도 한게임의 피쉬아일랜드도 유니티엔진 기반이거든요~
    게임잡에서도 한참 채용공고있구요 4.0부터 다이렉트X11 렌더링과 테셀레이션 지원으로
    퀄리티떨어진다는것도 옛말이고 모바일에서 쉘프섀도우지원등 점점 좋아지고있습니다.
    프로그래밍 잘못하는 사람도 접근하기 쉽습니다~ 어렵지않아요~

    모바일 3D 게임 만들기에는 감히 언리얼엔진보다 우월하다
    말할수있습니다~^^ㅋ

    일단 가격차가 넘사벽이라~
    나머지 엔진은 억대하는데 유니티는 6백정도면
    Pro버전과 콘솔부분제외한 모든 라이센스 구입가능

    암튼 대충 아이패드4의 SGX554MP4보다 좋을거라고 보시는군요~
    그정도만되도 뭐~ㅎㄷㄷㄷㄷ
    아드레노320도 사실 최적화잘하면 유니티3.5엔진에서 콘솔급에 버금가는 게임
    만들수있을거같던데요ㅎㄷㄷㄷㄷㄷㄷㄷㄷㄷㄷ

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2012.12.22 21:34 신고

      그럼 문제라는게 크로스플랫폼 연동쪽 얘기인가보네요.
      타 업체에서 주목하는 것도 그것때문인 것 같고요.

      아무래도 Adreno가 콘솔, 데스크탑 GPU에 가장 가까운 형태니까요.

  4. addr | edit/del | reply 흡혈귀왕 2012.12.22 21:38

    현재 잘나가는 쉐도우건 데드트리거, 블레이드슬링거등등 모두 유니티기반 게임인데
    차세대 테그라4나 PowerVR6 G6200으로 만들어진 유니티기반 게임들이
    얼마나 퀄리티가 향상될지 기대중입니다.

    아참! 현재 국내게임회사에서 엔비디아와 협력해서 테그라4전용 MORPG만들고 있거든요....
    테그라존 선출시후 iOS로 출시한다고했는데.....

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2012.12.22 22:22 신고

      테그라가 태블릿말고 스마트폰에도 쓰여야될텐 전작들 전례봐서는 참 어렵겠네요.
      커널 지원 잘 안 해서 펌업하기도 힘들고.

  5. addr | edit/del | reply 파라오 2012.12.22 21:58

    4+1코어에서 보조코어가 A7 아닐까요? 그리고 변형된 빅리틀구조로 보입니다

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2012.12.22 22:17 신고

      4-Plus-1 이라는 표현이 엔비디아가 공식적으로 사용하는 것인데 그런 의미가 아닙니다.
      빅리틀은 이종결합을 의미하는거고요.
      동일 아키텍처 간의 태스크 전환은 빅리틀이라고 안 합니다.

    • addr | edit/del 파라오 2012.12.23 02:19

      보조코어가 A15라는 근거가 있나요?

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2012.12.23 03:48 신고

      리플에 말씀드린 내용이 근거입니다.
      1. 테그라3에서 4-Plus-1 이 무슨 의미로 사용되었는지.
      2. 소비전력 절감이라는 빅리틀의 목적을 고려했을 때, 리틀코어가 1개인건 빅리틀을 제대로 활용하겠다는 의도가 전혀없는 코어 구성.

      그런데 어차피 저 슬라이드 자체를 반신반의하기때문에 그렇게 깊게 따질 이유가 없음.

  6. addr | edit/del | reply Favicon of http://m.blog.naver.com/mercucu1111 BlogIcon A TNT 2012.12.23 02:19

    연산성능 기준 6배면 테그라3이 200mhz기준 4.8GFLOPS니깐 500mhz정도면 12GFLOPS, 6배면 72GFLOPS니깐 연산성능 기준이면 667mhz가 아니라 500mhz정도 될거같은데요

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2012.12.23 03:53 신고

      저는 테그라3 최대 600MHz 라고 보는데, 아난드텍이 말하는 520MHz로 계산해보지요.
      그러면 스펙이 딱 6배니까 520Mz(동클럭) 나옵니다.
      그런데 조건이 테그라3 6배만 있는건 아니지요.
      테그라2 20배를 맞추면 또 달라집니다.

      테그라2가 8코어 400MHz(최대 클럭) 에서 6.4 GFLOPS
      최하인 300MHz 에서는 4.8 GFLOPS
      20배면 각각 96, 128 GFLOPS
      72코어에서 128 GFLOPS 나오려면 889MHZ 입니다.
      96 GFLOPS 나오려면 667MHz 이고요.

    • addr | edit/del Favicon of http://blog.naver.com/mercucu1111 BlogIcon A TNT 2012.12.23 09:01

      테그라2 대비 20배인 상황을 생각 못햇네요

  7. addr | edit/del | reply 맹자도 2012.12.26 18:20

    테그라 뻥카는 하루 이틀일이 아니라 이런 자료 나오면 무조건 낮춰놓고 생각해야 할 지경.. 이번엔 어떠려나요.

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2012.12.26 19:00 신고

      저대로 된다는 보장도 없으니 단정짓기는 이르지요.
      가능성이라는게 다 그렇지요.
      긍정도 아니고 부정도 아니고.

  8. addr | edit/del | reply ㅇㅇㅇ 2013.01.07 16:44

    오늘 공개됬는데, 유출 그대로네요 허허

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2013.01.07 18:39 신고

      추가 정보들도 약간이나마 나오고 있네요.
      제대로 된 성능 자료가 나올때까지 일단 지켜봐야겠지만요.