북미 시간 2014년 1월 5일 엔비디아는 CES2014 개막에 앞서 보도 관계자를 위한 이벤트를 개최하고 차세대 모바일 SoC인 Tegra K1을 발표했습니다.
Tegra K1은 기존에 Tegra5, 코드네임 Logan으로 알려져있던 제품입니다.


(엔비디아의 테그라 로드맵.)



이번에 발표된 내용은 G-SYNC, 차량용 테그라 솔류션, 테그라 K1 이지만, 당연히 여기서는 테그라 K1만 다룰겁니다.



테그라 K1의 라인업은 두 가지입니다.
(테그라4도 테그라4와 테그라4i의 두가지 라인업이 있었지요.)
Cortex-A15 기반과 Denver 기반.
두 칩의 핀이 호환된다는게 인상적. (하드웨어 개발하기 편합니다.)


- CPU
Cortex-A15 기반 제품부터.





Cortex-A15 r3p3 쿼드코어. (부하가 낮을 때 동작하는 1코어가 포함된 4+1 구조.)
최대 2.3GHz
L1 캐시 32KB/32KB(명령어/데이터)
메모리 대역폭 17GB/s
28nm HPM 공정.
2014년 상반기 출시 예정.

Cortex-A15의 리비전은 현재 r4까지 나와있습니다만 현존 거의 모든 제품이 r2 입니다.
엑시노스를 포함해서 말이지요. 테그라4도 r2p1이었습니다.
차기 엑시노스에서도 r3를 쓴다고 하니 리비전 차이에 따른 성능 격차는 크지 않을 것으로 보입니다.
애초에 r2라 해도 버전에 따라 r3의 변경 요소가 도입되는 경우가 있기때문에 버전만으로 성능, 소비전력 차이를 확신할 수는 없습니다.




(리비전에 따른 소비전력 감소.)

다음은 Denver 코어 기반.



Denver 기반 듀얼코어.
최대 2.5GHz
L1 캐시 128KB/64KB(명령어/데이터)
메모리 대역폭 17GB/s
28nm HPM 공정.
2014년 하반기 출시 예정.

이미지로 봐서 Cortex-A15 기반같은 추가 저전력 코어는 없는듯 합니다.





Denver 코어는 ARMv8 명령어 기반의 엔비디아 자체 아키텍처입니다.
당연한 얘기이지만 64비트 프로세서입니다.
7-way issue 구조라고 밝히고 있지만 구체적인 명령어 구성을 알 수 없습니다.
Cortex-A15가 3-way issue라고 비교하고 있는데 정수연산 관련 issue만 카운트한 것으로 보입니다.
정수연산 관련 issue 기준으로 7-way issue이면 엄청난 성능이 예상되는데 실제로 어떨지는 지켜볼 일 입니다.


- GPU
GPU는 CPU 차이에 관계없이 동일한 것으로 보입니다.



GPU는 케플러 아키텍처 기반의 192코어입니다.
케플러 아키텍처 이전에는 데스크탑용 GPU에서 FP32유닛 4개를 1코어로 보았고,
테그라2/3에서는 FP32(혹은 FP20)유닛 1개를 1코어로 보았습니다.
그래서 코어 수와 동일한 기준에서 비교할 수가 없었습니다.
하지만 케플러 아키텍처부터는 데스크탑용 GPU에서도 FP32유닛 1개를 1코어로 보기때문에 테그라 K1에서 말하는 192코어는 데스크탑용 GPU 기준에서봐도 192코어입니다.



발표 자료를 보면 연산성능이 365GFLOPS로 나옵니다.
SIGGRAPH에서 Logan의 데모가 공개됐을 때, 엔비디아는 GPU의 연산성능이 400GFLOPS에 달한다고 주장하기도 했으니 갑작스럽게 나온 이론 성능은 아닙니다.
192코어로 365GFLOPS의 연산성능이 나오려면 산술적으로 950MHz라는 클럭이 나옵니다.
사양표의 이론 텍셀 성능이 7.6 GTexel/s 인데 8TMU, 950MHz라는 사양인듯 합니다.



기존 케플러 기반 제품의 사양 중에서 이와 가장 가까운 것이 GK208입니다.
384코어, 16TMU, 8ROP
테그라 K1의 GPU 사양은 GK208의 딱 절반으로 보입니다.
192코어, 8TMU, 4ROP

950MHz는 과할 정도의 고클럭으로 보이지만 케플러 아키텍처가 기존의 아키텍처에 비해 클럭을 올리기 쉬운 구조이기때문에 불가능한 클럭은 아닙니다.
아주 좋게 생각(해석)하면 엔비디아가 밝힌 5W라는 TDP도 납득할 수 있습니다.
CPU의 소비전력을 제외한다해도 GPU의 TDP는 4W 수준일겁니다.
(최대 소비전력이라고 봐도 무방하겠지요.)

진짜라면 사양과 클럭을 생각했을 때 낮은 수준입니다.
950MHz는 SKU상의 최대 클럭정도이고 실제로는 태블릿에서나 들어갈 수 있는 클럭인듯 합니다.
그나마도 쓰로틀링으로 인한 성능 저하를 피할 수 없을거고요. (테그라4의 사례를 보면 그렇습니다.)
스마트폰에 들어가기위해서는 클럭다운이 필요할듯 하네요.



언리얼 엔진 얘기가 많이 나오더군요.
언리얼 엔진4
DX 11
OpenGL 4.4
등등 지원.



GFXBench 3.0 맨해튼에서 애플 A7 대비 2.5배의 성능을 보인다고 합니다.
GFX3.0은 아직 일반에 공개되지는 않았습니다. 주요 개발 업계에서 RC버전으로 테스트하고 있는걸로 알고 있습니다.
GFX2.5/2.7 대비 성능 저하 폭, 비율이 제품마다 천차만별이고, 아직까지 모든 제품의 최적화가 이루어진 상태가 아니기때문에 이 결과만으로 테그라K1 성능이 압도적이라고 해석할 순 없습니다.
지켜볼 부분입니다.



- 요약
- CPU

Cortex-A15 r3p3 쿼드코어. (부하가 낮을 때 동작하는 1코어가 포함된 4+1 구조.)
최대 2.3GHz
L1 캐시 32KB/32KB(명령어/데이터)
메모리 대역폭 17GB/s
28nm HPM 공정.
2014년 상반기 출시 예정.

Denver 기반 듀얼코어. (ARMv8 기반 자체 아키텍처.)
최대 2.5GHz
L1 캐시 128KB/64KB(명령어/데이터)
메모리 대역폭 17GB/s
28nm HPM 공정.
2014년 하반기 출시 예정.

- GPU
케플러기반 192코어, 8TMU, 4ROP
최대 950MHz
7.6 GTexel/s
3.8 GPixel/s
364.8 GFLOPS

구체적인 GPU 성능 예상은 이후에 해보겠습니다.


 

Posted by gamma0burst Trackback 0 : Comment 34

댓글을 달아 주세요

  1. addr | edit/del | reply 익명 2014.01.07 03:55

    gpu가 엄청나네요... 근데 막상 출시할때쯤되면 다른곳도 성능 높아지겠죠? 개인적으로 테그라2때문에 인식이 그닥...

  2. addr | edit/del | reply 흡혈귀왕 2014.01.07 04:21

    드디어 전세대 비디오게임 콘솔대비 높은 스펙의 모바일 GPU의 등장이군요

    재밌는건 이전 PS3 초기때만해도 PS3 GPU인 RSX 부동소수점연산을 300GFLOPs 대라고 뻥쳤었고
    비욘드3d나 네오가프쪽 콘솔 개발자분들이 그정도 절대아니고 178~18xGFLOPs 정도라했는데

    이번 테그라K1 발표로 192GFLOPs라고 이실직고 했네요ㅋ
    뭐 애시당초 통합쉐이더도 아니라 의미가 있겠냐만은
    당시 Cell프로세서와 조합시 1.8TFLOPs의 성능을낼꺼란 기억이 떠오르네요ㅋ
    (그리고 더 재밌는건 PS4의 GPU가 1.84TFLOPs라죠ㅋ)

    텍셀도 12Gtexel/s이 아닐텐데ㅋ
    당시에 PS3 개발관련 라이브러리 PSGL 도큐먼트
    PDF 소유하고 있었는데 7.8~8Gtexel/s 정도였던걸로 기억
    (지금 유실...ㅠㅠ)

    그나저나 감마님 제가 차기 엑시노스가 r3로 리비전될
    가능성 있을거같냐고 여쭤봤을때 아닐거같다라 하셨는데
    r3로 나올거라고 보시나요?

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2014.01.08 16:11 신고

      차기 엑시노스에서 차기가 어떤 의미냐에 따라 다르겠지요.ㅎ
      r3가 나오긴 나올걸로 봅니다.

  3. addr | edit/del | reply mnnf 2014.01.07 04:25

    감마님 역시 빠르십니다. 감사히 잘 읽었습니다.
    엔비디아의 발표는 언제나 그렇듯 흥미롭네요. 실제 나오는 제품들도 그런지는 둘쨰 치더라도....
    한 10일쯤 전? 국내에 출시된 테그라 노트7 을 한대 장만했는데, 여러가지로 속도 면에서 별 불만은 없긴 하지만 기대 만큼은 아닌 것도 같고 그렇더군요.
    폰을 좀 오래된 기종을 쓰다 보니, 간만의 현세대 칩이라는 것에 거는 기대가 좀 과했나 싶기도 합니다.

    그래도 가격도 저렴한 편이고 이래저래 만족할 정도는 되다보니, 테그라2나 3에 데인 분들과는 달리 앞으로의 테그라 신제품들에도 기대가 되네요 ㅎㅎ

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2014.01.08 16:13 신고

      문제라면 테그라K1과 경쟁할 것으로 예상되는 제품들에 비해 CPU가 약할 수 있다는겁니다.
      분명 시기상 A57이 경쟁상대가 될터인데 그걸 상대하기에 A15 쿼드와 64비트 듀얼코어는 약하지요.
      28nm 공정이기때문에 어쩔 수 없는 한계이겠지만요.

  4. addr | edit/del | reply 흡혈귀왕 2014.01.07 04:30

    일단 이론 픽셀과 텍셀성능 부동소수점연산을 보자면

    부동소수점연산은 GT635 보다 높고
    쉐이더 성능은 GT625에서 GT630(DDR3) 사이정도가 되겠군요

    픽셀은 GT625와 GT630보다 좀더 높지만
    텍셀은 GT630보단 떨어지는...

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2014.01.08 16:13 신고

      GFX 2.7 결과 나온거보니 장난 아니네요.
      물론 저게 나올 시기에 경쟁력이 있냐는 것은 두고봐야겠지만요.

  5. addr | edit/del | reply Holo 2014.01.07 11:43

    이야...그래픽 하나만큼은 인정해줘야할 거 같습니다 :)

  6. addr | edit/del | reply Favicon of https://rubp.tistory.com BlogIcon RuBisCO 2014.01.07 12:21 신고

    일단 2.7 기준으로는 아이패드의 두배를 좀 상회하는 결과가 나오더군요. 헌데 문제는 소비전력을 충족할 수 있을지가 심히 의문입니다. 리비전 만으로 소비전력을 크게 끌어내리긴 상당히 지난한 일이기도 하고, 나온 스펙대로라면 CPU와 GPU를 합쳐서 10W를 넘느냐 마느냐의 경계선상에 걸칠게 불보듯 뻔한데 모바일에서 저대로 나와줄 수는 없거나 아니면 작렬하는 쓰로틀링에 시달릴듯 해 보입니다.

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2014.01.08 16:15 신고

      소비전력이 일단 문제입니다.
      TDP 5W걸 봐서는 최대성능과 실성능의 갭이 상당할 것으로 보입니다.
      그 다음은 저게 출시될 때 경쟁력있는 성능이냐는 것.
      최대성능이 비슷하더라도 실성능에서 떨어지면 의미가 없어지기때문에 향후 나올 제품과 경쟁이 쉽지만을 않을듯 합니다.

  7. addr | edit/del | reply 플리즈 2014.01.07 14:06

    모바일 성능이 정말 저만큼이나 올라왔다니, 새삼 느껴지네요. 시대의 변화라는 게...

    테그라도 테그라지만, 인텔 에디슨이 대단하게 느껴지더군요. 물론 아직 개발단계고, 실제 적용은 조금 더 시간이 필요하겠지만 말입니다.

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2014.01.08 16:16 신고

      쿼크가 대단하긴한데 성능이 아직까지 좀 그렇지요.
      초저전력 플랫폼이라는 것만으로도 의미는 충분하겠지만요.

  8. addr | edit/del | reply 흡혈귀왕 2014.01.08 18:12

    이번 설명보니 대충 Cortex-A15 r3가 기존대비 10% 정도 성능향상이 됬다는거 같네요...(무슨기준이지?)
    그외 하드웨어 최적화를 통한 전력개선으로
    스냅드래곤800의 크레이트400 코어와 비슷한 전력효율에 쓰레드성능이 1.3GHz A7 싸이클론 코어 이상이라는데
    과연 어떨지ㅋ
    일단 현재 제조사들한테 칩 넘겼다니깐 이번엔 테그라4처럼
    늦어지진않을듯하네용

    아참 감마님 오늘 삼성 CES발표 어떻게된건가요?ㅎㄷㄷㄷㄷㄷ

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2014.01.08 22:23 신고

      근데 그 비교 그래프의 근거가 Octane 이라는거지요.
      (브라우저 벤치라니...)

      10% 성능향상은 아마 클럭당성능 얘기일겁니다.

      28nm 공정에 Cortex-A15 인데 양산이 늦어지는게 더 웃긴거지요.
      문제는 덴버버전일듯.

      CES발표가 없는데 가능성은 둘 중 하나입니다.
      아직 안 나왔거나, 계획에 없었거나.
      지금 정황은 후자쪽으로 흐르고 있고요.
      컨퍼런스 일정 찾아보니까 S.LSI 사업부가 없더라고요.
      (제가 못 찾은걸지도 모르겠지만......)
      그런데 제가 본 거기에는 작년 내용이라고 보기 힘든 발표내용이 있어서 뭔가 뭔지 헷갈리네요.

  9. addr | edit/del | reply 흡혈귀왕 2014.01.08 22:40

    방금 엑시노스 트위터에 LSI 티저 영상이 새로 올라왔네용
    아직 시작안했던걸까요?

  10. addr | edit/del | reply 흡혈귀왕 2014.01.08 23:34

    그나저나 이번 테그라K1 벤치는 제가 생각한것보다 굉장히 높게나온듯합니다;ㅎㄷㄷㄷ

    전 한 GFX2.7에서 40fps 정도 나오면 잘나온거겠지 했는데

    쉴드2가 아닌 7인치 레퍼런스 타블렛에서 60fps 라닛..ㅎㄷㄷㄷㄷㄷ
    회사에서 제가 세컨드로쓰는 GT630M 노트북이 63fps 나오는데 비슷;ㅎㄷㄷㄷㄷㄷㄷㄷ

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2014.01.09 00:30 신고

      다른 테스트 결과도 추가로 확인해봐야겠지만 현재나온 결과만 본다면...
      엔비댜가 밝힌 시기에 제대로 출시만 되면 GPU 성능에서 상당히 앞서갈 수 있을듯 합니다.

  11. addr | edit/del | reply Favicon of https://random-ad.tistory.com BlogIcon JordanK 2014.01.09 00:03 신고

    nVIDIA...이번엔 믿어도 될까요? 테구라의 오명을 씻고?

    ps. 오늘 삼성 SLSI CES 발표 때문에 살떨리는 하루 보냈네요 ㅋㅋㅋㅋㅋ

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2014.01.09 00:31 신고

      테구라 오명은 테그라3에서 이미 벗었지요.ㅋ

      p.s 너무 조용해서 순간 흔들렸음 ㅋㅋㅋㅋ

    • addr | edit/del Favicon of https://random-ad.tistory.com BlogIcon JordanK 2014.01.09 17:33 신고

      발표회때 뻥은 테그라4도 여전했죠 ㅋㅋㅋ ps2.SLSI CES 발표 언제 하는걸까요? 티저만 나오고 또 잠잠하네요...;;

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2014.01.09 17:40 신고

      엔비댜가 구라는 안 쳐요.
      문제는 교묘하게 자신들에게 유리한 자료만 쓴다는겁니다.

      테그라4 때는 변인통제도 제대로 되지않는 웹브라우징 벤치로 성능 자랑하고 이번에도 CPU 성능 비교하는데 웹브라우징 벤치썼지요.
      게다가 성능 격차 비율이 크게 보일 수 있도록 GFX벤치 2.7이 아닌 3.0을 기준으로 얘기했습니다.
      사람들이 GPU성능을 정확하게 가늠하지 못 하게 하려는 의도도 있었겠고요.

      엄밀히 말하면 거짓말은 아니지만 그렇다고 진실을 말하는 것도 아닌거지요.

    • addr | edit/del Favicon of https://rubp.tistory.com BlogIcon RuBisCO 2014.01.15 09:13 신고

      거짓말을 한 적도 있긴 합니다. 테구라2 시절에 자료에 컴파일러 옵션 장난질을 했었죠.

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2014.01.15 17:23 신고

      그런 적이 있었네요.ㅋㅋ
      코어2 듀오보다 테그라3가 좋다고 했었던가 했지요.

  12. addr | edit/del | reply ㅁㅁ 2014.01.09 00:24

    A15리비전이 얼마나 좋을지 기대중ㄷㄷ

  13. addr | edit/del | reply Favicon of https://rubp.tistory.com BlogIcon RuBisCO 2014.01.15 09:14 신고

    정보들이 슬슬 풀리는군요. 역시나 뻥이 심히 과다하긴 했습니다만 아이폰 및 패드 대비 3배는 개뻥이었지만 1.5-2배 사이군요. 상당히 근사한거 같긴 합니다. 실 사용환경에서의 쓰로틀링 부분은 아직도 정보가 나오지 않은데다 현재 나온 정보들은 아직 드라이버 안정화가 안된 상태기도 해서 함부로 예단하긴 그렇긴 한데 살짝 기대가 되는군요.

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2014.01.15 17:28 신고

      일단 현재까지보면 최소 테그라4의 2배는 되는듯 합니다.
      그 이상이 가능할 것이냐가 관건일듯.

  14. addr | edit/del | reply 아가랄세로 2014.01.16 16:07

    저정도 gpu성능이먄 차기 스냅드래곤의 adreno420이나 말리 t760보다도 높은 성능인가요???

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2014.01.16 17:45 신고

      정확한 성능이 나와봐야 알겠지만 최소한 동급으로 봅니다.
      어느정도 수준의 성능 차이는 있을 수 있겠지만요.

  15. addr | edit/del | reply BlogIcon 용산 2014.07.28 23:38

    스마트폰에 64비트 버젼이 도입 인증됬다고
    하던데 gpu는 어느정도로 클럭이 낮아질까요.
    심하게 낮아지면 메리트가 없는데 ㅠ
    800대는 갈수있을까요.

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2014.07.30 01:37 신고

      엔비디아 자료와 찌라시 내용을 봐서는 스마트폰에서는 396MHz 정도가 될듯 합니다.