- 컴퓨텍스 2018에서 7nm 베가(베가20으로 알려져 있지요.)가 발표됐습니다.

구체적인건 안 나왔지만 다이 이미지로 이거저거 해보겠습니다.

본문에서는 베가20으로 통칭하겠습니다.

 

(https://www.theverge.com/2018/6/6/17433102/amd-7nm-radeon-vega-gpu-computex-2018)

현재 인터넷상에서 구할 수 있는 가장 고해상도 베가 다이 이미지일겁니다.

 

 

- 생산

(왼쪽 : 베가20, 오른쪽 : 베가10)

패키지 마킹을 보면 왼쪽 위 N6U222.17(?), 중앙 상단 불명, 중앙 하단 N8H410.00(?)

GF 14LPP 공정 생산이었던 베가10과 차이가 있습니다.

왼쪽 위 항목은 S로 시작하고 중앙 하단 항목은 M으로 시작.

오른쪽 아래에는 215로 시작합니다. (216은 삼성 생산으로 추측됩니다.)

 

TSMC 생산인 엔비디아 다이에서 N으로 시작하는 코드가 있기도 했고요.

(GPU생산 웨이퍼 혹은 패키징 단계의 LOT ID로 추측됩니다.)

(링크 : 삼성의 GPU 생산에 대하여. (GP107 외))

 

종합하면 나오는 얘기대로 TSMC 7nm 생산이 맞는듯 합니다.

(made in taiwan은 GPU 생산 위치를 판단하는 근거가 되기 힘듭니다.)

 

(베가10)

 

 

- 다이사이즈

위에서 이미지는 같은 사이즈로 붙여놨지만 정확히는 알 수 없습니다.

다만 videocardz.com에서는 베가10과 베가20의 패키지 사이즈가 거의 같고 거기서 역산했을 때 베가20 다이사이즈를 285~298mm2 정도로 추측했습니다

이건 EPYC 패키지를 통해 역산한건데 정확도가 의심되는건 어쩔 수 없지만 그렇다고 딱히 패키지 전체 크기가 베가10과 다를 이유도 없기때문에 판단하기 어려울거 같습니다.

 

기존에 알려진 베가10의 다이사이즈(19 x 25.6 = 486mm2), 패키지 사이즈(47.5 x 47.5), HBM 사이즈와 이미지로 계산해보면 315~330mm2로 나옵니다.

 

 

- 사양?

중간값으로 해보면 베가10 대비 67% 수준의 면적입니다.

GF/삼성의 14LPP와 TSMC의 7FF 공정을 직접 비교할 팩터는 없으나 간접적으로 잡아도 40% 내외 수준으로 감소합니다.

그렇다면 사양이 증가했다고 봐야하는 것인가.

 

최근 나오는 루머로 보면 베가10과 같은 4096SP(64NCU) 입니다.

물론 메모리 대역폭이 2배로 늘었으니 메모리 인터페이스 영역이 증가했겠으나 그게 저만한 차이를 만들기는 어려울겁니다.

여기서 참고할만한게 과거 유출 슬라이드인데,

 

베가20 내용이 이제와서 보면 많이 맞습니다.

베가10과 같은 아키텍처(GFX9) 기반, 시기, 7nm, 32GB 메모리, 메모리 대역폭이 베가10의 2배.

저 슬라이드를 믿는다면 베가20의 FP64 성능은 베가10에 비해 크게 올랐습니다.

베가10의 FP64성은 FP32 성능의 1/16 인데 베가20은 FP32 성능의 1/2입니다.

이게 가능하려면 DP(Double Precision) 유닛을 8배 확충했다는 의미이고 다이사이즈를 늘린 주원인으로 잡기 적당합니다.

 

 

- 왜 사양 증가가 없는가?

315~330mm2 정도 면적을 갖는 제품들을 찾아보면 GK104, GP104가 있었습니다.

플래그십이 아니었지요.

(율과 성능의 균형점에 위치한 면적으로 보입니다.)

7nm라는 최신 공정을 적용했으면 사양을 2배로 늘리는 식의 변화를 사람들은 원했을텐데 다이사이즈를 줄이는 방향을 선택했습니다.

왜 일까요.

 

주원인은 원가일겁니다.

 

먼저 최신 공정 적용 제품이라는 점입니다.

TSMC 7nm 제품이 공개된건 처음인데 심지어 실물 데모까지 시연했습니다.

동작 가능한 물량, 최소 샘플정도는 확보되어있다는겁니다.

그만큼 최신 공정이라는 얘기인데 수율 안정화가 되지 않았겠지요.

GV100처럼 대놓고 비싸게 팔겠다는 입장을 취하지 않는 이상 무한정 다이사이즈를 키울 수 없습니다.

그래서 플래그십이 아닌 하이엔드급 다이사이즈를 취했다고 봐야 합니다.

 

그 다음은 이 제품이 HBM, 인터포저 적용 제품이기때문입니다.

인터포저에 대한 자세한 내용은 찾아보시면 좋은 기사들이 많습니다.

여기서는 간단히 GPU 다이, HBM이 올라가는 하부 구조판 정도로 이해하면 됩니다.

인터포저도 반도체와 유사한 제조 공정을 거치고 그로 인해 한 개의 사이즈가 제한됩니다.

1개 샷의 마스크 사이즈 한계로 최대 858mm2, 더 넓히려면 2개 마스크를 겹쳐서 1600mm2 정도로 제한됩니다.

(링크 : https://pc.watch.impress.co.jp/docs/column/kaigai/1064109.html)

이 1600mm2을 이용한게 GV100 이었습니다.

 

원가 측면에서 당연히 1개로 끝내는게 낫겠지요.

베가10 인터포저는 800mm2, (앞서 이미지로 계산한게 맞다면) 베가20 인터포저는 857mm2 입니다.

베가20은 현 인터포저 면적 한계치를 최대로 활용한 구조인겁니다.

여기서 GPU 다이를 늘리려면? HBM 개수를 줄여야됩니다.

더 큰 인터포저를 쓴다? 일반 소비자용과 관계없는 사양과 가격의 제품이 됩니다.

AMD에서 왜 그렇게 선택하지 않았을까? 볼타에 대한 베가의 경쟁력을 생각하면 답이 나옵니다. 베가는 파스칼조차 뛰어넘지 못한 아키텍처입니다.

 

(추측이 맞다면) FP64 성능을 최대로 끌어올렸고 거기에 집중했으며 이를 지원하기위해 메모리 사양도 맞췄습니다.

하지만 끌어올린 사양을 보면 이건 게이밍을 위한 노력이 아니지요.

발표 내용도 딥러닝, 서버, 워크스테이션, 렌더링 솔루션 등 게이밍과 거리가 있고요.

(인텔 카비레이크-G에 들어갔던 것처럼 ROP를 강화하는 방향이라면 게이밍 강화도 있겠습니다만.)

구성만 보면 게이밍용의 베가10, 연산용의 베가20 으로 용도에 따라 라인업이 분리된 느낌이 있습니다.

마치 엔비디아가 하는 것 처럼요.

이게 일시적인 선택인지, 라인업 전개 방향 선회인지 두고봐야겠지요.

 

 

 

 

Posted by gamma0burst Trackback 0 : Comment 15

댓글을 달아 주세요

  1. addr | edit/del | reply 2018.06.11 17:45

    비밀댓글입니다

  2. addr | edit/del | reply BlogIcon kiu 2018.06.16 02:00 신고

    같은 32CU + 32ROP 체급인 GCN3(Tonga)와 GCN1(Tahiti)의 다이 면적 차이가 3~4%였고 (각각 366㎟, 352㎟)
    28nm에서 14nm로 건너뛴 GCN4가 GCN3와 50% 이상의 면적 차이를 보여준 것 같은데
    같은 64CU + 64ROP 체급인 Vega 10이랑 GCN3(Fiji)의 면적 차이가 겨우 20% 내외인걸 보면 (각각 486㎟, 596㎟)
    Vega 10이 이것저것 우겨넣다보니 14nm임에도 면적이 커져버린 GPU인 것 같아요
    만약 64CU + 64ROP 체급에 GCN4 기반 GPU였다면
    486㎟보다 더 작은 면적인 390㎟ 내외였을지도 모르겠군요
    아 그래도 314㎟인 GP104보다 더 큰 면적이네요..ㅜㅜ

    • addr | edit/del A TNT 2018.06.19 19:56 신고

      클럭 올리려고 파이프라인도 더 파고 FP16같은 연산유닛들도 증설했으니 어쩔수 없죠. 말하신대로 Vega 10을 300mm^2대로 내놓았으면 클럭은 잘해야 1300mhz를 못넘을것이고 플래그쉽이라는게 1070도 못넘는 기현상이 일어났을 겁니다.

    • addr | edit/del Favicon of http://rubp.tistory.com BlogIcon RuBisCO 2018.06.20 15:25 신고

      사소한(?) 문제라면 28nm 세대 GCN을 그냥 스케일을 펌핑해서 다이쉬링크 하는 쪽이 차라리 성능은 조금 낮아지더라도 전력효율이나 다이면적 측면에서 훨씬 나았을거란겁니다. GCN4세대도 별로 효율적이질 못했는데, 그보다도 더 결과가 심각합니다. 연산용 라인업을 세운답시고 그래픽카드에 백화점을 차려놨는데 그렇다고 그쪽 시장에서 잘나가는 것도 전혀 아니니 이건 차라리 그냥 전세대를 재탕해서 다이쉬링크 한것만 못합니다.

  3. addr | edit/del | reply Favicon of http://rubp.tistory.com BlogIcon RuBisCO 2018.06.20 15:26 신고

    칩 하나로 여러시장을 전부 커버하겠다고 칩에다가 백화점을 차리는게 근본문제인데 이래서야 문제가 해결이 안나죠. 라인을 아주 완전히 갈라서 분리해야 하는데 그게 안되고 있으니 ㅡ0ㅡ

    • addr | edit/del kiu 2018.06.21 04:00 신고

      A TNT님께 댓글을 남길 수 없어서 RuBisCO님 댓글에 남길 겸 같이 댓글로 남깁니다.

      A TNT/ 파이프라인을 더 깊게 설계하려면 다이 면적을 더 확보해야 하는 구조인가요?

      RuBisCO/ 만약 Vega같은 백화점 설계 사상에서 더 나아간다면
      INT8 전용 유닛, FP16 전용 유닛, FP32 전용 유닛, FP64 전용 유닛, SF 전용 유닛, LD/ST 유닛 등을
      모두 다 때려박는 기행이 있을지도 모르지만 (FP16, 32, 64 성능 비율을 4:2:1로, ROP까지 다 받쳐줄 경우)
      저렇게 다 때려박다간 다이 면적, 난이도, 전력 소모, 발열, 가격... 해서 총체적 난국이 되기 쉬운 구조겠네요
      아님 FP32를 이용해서 FP16을 RPM으로 2배 뻥튀기 하면서
      GF100처럼 FP64를 FP32의 1/2 수준으로 끌어올리는 방식을 채택하는 대신
      FP16, FP32, FP64 동시 연산 수행을 포기하는 것으로 절충하는게 나은 구조인지 모르겠습니다

    • addr | edit/del Favicon of http://rubp.tistory.com BlogIcon RuBisCO 2018.06.21 09:15 신고

      파이프라인 뎁스를 깊게 팔수록 이 명령들을 추적하고 스테이지와 스테이지 사이를 연결하는데 소요되는 자원이 커집니다.
      그리고 말씀하신대로 하게되면 벡터유닛 하나가 4:2:1로 명령을 분할할 수 있어야 하는데 그렇게 되면 복잡도(투입되는 게이트 수와 소비전력)이 하늘로 치솟습니다. 그렇게 되면 게임성능도, 특정 부문의 연산성능도 못잡고 그냥저냥 전반적으로 올라운드로 무난하기만 한 어정쩡한 물건이 나오겠죠.

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2018.06.21 19:00 신고

      어차피 올라운드는 어렵다는걸 엔비디아, AMD 모두 보여줬고
      이번에 나오는게 베가 기반에서 연산쪽으로 방향을 틀었다면 같은 아키텍처 기반 내에서 게이밍-연산 으로 라인업 구분을 시작하는 계기로 생각해볼 수 있겠지요.
      그러면 차기 아키텍처도 나비라고만 나와있지만 하위로 2개 라인업이 있을 수 있고요.
      만약 그렇게 간다면 연산용 아키텍처가 한 세대 느릴거고요.
      (게이밍용 나비가 먼저 나오고 연산용 나비가 나오기 전까지 연산용 베가가 그 자리를 커버하는 식으로.
      어차피 게이밍용칩은 FP64 성능을 까내고 나올거니...)
      AMD가 엔비디아처럼 빅칩에 거대 인터포저 방식을 선택하지 않는 이상 그렇게 할 수 밖에 없는 상태입니다.

  4. addr | edit/del | reply BlogIcon kiu 2018.06.22 06:00 신고

    RuBisCO / 덕분에 궁금증이 하나 풀렸습니다
    역시 올라운드형 GPU는 자금력이 넘쳐나도
    엄청난 복잡도로 인해 개발하기 매우 어려운 녀석이었군요..

    gamma0burst / Navi가 Vega가 아닌 GCN4 후속이 맞다면
    Vega의 특성을 모두 계승하는게 아닌
    Vega의 일부 장점(Draw Stream Binning Rasterizer, Primitive Shader, D3D Feature Level 12_1)이 반영된
    GCN4 강화판일 가능성이 있다고 생각해도 될까요?

    그러고보니 Navi 아키텍처와 소니에 관련된 소식을 보고 나서 생각난 것입니다만
    만약 Navi 아키텍처의 첫번째 주자가 라데온이 아닌 PS5일 경우
    PS5가 빨라도 2020년일 가능성이 있으니 그 이전까지
    7nm 공정 미세화 + 클럭 상향 + VP9와 AV1 H/W 디코딩 지원 + SP, TMU 체급 키운
    Polaris 30/31/32같은 식으로 땜빵할지도 모른다는
    말도 안 되는 생각까지 하게 되네요..

    • addr | edit/del A TNT 2018.06.22 18:55 신고

      말씀하신대로 Navi가 GCN4의 특성을 그대로 계승해서 기존 Polaris에서 CU를 48~56개로 늘리고 ROP 수는 전통적인 AMD 메인스트림 제품처럼 그대로 32개를 유지한다고 가정하면 7nm 공정의 스피드게인상 1700Mhz 안밖의 클럭을 내고 1080을 약간 상회하는 급으로 나오긴 할겁니다.

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2018.06.22 23:05 신고

      kiu//
      나비의 아키텍처 컨셉을 알 수 없지만 플스에 먼저 들어가기지는 않을거 같네요.
      GPU, APU 중에서 GPU가 먼저 나오는게 당연할테니까요.
      그렇다고 순전히 콘솔을 위해 폴라리스 확장판같이 리테일에 내놓지도 않을 물건을 만들거 같지도 않으니 콘솔 일정이나 성능은 순전히 나비에 달려다고 봐야겠지요.

      콘솔 중심으로 얘기해보면
      폴라리스가 16년 6월에 출시되고 폴라리스 기반 플4프로가 16년 11월에 나왔지요.
      (폴라리스10하고 CU수 같음.)
      CU가 늘어난 엑박 원X는 1년 후인 17년 11월 출시.

      폴라시스 개발과 플4프로 개발이 거의 동시에 이루어졌다고 보고, 거기서 커스텀이 추가되면 시간이 더 걸린다고 보면 될듯한데...

      로드맵과 베가 발표를 맞춰보면 7nm 나비는 19년 6월 발표로 예상되네요.
      현재로는 베가가 게이밍용으로 폴라리스보다 낫다고 보기는 어려우니 콘솔에 들어가 가능성은 낮아보이고,
      들어가려면 나비를 기대해야하는데 게이밍용, 연산용 중 어느 쪽이 먼저 나오느내냐, 플스에 커스텀 사양이 들어가느냐에 따라 플스 출시시기가 맞춰질거 같네요.

      나비가 연산용이 먼저 나오면 1년 밀릴거고 커스텀 사양이면 1년~1.5년이 더 밀릴거고요.
      정리해보면 플스는 빠르면 19년 11월, 늦으면 22년 11월이 되겠네요. (콘솔은 보통 11월 출시이니.)
      돌아가는 상황으로 봐서는 그래도 게이밍용이 먼저 나올 것 같고, 엑박이 커스텀으로 확장된 사양을 내놓기 시작해서 커스텀이 빠지지도 않을 것 같으니 차기 플스 출시는 21년 11월 정도가 가능성이 높지 않을까 싶네요.

  5. addr | edit/del | reply kiu 2018.06.22 23:54 신고

    A TNT / A TNT님 말씀대로라면 Navi야말로 진정한 GCN5가 되겠군요
    명령어 집합 구조만 GCN을 이용할 뿐인 Vega는 그냥 Vega..

    gamma0burst / 그 소식 보기 전까진 저도 리테일용 GPU를 먼저 내놓고
    콘솔용 GPU를 적용하는걸로 예상하고 있었는데
    Navi 아키텍처와 소니 관련 소식 보고 반대의 사례가 나올려는건가 했지만
    저의 괜한 생각이었나보네요

    2020년 PS5 투입이라는 동일한 가정 하에서 리테일용 GPU 먼저 투입이 맞다면
    Navi 아키텍처는 2019년이 딱 맞는 타이밍이겠군요
    그럼 GCN4 7nm 공정 미세화판이라는 차악의 시나리오는 가능성이 낮다고 봐야겠네요
    (최악은 RX 500 시리즈에 사용된 GCN4 14nm LPP판 재탕...)
    Navi가 게이밍용을 먼저 내놓는다는 전제로 말이죠

  6. addr | edit/del | reply ㅇㅅㅇ 2018.06.23 01:27 신고

    나비가 멀었기 때문에
    ps4 처럼 폴라리스 + 일부 베가 기술 채용처럼
    베가 + 일부 나비 기술 채용해서
    2020년쯤 나와 줄듯....

    • addr | edit/del A TNT 2018.06.23 12:10 신고

      Vega나 Fiji같은 물건들은 기존 GCN 기반으로 나온 물건들이랑 비교해봤을때 내부유닛 수에 비해 게이밍 효율이 아무래도 약간 부실한 측면이 있어서 PS5 내에 Vega 기반의 GPU가 들어가는건 힘들죠.