AMD 7nm 베가 발표,분석. (VEGA20 ?)

- 컴퓨텍스 2018에서 7nm 베가(베가20으로 알려져 있지요.)가 발표됐습니다.

구체적인건 안 나왔지만 다이 이미지로 이거저거 해보겠습니다.

본문에서는 베가20으로 통칭하겠습니다.

(https://www.theverge.com/2018/6/6/17433102/amd-7nm-radeon-vega-gpu-computex-2018)

현재 인터넷상에서 구할 수 있는 가장 고해상도 베가 다이 이미지일겁니다.

- 생산

(왼쪽 : 베가20, 오른쪽 : 베가10)

패키지 마킹을 보면 왼쪽 위 N6U222.17(?), 중앙 상단 불명, 중앙 하단 N8H410.00(?)

GF 14LPP 공정 생산이었던 베가10과 차이가 있습니다.

왼쪽 위 항목은 S로 시작하고 중앙 하단 항목은 M으로 시작.

오른쪽 아래에는 215로 시작합니다. (216은 삼성 생산으로 추측됩니다.)

TSMC 생산인 엔비디아 다이에서 N으로 시작하는 코드가 있기도 했고요.

(GPU생산 웨이퍼 혹은 패키징 단계의 LOT ID로 추측됩니다.)

(링크 : 삼성의 GPU 생산에 대하여. (GP107 외))

종합하면 나오는 얘기대로 TSMC 7nm 생산이 맞는듯 합니다.

(made in taiwan은 GPU 생산 위치를 판단하는 근거가 되기 힘듭니다.)

(베가10)

- 다이사이즈

위에서 이미지는 같은 사이즈로 붙여놨지만 정확히는 알 수 없습니다.

다만 videocardz.com에서는 베가10과 베가20의 패키지 사이즈가 거의 같고 거기서 역산했을 때 베가20 다이사이즈를 285~298mm2 정도로 추측했습니다

이건 EPYC 패키지를 통해 역산한건데 정확도가 의심되는건 어쩔 수 없지만 그렇다고 딱히 패키지 전체 크기가 베가10과 다를 이유도 없기때문에 판단하기 어려울거 같습니다.

기존에 알려진 베가10의 다이사이즈(19 x 25.6 = 486mm2), 패키지 사이즈(47.5 x 47.5), HBM 사이즈와 이미지로 계산해보면 315~330mm2로 나옵니다.

- 사양?

중간값으로 해보면 베가10 대비 67% 수준의 면적입니다.

GF/삼성의 14LPP와 TSMC의 7FF 공정을 직접 비교할 팩터는 없으나 간접적으로 잡아도 40% 내외 수준으로 감소합니다.

그렇다면 사양이 증가했다고 봐야하는 것인가.

최근 나오는 루머로 보면 베가10과 같은 4096SP(64NCU) 입니다.

물론 메모리 대역폭이 2배로 늘었으니 메모리 인터페이스 영역이 증가했겠으나 그게 저만한 차이를 만들기는 어려울겁니다.

여기서 참고할만한게 과거 유출 슬라이드인데,

베가20 내용이 이제와서 보면 많이 맞습니다.

베가10과 같은 아키텍처(GFX9) 기반, 시기, 7nm, 32GB 메모리, 메모리 대역폭이 베가10의 2배.

저 슬라이드를 믿는다면 베가20의 FP64 성능은 베가10에 비해 크게 올랐습니다.

베가10의 FP64성은 FP32 성능의 1/16 인데 베가20은 FP32 성능의 1/2입니다.

이게 가능하려면 DP(Double Precision) 유닛을 8배 확충했다는 의미이고 다이사이즈를 늘린 주원인으로 잡기 적당합니다.

- 왜 사양 증가가 없는가?

315~330mm2 정도 면적을 갖는 제품들을 찾아보면 GK104, GP104가 있었습니다.

플래그십이 아니었지요.

(수율과 성능의 균형점에 위치한 면적으로 보입니다.)

7nm라는 최신 공정을 적용했으면 사양을 2배로 늘리는 식의 변화를 사람들은 원했을텐데 다이사이즈를 줄이는 방향을 선택했습니다.

왜 일까요.

주원인은 원가일겁니다.

먼저 최신 공정 적용 제품이라는 점입니다.

TSMC 7nm 제품이 공개된건 처음인데 심지어 실물 데모까지 시연했습니다.

동작 가능한 물량, 최소 샘플정도는 확보되어있다는겁니다.

그만큼 최신 공정이라는 얘기인데 수율 안정화가 되지 않았겠지요.

GV100처럼 대놓고 비싸게 팔겠다는 입장을 취하지 않는 이상 무한정 다이사이즈를 키울 수 없습니다.

그래서 플래그십이 아닌 하이엔드급 다이사이즈를 취했다고 봐야 합니다.

그 다음은 이 제품이 HBM, 인터포저 적용 제품이기때문입니다.

인터포저에 대한 자세한 내용은 찾아보시면 좋은 기사들이 많습니다.

여기서는 간단히 GPU 다이, HBM이 올라가는 하부 구조판 정도로 이해하면 됩니다.

인터포저도 반도체와 유사한 제조 공정을 거치고 그로 인해 한 개의 사이즈가 제한됩니다.

1개 샷의 마스크 사이즈 한계로 최대 858mm2, 더 넓히려면 2개 마스크를 겹쳐서 1600mm2 정도로 제한됩니다.

(링크 : https://pc.watch.impress.co.jp/docs/column/kaigai/1064109.html)

이 1600mm2을 이용한게 GV100 이었습니다.

원가 측면에서 당연히 1개로 끝내는게 낫겠지요.

베가10 인터포저는 800mm2, (앞서 이미지로 계산한게 맞다면) 베가20 인터포저는 857mm2 입니다.

베가20은 현 인터포저 면적 한계치를 최대로 활용한 구조인겁니다.

여기서 GPU 다이를 늘리려면? HBM 개수를 줄여야됩니다.

더 큰 인터포저를 쓴다? 일반 소비자용과 관계없는 사양과 가격의 제품이 됩니다.

AMD에서 왜 그렇게 선택하지 않았을까? 볼타에 대한 베가의 경쟁력을 생각하면 답이 나옵니다. 베가는 파스칼조차 뛰어넘지 못한 아키텍처입니다.

(추측이 맞다면) FP64 성능을 최대로 끌어올렸고 거기에 집중했으며 이를 지원하기위해 메모리 사양도 맞췄습니다.

하지만 끌어올린 사양을 보면 이건 게이밍을 위한 노력이 아니지요.

발표 내용도 딥러닝, 서버, 워크스테이션, 렌더링 솔루션 등 게이밍과 거리가 있고요.

(인텔 카비레이크-G에 들어갔던 것처럼 ROP를 강화하는 방향이라면 게이밍 강화도 있겠습니다만.)

구성만 보면 게이밍용의 베가10, 연산용의 베가20 으로 용도에 따라 라인업이 분리된 느낌이 있습니다.

마치 엔비디아가 하는 것 처럼요.

이게 일시적인 선택인지, 라인업 전개 방향 선회인지 두고봐야겠지요.

저작자표시 비영리 변경금지

'그래픽카드 VGA > AMD' 카테고리의 다른 글

(2019.09.22. 수정) AMD 폴라리스20 생산관련 (AMD Polaris 20) (0)	2019.09.18
라데온 프로 폴라리스21 삼성 생산. (Radeon Pro Polaris21) (0)	2019.05.25
AMD 라데온 베가 모바일 사양 추정. (RADEON VEGA MOBILE DISCRETE GPU) (update 2018.03.04.) (39)	2018.01.15
SAPPHIRE 라데온 HD 7870 XT with Boost D5 2GB 간단 테스트. (6)	2013.03.28
AMD GPU 부동소수점연산(FLOPS) 계산. (4)	2012.08.20