본문 바로가기

그래픽카드 VGA101

AMD 라데온 베가 모바일 사양 추정. (RADEON VEGA MOBILE DISCRETE GPU) (update 2018.03.04.) - AMD는 CES2018에서 2세대 라이젠을 비롯한 차기 제품을 발표했는데 이 중 베가 모바일 사양을 현재까지 나온 정보로 추정해보겠습니다. 베가 모바일은 GPU 내장 APU와 별개로 노트북같은 모바일 제품용 외장 그래픽 제품을 말하는겁니다. - 발표 내용 발표 이미지와 내용 중 참고할만한건 크게 두 가지 입니다. 높이(패키지 높이겠지요.) 1.7mm 라데온 베가 모바일 패키지 이미지 인텔 코어H 시리즈 패키지 이미지(카비레이크-G, 인텔 CPU + RX 베가 M GPU + HBM) - HBM 사양 모바일용 베가라는 점에서 카비레이크-G가 참고가 됩니다. 둘 다 용도가 같고 슬라이드 이미지에서 볼 수 있듯이 HBM2 1칩 구성을 하고 있습니다. (메모리 인터페이스 1024bit) 문제는 스택(stack.. 2018. 1. 15.
삼성의 GPU 생산에 대하여. (GP107 외) - GTX1050 Ti, GTX1050이 발표되었고 거기에 들어가는 GP107 생산이 삼성이라는 얘기가 나왔습니다. (링크 : http://www.pcgameshardware.de/Nvidia-Pascal-Hardware-261713/Specials/Geforce-GTX-1050-Ti-Release-Samsung-1210868/) 엉뚱하게 GTX1050의 출시에 위협을 느낀 AMD가 내놓은 자료로 GP107이 14nm 공정임이 확인되었습니다. 시기상 14LPP 공정이겠지요. GP107 다이사이즈는 130~135mm2 정도로 알려져있는데 (위에는 132mm2로 나왔네요.) 작다면 작은 제품이지만 AP와 비교하면 큰 편이고 라인업상 미드레인지에 진입했으니 삼성에게는 의미있는 생산일겁니다. 로우엔드 담당의 하.. 2016. 10. 27.
SAPPHIRE 라데온 HD 7870 XT with Boost D5 2GB 간단 테스트. - HD7870 XT 이름은 HD7870 이지만 일반적인 HD7800에서 쓰는 Pitcairn 코어가 아닌 HD7900에 들어가는 Tahiti 코어가 들어갑니다. 당연한 얘기지만 HD7950에서 스펙다운 된 상태입니다. 7870과 가격 차이가 거의 없는 상태. Tahiti LE 코어 1536 SP 96 TMU 32 ROP Core Clock - 925MHz (Bosst : 975MHz) Memory - GDDR5 2GB Memory Bus -256bit Memory Clock - 1500MHz (유효 6000MHz) - 외형 저광량에서 대충 찍었더니 사진이 개판입니다. 양해를...;; 이엠텍 유통 사파이어 제품. 3년 무상 보증. 요즘에 게임 쿠폰을 주고 있습니다. 툼 레이더 리부트, 바이오쇼크 인피니트.. 2013. 3. 28.
XFX 라데온 HD 6950 DD Edition D5 2GB 사용기 2012년 12월에 디지털그린텍에서 HD6950 가격인하를 했습니다. 그래서 XFX HD6950 2GB 가격이 18만원까지 떨어졌지요. 메모리 2GB 제품 중에서 실구매가 20만원 이하는 이거 밖에 없네요. 하이엔드에 한 맺혀서 무조건 2GB 256bit 제품사겠다고 작심하고 고르니 이것 밖에 선택의 여지가 없네요. 5~6만원만 더 쓰면 비슷한 성능에 소비전력이 훨씬 낮은 HD7850 1GB 를 살 수 있습니다. 게임을 많이 하지도 않으니 간단하게 테스트나 돌려봤습니다. - 외형 박스. 디지탈그린텍 유통으로 무상보증기간 3년입니다. 80mm 듀얼 팬. 모니터로 보는 제품 이미지와 실물은 느낌이 많이 다르더군요. 모니터로 볼 때는 평범해보였는데, 실물은 평범보다는 나은 느낌입니다. PCI-Express 2.. 2013. 1. 29.
GPU 아키텍처별 효율 분석. (4) Nvidia vs AMD 앞서 했던 분석을 토대로 엔비디아와 AMD를 비교해보겠습니다. GPU 아키텍처별 효율 분석. (1) 기초 배경 설명. GPU 아키텍처별 효율 분석. (2) AMD GPU 아키텍처별 효율 분석. (3) Nvidia 일단 3Dmark11 결과가 비슷한 것, 동일 라인업에서 경쟁했던 제품을 비교. 아키텍처에 따라 최대 클럭, 최적 클럭이 다르기때문에 실제 성능을 따지는데 있어서 클럭을 무시할 수는 없습니다. 그래서 AMD와 엔비디아를 비교할 때, 클럭을 반영한 경우도 추가. - GF116 vs Juniper 서로 다른 클럭 상태에서 동일 성능을 보이는 SP수 비율을 계산해보면, (AMD : Nvidia =) 3.6 : 1 (이하 모든 비율은 SFU 포함 기준) 'Juniper 코어가 GF116 코어와 동등한 .. 2012. 8. 29.
GPU 아키텍처별 효율 분석. (3) Nvidia 엔비디아의 GPU에는 초월함수를 처리하는 SFU 유닛이 따로 존재하고, AMD와 다르게 이를 스펙상 SP숫자에 포함시키지 않습니다. 엔비디아 코어끼리의 비교에서는 SFU 숫자를 반영하지 않아도 결과는 달라지지 않습니다만, AMD GPU 와의 비교에서는 반영해야할 것으로 생각됩니다. 그래서 SP + SFU 를 전체 SP 수로 보고 분석할 겁니다. (SFU 반영 전) (SFU 반영 후) - 페르미 이전 코어들은 DirextX 11 을 지원하지 않아서, 3Dmark11 결과 자체가 있을 수 없습니다. - 페르미 GF110 의 SP 수치는 7.13 이 나옵니다. - GF114 는 5.99 를 보입니다. GF110 대비 -6% 입니다. 텍스처 수치가 -25% 인데, 이와 연관이 있을 것으로 생각됩니다. GF114.. 2012. 8. 27.
GPU 아키텍처별 효율 분석. (2) AMD 사전 정보는 이전 포스트 참고. (GPU 아키텍처별 효율 분석. (1) 기초 배경 설명.) 분석은 일단 나타난 지표를 고려해서 점수/(SP x GHz) (1SP가 1GHz 로 동작할 때 점수) 의 최대값을 정해서 각 아키텍처, GPU 별로 비교할겁니다. 최대값을 어떻게 찾느냐. 예시로 한 번 해보겠습니다. (길어서 2개로 분할했습니다.) AMD의 Cape verde 코어 제품의 결과를 모아놓은 것입니다. HD7770 의 결과 4개를 보겠습니다. 일단 메모리 대역폭을 제외한 3항목을 보면, 아래쪽 3개의 수치들은 오차범위에서 비슷한 값을 보이고 있습니다. SP, 텍스처, 픽셀 성능에 비례해서 점수가 잘 나온다는 의미입니다. 오버클럭을 해도 클럭에 비례해서 점수가 나왔다는거지요. 하지만 메모리 대역폭 항목(.. 2012. 8. 27.
GPU 아키텍처별 효율 분석. (1) 기초 배경 설명. 이전에 엔비디아와 AMD의 GPU와 그 연산 성능에 대해 간략히 다뤘습니다. (AMD GPU 부동소수점연산(FLOPS) 계산.) (Nvidia GPU 부동소수점연산(FLOPS) 계산.) (계산한 것은 이론적인 피크치일뿐이고, 게이밍으로 대표되는 일반적인 사용자 환경과는 동떨어진 부분이지만요.) GPU 제조사들은 새로운 GPU를 발표할 때마다, 더 높은 효율의 새로운 아키텍처, 유닛을 홍보합니다. 이번 포스팅에서는, 이런 아키텍처의 차이가 실제 환경에서 어떻게 나타나는지 분석해보고자 합니다. (어떤 결과가 나올지는 모르겠지만...) - 1 - 분석을 위해서는 절대적인 평가 지표가 필요합니다. 이 지표에는 그래픽 카드의 성능을 드러내는 요소가 반영되어야하고요. 여기에 가장 적합한 벤치마크 프로그램이 3Dma.. 2012. 8. 26.
Nvidia GPU 부동소수점연산(FLOPS) 계산. 플롭스(FLOPS) 관련 기초 내용은 이전 포스트 참고. (AMD GPU 부동소수점연산(FLOPS) 계산.) (1) G80/G92 계열 Geforce 8000, Geforce 9000, GT100, 일부 GTX200 계열에 사용. 32비트 단정밀도(Single-Precision) 지원. (Geforce 9000 만 지원) 64비트 배정밀도(Double-Precision) 미지원. G92 는 G80 에서 텍스처 유닛이 강화되고, 공정이 더 미세화되었다는 것 외에는 동일합니다. Geforce 9000 계열이 사골이라고 욕먹는 이유. (이하의 이런 류의 일러스트는 모두 後藤 弘茂(Hiroshige Goto)씨 출처입니다.) G80/G92 코어는 SM(Streaming Multiprocessor) - TPC(T.. 2012. 8. 21.
AMD GPU 부동소수점연산(FLOPS) 계산. FLOPS (FLoating point OPeration per Second, 플롭스) 는 초당 부동소수전 연산 횟수라는 뜻으로, 컴퓨터의 성능을 평가하는 가장 대표적인 지표입니다. 슈퍼컴퓨팅 등에서는 절대적인 성능 지표이고, 개인용 컴퓨터에 있어서도 (플롭스가 체감성능으로 이어지는 것은 아니지만) 성능 평가에 있어서 참고가 됩니다. 부동소수점은 실수를 표시할 때, 소수점을 고정하지 않고, 소수점의 위치를 따로 표기하는 방식으로 복잡한 연산이 필요한 슈퍼컴퓨팅 등에 기본적으로 쓰이는 방식입니다. 전체 비트는 부호를 나타내는 sign bit, 소수점의 위치에 대한 정보인 지수부분(exponent), 유효숫자를 표시하는 가수부분(fraction/mantissa) 으로 구성되어 있습니다. 가장 널리쓰이는 표준.. 2012. 8. 20.