앞서 했던 분석을 토대로 엔비디아와 AMD를 비교해보겠습니다.

GPU 아키텍처별 효율 분석. (1) 기초 배경 설명.
GPU 아키텍처별 효율 분석. (2) AMD
GPU 아키텍처별 효율 분석. (3) Nvidia

일단 3Dmark11 결과가 비슷한 것, 동일 라인업에서 경쟁했던 제품을 비교.



아키텍처에 따라 최대 클럭, 최적 클럭이 다르기때문에 실제 성능을 따지는데 있어서 클럭을 무시할 수는 없습니다.
그래서 AMD와 엔비디아를 비교할 때, 클럭을 반영한 경우도 추가.


- GF116 vs Juniper

서로 다른 클럭 상태에서 동일 성능을 보이는 SP수 비율을 계산해보면,
(AMD : Nvidia =) 3.6 : 1 (이하 모든 비율은 SFU 포함 기준)
'Juniper 코어가 GF116 코어와 동등한 성능을 보이기위해서는 SP수가 3.6배 많아야된다.' 는 뜻 입니다.
이 쪽이 현실적인 수치입니다.

여기서 서로 다른 클럭을 보정해서 동클럭 기준으로 계산해보면,
1.7 : 1 입니다.
클럭 차이가 보정되었기때문에 가장 정확한 효율비라고 볼 수도 있겠지만, 앞서 말했듯이 클럭 차이도 아키텍처와 구조의 결과물 중 하나이기때문에 고클럭으로 갈수록 이 비율은 현실성이 떨어집니다.
그냥 이론적인 비율정도로 생각하면 될듯.

클럭 미보정시 3.6 : 1
클럭 보정시 1.7 : 1


- GF100 vs Cypress
 
클럭 미보정시 3.4 : 1
클럭 보정시 2.3 : 1

엔비디아 GPU 중에서 최고 효율을 보이는 것이 GF100 인 탓에 클럭을 보정해도 차이가 크게 벌어집니다.
하지만 GF100 이 소비전력이라는 치명적인 단점을 갖고 있어서, Cypress가 경쟁할만했었지요.


- GF114 vs Barts
 
클럭 미보정시 2.6 : 1
클럭 보정시 1.4 : 1

Barts는 VLIW5 계열 GPU 중에서 최고 효율을 보이고 있는데, 그 덕에 차이가 확 줄었습니다.


- GF110 vs Cayman

클럭 미보정시 2.7 : 1
클럭 보정시 1.7 : 1

Cayman은 VLIW4 아키텍처지만, 효율은 Barts와 비슷합니다.
그래서 그런지 결과도 바로 위와 비슷.


- GF110 vs Pitcairn

클럭 미보정시 2.5 : 1
클럭 보정시 1.4 : 1

GCN 아키텍처로 바뀌면서 효율이 많이 좋아졌는데, 그래도 GF110 과 비교에서는 이전과 별 차이가 없습니다.
GF110 계열은 소비전력만 아니면 참 좋은데 소비전력이 참...


- GK104 vs Tahiti

클럭 미보정시 1.5 : 1
클럭 보정시 1.2 : 1

GK104 가 전성비를 챙기면서 효율이 뚝 떨어졌습니다.
덕분에 Tahiti 와의 효율비는 대등한 수준까지 왔습니다만, 절대 성능에서는 차이가 좀 있지요.
둘의 효율비가 비슷해질 수 밖에 없는 것이,
AMD는 GCN으로 넘어오면서 엔비디아 코어의 특성을 일부 수용했고, 엔비디아는 GK104 로 넘어오면서 AMD 코어의 특성을 일부 수용했으니까요.
서로서로 비슷해진거지요.



- 감상

GF110, GF100 생각보다 좋은 제품이었음.
소비전력만 좀 어떻게 해보지...
하긴 다 취할 수는 없지요.

VLIW5 은 VLIW4 에 비해 근본적으로 한계가 있다고 생각했는데, Barts 를 보니 생각이 바뀜.
VLIW5 인 Barts가 VLIW4 인 Cayman과 비슷한 효율을 보이는걸보니, VLIW5 도 다듬기나름인듯.

GCN 아키텍처(Tahiti 등)는 장족의 발전을 보여줬음.

GK104 는 소비전력과 작은 다이를 위해 많은 것을 희생한듯.



신고
Posted by gamma0burst Trackback 0 : Comment 6

댓글을 달아 주세요

  1. addr | edit/del | reply 레이 2012.08.29 01:32 신고

    아... 외계어..

  2. addr | edit/del | reply ppp63 2013.02.22 21:09 신고

    저 그냥 편하게 엔비디아 갈려고했는데
    엔비디아는 쨰쨰 합니다 레퍼런스라는 기판을 내세우고 전원부 메모리가 매우매우 쨰쨰 하지요
    계속 비트수 줄여서 출시하고 amd는 무조건 256비트 1기가 2기가 하고 전원부보면 너무너무 튼튼하지요
    amd랑 기판 비교하면 정말 차이납니다 너무 대충만들어도 너무 대충 만든 티가 전원부가 많이 약한...
    메모리는 용량이 중요한게아니라 비트수가 중요한듯한데요 1기가 2기가 고작 7에서 10 프레임 차이니
    암튼 7950 2기가 가면 또 660이 걸리니까 그냥 에브가 660 편하게 저는 갈렵니다
    근데 질문좀요

    내장그래픽처럼 메모리 할당하는거요
    ddr3 메인 시스템메모리가 8기가일떄
    2기가를 지포스660에 줄수도 있나요?
    어느분 gtx460인가 에 그래픽메모리가 4기가엿음 ㅎㄷㄷ
    물론 ddr3 ddr5 차이는 좀 나겟지만 가능할려나
    진짜 말도안되는거겟죠 근데 저가본 4기가 램의 460은 뭔지
    암튼 할당하면 1기가를 램디스크로 잡고 2기가를 그래픽줘서..
    5기가 남네요 넉넉하네 8gb
    불가능?

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2013.02.22 21:59 신고

      게임마다 다르겠지만 평균적으로 7950은 670하고 노는데 왜 660이 걸리나요.
      뭐 그건 그렇다치고...

      코어 사양이나 라인업을 생각하면 전원부에 공들이지 않아도 되긴하더군요.
      원가절감질이라고 욕할수있겠지만 그렇다고 필요 이상으로 줄여서 문제가 있는 수준인건 아니니까요.

      메모리 비트는 GK110 제외한 케플러 계열의 설계사상때문이지요.
      GPGPU에서 중요한게 메모리 대역폭인데 소비전력과 수율을 위해 GPGPU 기능을 대폭 축소했습니다.
      그러니까 다이커지고 메모리 사양만 올려서 제품 원가만 올리는 메모리버스는 최소화시켜버리고요.
      어찌됐든 결과적으로 게이밍 성능이 잘 나오면 그걸로 된거.

      원래 저가형 제품에는 시스템 메모리를 버퍼로 쓰는 경우가 있습니다.
      AMD에서는 하이퍼메모리라고하고, 엔비디아에서는 터보캐시라고 합니다.
      저가형도 아닌 GTX460 에 저 기술이 적용됐는지 모르겠지만, 진짜라면 그런 기술이 적용되었기때문으로 보이네요.

      대부분의 게임은 램 2GB면 충분합니다.
      GTX660 정도면 시스템 메모리의 도움이 없어도 충분하지요.
      저가형을 위한 기술에 신경쓰지 않으셔도 됩니다.

  3. addr | edit/del | reply nkr 2017.07.06 13:51 신고

    글의 존재를 늦게 알게되었지만
    아키텍처 효율 분석글 3편 모두 잘 읽었습니다.
    단순 스펙(GPU - 쉐이더유닛, TMU, ROP, 메모리 - 버스폭, 실효클럭)들로는
    실성능이 어떨지 정확하게 가늠하기 어려워서 벤치마크 점수에 의존할 수밖에 없는 점이 아쉽더군요
    결국엔 벤치마크 점수를 알아야 아키텍처 효율을 가늠해볼 수 있는 지표이니까요

    지금은 3DMark의 DirectX 12 성능을 보여주는 Time Spy (아직까진 Feature Level 11_0만 반영된다고 합니다.),
    DirectX 11 성능을 보여주는 Fire Strike (사실상 11의 후속 버전 격), 구세대 또는 저가형 모델을 위한 Sky Diver,
    DirectX 10 성능을 보여주는 Cloud Gate (Vantage의 후속 버전 격이랄까..),
    DirectX 9.0, 9.0b, 9.0c 성능을 보여주는 Ice Storm (03, 05, 06의 후속 버전일 듯)
    이렇게 나뉘어졌고, 지원 버전이 다른 지포스 GTX 280과 480의 성능 비교가 가능하다고 들었습니다만
    사실 Vantage로도 GTX 280과 480을 비교할 수 있었기 때문에 큰 의미는 없겠죠
    대신에 GTX 480에서 새로 추가된 지표인 테셀레이터 성능을 확인할 수 없겠구요

    개인적으로 DirectX 지원 버전이 다른 모델끼리의 아키텍처 성능 효율을 알고 싶네요

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2017.07.08 23:58 신고

      3DMark 점수같은걸로 비교할 수는 있겠지만 쉐이더 성능 영향의 비중이 커서 아키텍처 전체의 개선을 대변하기에는 어려울거라고 봅니다.

      API 지원 차이가 있는 경우엔 구형 제품으로 최신 API 성능을 보는게 별 의미가 없을겁니다.
      최근에 엔비디아에서 페르미 아키텍처 제품에 대해 DX12 지원해줬는데 벤치마크보면 지원한다는 의미만 있을뿐 성능이 처참합니다.



티스토리 툴바