http://www.techpowerup.com/reviews/AMD/HD_5870_PCI-Express_Scaling/1.html
http://www.tomshardware.com/reviews/pcie-geforce-gtx-480-x16-x8-x4,2696.html
http://www.tomshardware.com/reviews/p55-pci-express-scaling,2517.html
pci-express 슬롯에 따른 대역폭이 다릅니다.
pci-ex 1.0 x1 = 250MB/s
pci-ex 1.0 x8 = 2GB/s
pci-ex 1.0 x16 = 4GB/s
pci-ex 2.0 x1 = 500MB/s
pci-ex 2.0 x8 = 4GB/s
pci-ex 2.0 x16 = 8GB/s
pci-ex 2.0 = pci-ex 1.0 의 두배.
직렬방식이라 위에 수치들은 단방향 기준이고, 양방향 기준으로 하면 두배.
이 대역폭의 차이때문에 그래픽카드의 성능이 떨어지는지 여부에 대한 벤치들은 많았는데, 그것들을 정리한겁니다.
이런 벤치마크는 별로 없어서 대상이 되는 그래픽카드도 한정되고 그에 따라서 정보도 그리 많지는 않습니다.
중간에 GTX460과 HD5750은 파코즈에 있던 내용인데 그냥 참고삼아넣었습니다.
현실적으로 pci-ex 2.0 x4는 거의 쓸일이 없으니 10%정도나오는 성능저하는 무시하고,
x8 슬롯에서는 1~2%의 성능저하가 보이는데, 오차라고 무시할 수도 있는데 꾸준하네 나타나는걸보면 완전히 무시하기도 좀 그렇고요.
분명 차이는 있는데, 오차범위 수준이라 체감하는건 불가능하다 정도로 생각하면 될까요.
다만 위에 결과는 cpu가 그래픽카드 성능의 거의 대부분을 이끌어낸 상태에서의 비교인겁니다.
파코즈의 데이터는 cpu의 상태가 저정도는 아닌 상태의 벤치로 생각되는데, 그런 상태에서는 5~6%의 성능저하.
GTX460 오버상태에서는 10%에 가까운 저하가 나타납니다. 이건 오차로 무시할만한 정도가 아니죠.
GTX460 오버 벤치에서 cpu가 데네브 955 입니다.
오버 상태를 알수가 없지만, cpu 성능이 부족한 상태에서는 생각보다 pci-ex x8 슬롯에서의 성능저하가 심하게 나타날 수도 있는것으로 보입니다.
자료가 더 많았다면 정확한 패턴이 보일텐데 부족하니 구체적으로 드러나는게 좀 약하네요.
게임벤치들은 정확히 수치적으로 비교하기에 변수가 많아서 그냥 참고만했는데,
피직스 물리효과를 쓰는 경우를 비롯해서 실제 게임에서는 차이가 심한경우도 있다고하니 참고하시길.
그리고 이건 정리해보다가 발견한건데,
하이엔드급 그래픽카드의 성능을 완전히 이끌어내기위해선 어느정도의 cpu가 필요하냐는 문제입니다.
이건 어느 게시판에서 i7 920 을 3.6GHz로 오버클럭해도 GTX480 SLI 시스템에선 cpu때문에 성능상 병목현상이 생긴다는 글을 보고 그에대해 정리해본겁니다.
플웨즈랑 탐스하드웨어의 자료인데,
GTX480 SLI에서 10%정도의 성능 차이를 보입니다.
변수가 될 차이라고는
cpu 클럭
드라이버 차이입니다.
- 드라이버.
탐스가 258.96
플웨즈가
GTX480은 258.96
GTX480 SLI는 197.45
197.75 과 257.15 사이에 6%정도의 성능 향상이 있고,
257.15와 258.96 사이의 성능상의 차이는 없습니다.
257.15가 페르미용으로 나온 드라이버라서 그 이전인 197대 드라이버 간에도 성능상 차이는 없습니다.
- cpu클럭.
GTX480 벤치는 드라이버가 같은데, 성능 차이가 오차범위입니다.
i7 920 3.6GHz는 GTX480 의 성능을 이끌어내기에 충분하다는거죠.
하지만, GTX480 SLI 에서 10%의 성능 하락이 나타납니다.
앞에서 말한 드라이버에 의한 6%의 성능저하에 SLI의 높은 효율을 생각하면, 어느정도 들어맞는다고 봅니다.
GTX460 SLI 자료를 보면, 3Dmark Vantage GPU 스코어에서 SLI 효율이,
퍼포먼스에서 180%, 익스트림에서 193%정도로 나옵니다.
이 방식이 맞다고 확신할 수는 없지만 일단 해보면,
(6% + 6%) * 0.8 = 9.6% -> 89.01 + 9.6 = 98.61
(6% + 6%) * 0.93 = 11.96% -> 92.21 + 11.96 = 104.17
어느정도 오차범위 안에서 들어맞습니다.
물론 SLI 효율도 표본이 부족한 부정확한 자료고, 저런 식의 대입이 맞다는 보장도 없기때문에 확신할 수 없지만,
다른 자료들의 일관성을 볼 때는 i7 920 3.6GHz 정도면 현존하는 그래픽카드와 다양한 다중 GPU 시스템의 성능을 이끌어내는데는 부족함이 없다.는 결론을 내는데는 무리가 없어보입니다.
'그래픽카드 VGA' 카테고리의 다른 글
GPU 아키텍처별 효율 분석. (3) Nvidia (0) | 2012.08.27 |
---|---|
GPU 아키텍처별 효율 분석. (2) AMD (0) | 2012.08.27 |
GPU 아키텍처별 효율 분석. (1) 기초 배경 설명. (6) | 2012.08.26 |
HD6950 3-way CF vs GTX570 3-way SLI (0) | 2011.03.20 |
CF/SLI에서 네이티브 PCI-E x16과 브릿지칩 PCI-E x16의 성능차이. (6) | 2011.01.11 |
댓글