http://www.techpowerup.com/reviews/AMD/HD_5870_PCI-Express_Scaling/1.html
http://www.tomshardware.com/reviews/pcie-geforce-gtx-480-x16-x8-x4,2696.html
http://www.tomshardware.com/reviews/p55-pci-express-scaling,2517.html



pci-express 슬롯에 따른 대역폭이 다릅니다.

pci-ex 1.0 x1 = 250MB/s
pci-ex 1.0 x8 = 2GB/s
pci-ex 1.0 x16 = 4GB/s

pci-ex 2.0 x1 = 500MB/s
pci-ex 2.0 x8 = 4GB/s
pci-ex 2.0 x16 = 8GB/s

pci-ex 2.0 = pci-ex 1.0 의 두배.
직렬방식이라 위에 수치들은 단방향 기준이고, 양방향 기준으로 하면 두배.



이 대역폭의 차이때문에 그래픽카드의 성능이 떨어지는지 여부에 대한 벤치들은 많았는데, 그것들을 정리한겁니다.
이런 벤치마크는 별로 없어서 대상이 되는 그래픽카드도 한정되고 그에 따라서 정보도 그리 많지는 않습니다.



중간에 GTX460과 HD5750은 파코즈에 있던 내용인데 그냥 참고삼아넣었습니다.
현실적으로 pci-ex 2.0 x4는 거의 쓸일이 없으니 10%정도나오는 성능저하는 무시하고,

x8 슬롯에서는 1~2%의 성능저하가 보이는데, 오차라고 무시할 수도 있는데 꾸준하네 나타나는걸보면 완전히 무시하기도 좀 그렇고요.
분명 차이는 있는데, 오차범위 수준이라 체감하는건 불가능하다 정도로 생각하면 될까요.

다만 위에 결과는 cpu가 그래픽카드 성능의 거의 대부분을 이끌어낸 상태에서의 비교인겁니다.
파코즈의 데이터는 cpu의 상태가 저정도는 아닌 상태의 벤치로 생각되는데, 그런 상태에서는 5~6%의 성능저하.
GTX460 오버상태에서는 10%에 가까운 저하가 나타납니다. 이건 오차로 무시할만한 정도가 아니죠.
GTX460 오버 벤치에서 cpu가 데네브 955 입니다.
오버 상태를 알수가 없지만, cpu 성능이 부족한 상태에서는 생각보다 pci-ex x8 슬롯에서의 성능저하가 심하게 나타날 수도 있는것으로 보입니다.

자료가 더 많았다면 정확한 패턴이 보일텐데 부족하니 구체적으로 드러나는게 좀 약하네요.

게임벤치들은 정확히 수치적으로 비교하기에 변수가 많아서 그냥 참고만했는데,
피직스 물리효과를 쓰는 경우를 비롯해서 실제 게임에서는 차이가 심한경우도 있다고하니 참고하시길.


그리고 이건 정리해보다가 발견한건데,
하이엔드급 그래픽카드의 성능을 완전히 이끌어내기위해선 어느정도의 cpu가 필요하냐는 문제입니다.

이건 어느 게시판에서 i7 920 을 3.6GHz로 오버클럭해도 GTX480 SLI 시스템에선 cpu때문에 성능상 병목현상이 생긴다는 글을 보고 그에대해 정리해본겁니다.



플웨즈랑 탐스하드웨어의 자료인데,
GTX480 SLI에서 10%정도의 성능 차이를 보입니다.

변수가 될 차이라고는
cpu 클럭
드라이버 차이입니다.

- 드라이버.
탐스가 258.96
플웨즈가
GTX480은 258.96
GTX480 SLI는 197.45

197.75 과 257.15 사이에 6%정도의 성능 향상이 있고,
257.15와 258.96 사이의 성능상의 차이는 없습니다.
257.15가 페르미용으로 나온 드라이버라서 그 이전인 197대 드라이버 간에도 성능상 차이는 없습니다.

- cpu클럭.
GTX480 벤치는 드라이버가 같은데, 성능 차이가 오차범위입니다.
i7 920 3.6GHz는 GTX480 의 성능을 이끌어내기에 충분하다는거죠.

하지만, GTX480 SLI 에서 10%의 성능 하락이 나타납니다.
앞에서 말한 드라이버에 의한 6%의 성능저하에 SLI의 높은 효율을 생각하면, 어느정도 들어맞는다고 봅니다.

GTX460 SLI 자료를 보면, 3Dmark Vantage GPU 스코어에서 SLI 효율이,
퍼포먼스에서 180%, 익스트림에서 193%정도로 나옵니다.
이 방식이 맞다고 확신할 수는 없지만 일단 해보면,
(6% + 6%) * 0.8 = 9.6% -> 89.01 + 9.6 = 98.61
(6% + 6%) * 0.93 = 11.96% -> 92.21 + 11.96 = 104.17
어느정도 오차범위 안에서 들어맞습니다.

물론 SLI 효율도 표본이 부족한 부정확한 자료고, 저런 식의 대입이 맞다는 보장도 없기때문에 확신할 수 없지만,
다른 자료들의 일관성을 볼 때는 i7 920 3.6GHz 정도면 현존하는 그래픽카드와 다양한 다중 GPU 시스템의 성능을 이끌어내는데는 부족함이 없다.는 결론을 내는데는 무리가 없어보입니다.

Posted by gamma0burst Trackback 0 : Comment 2

댓글을 달아 주세요

  1. addr | edit/del | reply Favicon of http://blog.naver.com/lifeiz79 BlogIcon KooL 2011.07.03 22:07

    혹시 지금과 같이 요근래 나오는 제품들이나 아니면 이런 수치가 잘 나와있는곳이 따로있을까요??? 아니면 알아보는 방법이라도... 어떤CPU들에 따라 그래픽카드에 성능이 어느정도 발휘하는지에 대해서 알아볼게 있어서요.

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2011.07.04 00:38 신고

      cpu와 플렛폼에 따른 크파, SLI 의 성능차이를 다루는 벤치가 새로운 플렛폼이 나올 때마다 올라오는 경우가 있기는한데, 다양한 플렛폼을 다루는게 아니라서 하나만봐서는 정보가 단편적이지요.

      종합적인 정보는 여기저기서 긁어모아서 스스로 판단해야하는 경우가 많습니다.

      궁금하신거 있으면 질문해주세요.

      최대한 찾아서 정보를 종합해볼게요.