인텔(AMD도 크게 다르지는 않지만)의 메인스트림 메인보드 칩셋은 그래픽카드를 위한 PCI-E 레인을 16개만 지원을 합니다.



PCI-E 컨트롤러가 cpu에 내장되기 시작한 네할렘 이후에도 칩셋에서 지원하던 것이 cpu에 통합되었을뿐,
지원개수는 16개로 변함이 없고요.



메인스트림급에서는 CF/SLI 같은 다중 그래픽카드 시스템의 비중이 낮기때문이겠지요.
하이엔드 칩셋에서는 지원 개수가 더 많습니다. 
X48은 32개, X58은 36개를 지원하고, X68은 40개를 지원하는 것으로 알려져있습니다.

결국 대다수가 사용하는 메인스트림급 시스템에서는 2-way CF/SLI를 하면 x8,x8이 되는데,
PCI-E 2.0의 경우, GTX480은 x8에서는 대역폭 부족에따른 성능저하가 없습니다.
GTX480 이하의 성능을 갖는 그래픽카드는 더 말할 필요도 없지요.
※ 참고 (
pci-ex 슬롯, cpu에 따른 그래픽카드 성능.)

그래도 사람 마음이 최대성능을 제공받지 못하면 뭔가 찜찜한 법.
브릿지칩을 사용해 조금이라도 더 대역폭을 확보하려는 제품들이 다수 나온데는 그런 이유가 크게 작용했을겁니다.

가장 많이 쓰이는 브릿지칩이 엔비디아의 nforce200 (NF200) 입니다.


총 48개의 PCI-E 2.0 레인을 지원하면,
1개의 PCI-E 2.0 x16 채널을 2개의 PCI-E 2.0 x16 채널로 전환합니다.



사실 엄밀히 말하면 브릿지칩을 통해 총 대역폭이 2배로 늘어나는 것은 아닙니다.
기본적으로 칩셋에서 제공되는 레인이 16개라는건 극복할 수 없는 물리적인 한계이니까요.

그렇다면 굳이 브릿지칩을 사용하는 이유는 무엇일까요.
CF/SLI에서 두개의 그래픽카드가 동작상황에 따라 대역폭을 모두 사용하는게 아닙니다.
즉, 상황에 따라서는 한쪽은 x8의 대역폭이 부족해서 성능병목이 생기는데, 다른 한쪽은 대역폭이 남아도는 상황이 생기는 경우도 있다는거지요.
브릿지칩은 이런 경우에 칩셋에서 제공하는 x16의 대역폭을 유연하게 두 그래픽카드에 분배하는 역활을 한다고 보면됩니다.
브릿지칩이 없을때는 두 그래픽카드가 각각 최대 x8이라는 고정된 대역폭을 쓸 수 밖에 없지만, 브릿지칩이 중간에서 컨트롤을 하는 덕에 각각의 최대 대역폭은 x16까지 늘어나게 되는 것이지요.

이러한 특징은 NF200에 국한된 얘기가 아니라 모든 브릿지칩에 해당되는 얘기입니다.

예를 들어볼까요.
카드1, 카드2가 x16에 물려있다고 하죠.
1) 브릿지칩이 없는 경우.
카드의 동작상황에 관계없이 양쪽 카드는 각각 x8로 대역폭이 고정됩니다.
앞서 말했듯이 한쪽은 대역폭이 부족하고, 다른 한쪽은 남아도는 상황이 발생할 수도 있습니다.
칩셋입장에서는 x16이란 대역폭의 전체 활용률이 떨어집니다.
한쪽이 대역폭을 다쓰고, 다른 한쪽이 대역폭의 절반만 쓴다면, 결과적으로 x16의 총 대역폭중 x12만큼 밖에 안 쓰는 것이니까요.

2) 브릿지칩이 있는 경우.
일단 각 카드는 최대 대역폭은 x16이 됩니다. 카드에 연결된 레인이 x16이니까요.
다만, 실제 저 대역폭을 쓸수 있느냐없느냐는 전적으로 상황따라입니다.
극단적인 예로 카드1이 대역폭을 하나도 활용하지 않는다면, 카드2가 x16의 대역폭을 모두 사용할 수있습니다.
실제로 그런 상황은 극히 드물겠지만요.
둘 다 최대 대역폭을 필요로한다면 각각 x8의 대역폭을 사용하겠고요.
각 카드의 대역폭 사용량에 따라 x16의 대역폭이 유동적으로 분배되는겁니다.


그렇다면 칩셋자체에서 지원하는 레인이 많아서 실제로 x16의 최대 대역폭을 지원하는 네이티브 x16,x16과,
칩셋에서 지원하는 16개의 레인을 NF200을 통해 분배받는 x16,x16 간에 성능차이는 어느정도일까요.

http://www.tomshardware.com/reviews/p55-crossfire-nf200,2537.html
탐스하드웨어서한 그에 관한 벤치마크입니다.
중간에 각 게임과 벤치마크툴의 결과가 있지만, 결론값만 보겠습니다.

-
X58은 표시된대로 2-way에서 x16,x16, 3-way에서 x16,x8,x8 입니다.

P55+NF200은 2-way에서 x16,x16, 3-way에서 x16,x8,x8 입니다.

P55 native는 2-way에서 x8,x8 입니다.
P55 native 3-way는 x8,x8,x2 인것으로 보입니다.
마지막 슬롯은 cpu가 아닌 p55칩셋에서 추가장치를 위해서 제공하는 레인을 돌려서 쓴듯한데, 칩셋에서 제공하는 레인이 PCI-E 1.0 레인 8개입니다.
8개의 레인을 전부 돌릴 수는 없었을 것이니 4개정도를 사용한 것으로 보이는데, PCI-E 1.0은 2.0의 대역폭의 절반입니다. 표기를 맞추면 PCI-E 2.0 x2가 되는 것이지요.

cpu는 모두 4GHz로 오버클럭된 상태입니다.
블룸필드와 i7 린필드 간에 동클럭에서 게임성능 차이는 없다고 볼수 있으니 슬롯 구성말고는 동일한 조건이라고 볼 수 있습니다.



No 안티얼라이징 상태에서 해상도별 종합입니다.
2-way까지는 전부 비슷하지만, 3-way에서 차이가 보입니다.
P55칩셋에 NF200칩이 없는 3-way는 하나마나인 수준이고요.



4x 안티얼라이징 비교입니다.
이전 결과와 대동소이합니다.



P55 + NF200은 3-way에서 x16,x8,x8로 표시하지만,
모든 카드가 대역폭을 다 쓴다고하면, 실제 대역폭은 x8,x4,x4에 불과합니다.
그런데도 네이티브 x16,x8,x8 지원인 x58칩셋과의 차이가 2~3%에 불과합니다.

HD5870으로는 대역폭의 차이를 다 쓰지 못하는 수준이기때문으로 생각됩니다.
앞으로 그래픽카드의 성능이 점차적으로 향상되면, 네이티브 지원과 NF200을 통한 지원 사이의 성능차이는 점차적으로 심해지겠지요.
물론 그전에 PCI-E 3.0의 도입 등으로 대역폭문제가 먼저 해결될 것으로 보입니다.
(
pci-ex 3.0 revision 0.71 정보.)

어찌되었건, P55칩셋에서 3-way이상의 CF/SLI 시스템에서 브릿지칩의 유용성은 입증되었습니다.


그렇다면, X58칩셋에서도 유용할까요.




X58칩에서는 네이티브 지원과 NF200을 통한 지원 사이에 거의 차이가 없으면,
고해상도로 갈수록 오히려 네이티브 지원의 프레임이 더 높게 나옵니다.



NF200등의 브릿지칩을 거칠 경우 2~5%의 성능저하가 발생하고,
네이티브 x8,x8과 NF200을 통한 x16,x16이나 성능은 동일하다는 말도 있습니다.

전자의 경우 앞의 X58칩셋에서의 벤치마크에서 어느정도 입증이 된 내용이고,
후자의 경우 초반부에 설명한 내용으로 당연한 얘기입니다. 물리적인 한계는 극복할 수 없는 부분인겁니다.

이 때문에 아수스의 일부보드에서는 보드에 NF200 칩이 있음에도 불구하고, 2-way CF/SLI 시에 NF200을 통하지 않고 네이티브 방식의 x8,x8 로 동작하도록 되어있습니다.


- 결론

X58칩셋 등 기본적으로 제공하는 레인이 많은 경우
 - 브릿지칩 탑재 보드가 오히려 안 좋을 수 있음.

P55칩셋 등 레인을 16개만 지원하는 경우
 - 2-way CF/SLI 까지는 NF200이 필요없으나, 3-way에서는 브릿지칩이 필수.




Posted by gamma0burst Trackback 0 : Comment 6

댓글을 달아 주세요

  1. addr | edit/del | reply 손제민 2011.04.16 02:06

    시스템을 만들려다 지금 고민중입니다.
    2 WAY SLI 셋팅을 하려고 합니다. (P67- ASUS MAXIMUS IV EXTREME)
    1번 카드는 PCI E SLOT#1 에 붙이고
    2번 카드는 PCI E SLOT#4 (NF200) 붙이려하는데 ( 이유는 ... 제가 쓰려는 카드가 (2.5~3 SLOT 을 잡아 먹기 때문입니다)
    제가 알아본봐로는 셋팅자체는 X8 + X16(NF200) 된다고 합니다.
    이 셋팅법이 SLI 기능을 어떻게 좌우하는지 알고싶습니다.

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2011.04.16 02:27 신고

      http://www.overclock.net/intel-general/908493-p67-16x8x-vrs-8x8x-2.html

      찾아보니 이런게 나오네요.
      중간에 이미지 있습니다.

      쓰신 내용으로 봐서는 무조건 1,4번 슬롯을 써야되네요.
      그게 성능에 영향을 얼마나 끼치냐의 문제인데,

      포스팅한 내용 중에도 있는데 nf200을 거친다고 총 대역폭이 두배로 뻥튀기되는건 아닙니다.
      한정된 대역폭을 여러 슬롯에서 유동적으로(효율적으로) 쓸 수 있게 할뿐이지요.

      1,4 슬롯을 쓰는 세팅이면,
      실질적으로 적용되는 대역폭이 각각 x8, x8이 되는걸로 보입니다.
      다만 4번슬롯은 nf200을 거치는데, nf200을 거칠 경우 2~5%의 성능저하가 있는 것으로 알려져있습니다.

      최선은 1,3 슬롯을 사용하는 것이지만,
      저 정도의 성능저하를 체감하기는 힘들테니 1,4 슬롯도 문제없는 세팅으로 보입니다.

      3슬롯이면 아수스 gtx580 다이렉트cu2 인가요?ㅎ

  2. addr | edit/del | reply 손제민 2011.04.16 02:38

    ASUS ENGTX570 DCII 입니다.. AIR FLOW 때문에 (너무 가까이 붙여져서) 이런 생각을 했습니다만,,.,
    그냥 NATIVE X8/X8 이 낳겠네요..
    빠른 리플 감사합니다. ^^

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2011.04.16 03:38 신고

      불덩이같은 하이엔드 레퍼런스 디자인 제품들도 다닥다닥 붙여서 SLI CF해서 큰 문제가 없으니, 그 정도는 괜찮아 보이네요.

  3. addr | edit/del | reply SIKONGNO 2011.04.24 07:30

    유용한 정보 잘봤습니다 제가 MSI P55 GD65 메인보드 사용중입니다

    P55에선 애드온 카드 연결용으로 배치된 PCI-E LANE이 총 8개로 알고있습니다 제가 검색 해본 바로는 그렇네요

    P55 다이어그램에선 PCI-E 2.0으로 나와있어서 LANE 당 대역폭이 500MB/s로 알고 있었으나 실제로는 PCI-E 1.1수준인 250MB/s라고 하네요 그런데 다이어그램에선 왜 PCI-E 2.0으로 표기된건지 의문입니다

    그리고 제 보드에 USB3.0/SATA3 카드를 장착하게 될 경우 PCI-E x4 슬롯에 설치하면 LANE 당 대역폭이 250MB/s니깐 LANE 4개를 합치면 1GB/s 로 나오겠네요

    그런데 USB3.0과 SATA3 속도가 각각500MB/s,600MB/s 로 나오는데 1GB/s 대역폭을 훨씬 초과되는게 아닐까요?

    그렇다면 USB3.0/SATA3 카드를 설치해도 제 속도를 못 내는 상황이 예상됩니다 저의 생각이 맞는지 궁금하네요

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2011.04.24 14:32 신고

      말씀하신대로 추가 레인은 1.0 맞습니다.
      다이어그램에서는 단방향기준으로 대역폭을 표시해서 1.0 x1이 500MB 2.0 x1 을 1GB 로 표시한거지요.
      일반적인 양방향기준표시라면 알고 계신대로 250MB, 500MB 입니다.

      P55의 특성상 추가레인을 활용해서 usb3.0 사타3.0을 지원하는데 1GB로는 턱없이 부족한게 맞습니다.
      그래서 그래픽용 2.0 8레인을 끌어와서 쓰는 기가바이트의 방식도 있고요.
      보드자체에서 usb3.0과 사타3.0을 지원하는 경우에는 대부분 브릿지칩을 써서 총 1GB/s의 대역폭을 유동적으로 쓰게합니다.

      실제로 usb와 사타가 동시에 최대 대역폭을 사용하는 일이 거의 없기때문에 그 정도로만 해줘도 각각의 이용시에 속도저하를 체감하는 경우가 드물지요.
      다만 브릿지칩도 없이 각 부분별로 레인을 할당해 고정해버린 경우라면 병목이 당연히 발생합니다.

      GD65보드에는 저 usb3.0 사타3.0을 지원 안하는 것으로 보이는데, 이 경우 추가 슬롯에 에드온카드를 사용해서 써야겠지요.
      이러면 병목등 성능저하가 발생하느냐는 순전히 에드온카드의 구성(브릿지칩의 유무 등등)과 컨트롤러의 성능에 달렸다고봐야합니다.