본문 바로가기
기타하드웨어

몽블랑 프로젝트 현황. (2013.08.07.)

by gamma0burst 2013. 8. 7.
반응형




ISC2013 자료.







HPC 시장에서 ARM 프로세서의 전망에 대한 것은 이전에 다뤘으니 패스.
(
HPC에서 모바일 프로세서의 미래.)



프로토타입에 엑시노스 5250이 들어갑니다.
32nm HKMG 공정.
CPU : Cortex-A15 1.7GHz 듀얼코어.
GPU : Mali-T604
DDR3 듀얼채널.
USB3.0을 통한 기가비트 이더넷 지원.



컴퓨트 카드.
프로토타입용으로 따로 개발한듯.



한 블레이드에 15개의 컴퓨트 노드가 들어갑니다.
디자인을 봐서는 공랭이네요.



컴퓨트 카드(Compute card) 하나 당
CPU : 6.8 GFLOPS

GPU : 25.5 GFLOPS
FP64 기준이고 연산성능을 봐서는 GPU 클럭이 800MHz 정도인 것 같네요.

캐리어 블래이드(Carrier blade)에는 15개의 컴퓨트 카드가 들어가므로 연산성능은 485 GFLOPS.

Blade chassis에 캐리어 블레이드가 9개 들어가고, 1개의 랙에는 4개의 Blade chassis가 들어갑니다.
랙 하나당 연산성은 이론적으로 17.2 TFLOPS (프로세서가 540개.)
전성비는 2.1 GFLOPS/W 로 예상하고 있습니다.
실제로 최대 이론성능을 낼 가능성이 낮기때문에 전성비는 더 떨어질 가능성이 높습니다.

최근 Green500 순위를 보면 1위가 이미 3 GFLOPS/W를 넘었습니다.
당면 목표가 Green500 순위 진입이던데 갈 길이 멀어보이네요.
프로토타입이라 당장 성과가 나오지 않는게 당연하겠지만요.
목표인 7 GFLOPS/W를 달성하려면 최소 20nm급 SoC에 메모리, I/O 단에서의 소비전력도 줄여야 하는 등
프로토타입에서 다듬어야 할 부분이 한둘이 아닐겁니다.




값싸고 전력효율이 좋다지만 공짜 점심은 없는 법.
동일 성능을 위해서 2배의 코어가 필요하고, (코어당 성능이 절반.)
코어당 메모리는 절반이며,
노드는 8배나 되고, (병렬화가 심화되는게 좋은건 아니지요.)
I/O 대역폭은 심하게 낮습니다.











7월 13일부터 테스트를 시작한다고 합니다.
결과가 기대됩니다.



반응형

댓글