본문 바로가기

precision2

Nvidia GPU 부동소수점연산(FLOPS) 계산. 플롭스(FLOPS) 관련 기초 내용은 이전 포스트 참고. (AMD GPU 부동소수점연산(FLOPS) 계산.) (1) G80/G92 계열 Geforce 8000, Geforce 9000, GT100, 일부 GTX200 계열에 사용. 32비트 단정밀도(Single-Precision) 지원. (Geforce 9000 만 지원) 64비트 배정밀도(Double-Precision) 미지원. G92 는 G80 에서 텍스처 유닛이 강화되고, 공정이 더 미세화되었다는 것 외에는 동일합니다. Geforce 9000 계열이 사골이라고 욕먹는 이유. (이하의 이런 류의 일러스트는 모두 後藤 弘茂(Hiroshige Goto)씨 출처입니다.) G80/G92 코어는 SM(Streaming Multiprocessor) - TPC(T.. 2012. 8. 21.
AMD GPU 부동소수점연산(FLOPS) 계산. FLOPS (FLoating point OPeration per Second, 플롭스) 는 초당 부동소수전 연산 횟수라는 뜻으로, 컴퓨터의 성능을 평가하는 가장 대표적인 지표입니다. 슈퍼컴퓨팅 등에서는 절대적인 성능 지표이고, 개인용 컴퓨터에 있어서도 (플롭스가 체감성능으로 이어지는 것은 아니지만) 성능 평가에 있어서 참고가 됩니다. 부동소수점은 실수를 표시할 때, 소수점을 고정하지 않고, 소수점의 위치를 따로 표기하는 방식으로 복잡한 연산이 필요한 슈퍼컴퓨팅 등에 기본적으로 쓰이는 방식입니다. 전체 비트는 부호를 나타내는 sign bit, 소수점의 위치에 대한 정보인 지수부분(exponent), 유효숫자를 표시하는 가수부분(fraction/mantissa) 으로 구성되어 있습니다. 가장 널리쓰이는 표준.. 2012. 8. 20.