본문 바로가기
반응형

부동소수점연산12

ARM 부동소수점 연산 성능 비교 v13.1 1. 스냅드래곤 S3 1.7GHz 이상하게 높게 나옵니다. 쓰는 제품도 거의 없습니다. 다른 결과를 기다려봐야겠네요. 2. Rockchip RK3066 클럭을 생각하면 특별히 좋다고 볼 수 없지만 무난합니다. 3. 스로틀링때문에 제 성능 안 나오는 경우가 있는데, (특히 쿼드코어) 린팩도 그런 영향을 받을지도 모르겠네요. v13.1 1. 스냅드래곤S3 1.7GHz 추가. 2. Rockchip RK3066 추가. 3. U8500 수정 -> U8500/U8420 2013. 1. 2.
ARM 부동소수점 연산 성능 비교 v12.12 1. 스냅드래곤S4 쿼드 결과는 상당히 들쭉날쭉합니다. 간간히 스냅드래곤S4 듀얼과 비슷한 수준의 결과들도 있는데, 아직까지는 전체 데이터 중에서 비중이 낮아서 크게 의미를 부여하기 어렵습니다. 2. 엑시노스5 듀얼 멀티스레드 성능은 예상에서 크게 벗어납니다. Cortex-A15 에 아직 최적화가 안 된 린팩 탓인가, 원래 효율이 그 정도인건가. 3. 테그라3 데이터를 대대적으로 정리했습니다. 수준 이하의 데이터를 다 빼버렸는데, 기준을 높였더니 거의 반이 없어져버렸습니다. 덕분에 전반적으로 수치도 올라가고, 멀티코어 효율도 올라갔습니다. 4. Hisilicon K3V2 를 Huawei K3V2 로 변경. K3V2 는 화웨이 산하의 Hisilicon 에서 생산합니다. Hisilicon Hi3620 혹은 .. 2012. 12. 2.
ARM 부동소수점 연산 성능 비교 v12.11 큰일 하나 넘겨서 오랜만에 포스팅입니다. 1. 넥서스10 테스트 결과 추가되었습니다. 엑시노스 5250 의 테스트 결과지만, 출처 사이트의 테스트 결과 성향을 봤을 때, 평균보다 낮게 나왔을 가능성이 있습니다. 다양한 결과가 추가되는걸 보고 성능에 대해 얘기할 수 있을듯 합니다. 2. 테그라3 는 스마트폰용, 태블릿용으로 분류되고 그 안에서도 CPU 클럭, GPU 클럭 구성에 따라 다양하게 나눠져서, 모델명 표시는 폐기하고, 클럭에 따라 나눴습니다. 3. K3V2 결과 추가되었습니다. 클럭 대비 결과가 상당히 안 좋습니다. 물론 부동소수점 연산 성능만을 놓고 전체 성능을 논할 수 없습니다. 4. Cortex-A5 기반 스냅드래곤 S4 결과 추가되었습니다. 저가형, 저전력 아키텍처면서도 듀얼코어. 5. 엑.. 2012. 11. 3.
ARM 부동소수점 연산 성능 비교 v12.10 1. 스냅드래곤S4 쿼드코어 싱글스레드 결과 추가. 대체 뭔 짓을 해놨길레, 같은 기반인데 싱글스레드가 두 배씩 나오는건지. 2코어가 싱글처럼 동작하는가 싶기도 한데, 멀티스레드 결과보면 또 그건 아닌거 같고... 멀티스레드 결과가 400~600 사이의 넓은 분포를 보이고 있으니, 테스트 결과가 누적되면 어떻게든 결론이 나겠지요. 2. 싱글스레드 그래프 분할. 스냅드래곤S4 쿼드가 200 가까이 찍어주니 결과낮은 애들은 잘 표시도 안 됩니다. 3. 데이터가 많아지니까 T30, T30L 은 어느 정도 비슷하게 맞아가는데, 데이터가 부족한 T33 은 아직도 멀었나봅니다. 4. 스냅드래곤S4 쿼드코어 효율이 2.72 결과끼리 조합해서 최대한 좋게 계산해도 3.2 정도입니다. 엑시노스4 쿼드 결과를 봐도 그렇고.. 2012. 9. 29.
ARM 부동소수점 연산 성능 비교 v12.9 1. 스냅드래곤S4 Pro 결과를 추가했습니다. 스냅드래곤 S4 에는 Play, Plus, Pro, Prime 의 4가지 라인업이 있고 이번에 추가된건 Pro 입니다만, (APQ8064) Pro 내에서도 듀얼코어, 쿼드코어가 혼재되어 있기때문에 스냅드래곤 S4 듀얼, 쿼드 두가지로 분류해서 표기할 예정. 2. 스냅 S4 쿼드 결과를 보면 스펙대비 굉장히 높게 나옵니다. 최대치를 비교해보면 동클럭 듀얼에 비해 2.9 배 정도. 원래대로면 2배 정도 나와야하는데 말이지요. 이론적 최대치가 24GFLOPS 라서 무슨 수치가 나와도 이상하지 않다고 볼 수도 있긴한데... 린팩 버전이 달라서 그런건지, 구조적으로 다른 이유가 있는건지... 3. 스냅 S4 쿼드의 압도적인 결과때문에 분할된 그래프마다 축 최대값과 .. 2012. 9. 1.
Nvidia GPU 부동소수점연산(FLOPS) 계산. 플롭스(FLOPS) 관련 기초 내용은 이전 포스트 참고. (AMD GPU 부동소수점연산(FLOPS) 계산.) (1) G80/G92 계열 Geforce 8000, Geforce 9000, GT100, 일부 GTX200 계열에 사용. 32비트 단정밀도(Single-Precision) 지원. (Geforce 9000 만 지원) 64비트 배정밀도(Double-Precision) 미지원. G92 는 G80 에서 텍스처 유닛이 강화되고, 공정이 더 미세화되었다는 것 외에는 동일합니다. Geforce 9000 계열이 사골이라고 욕먹는 이유. (이하의 이런 류의 일러스트는 모두 後藤 弘茂(Hiroshige Goto)씨 출처입니다.) G80/G92 코어는 SM(Streaming Multiprocessor) - TPC(T.. 2012. 8. 21.
AMD GPU 부동소수점연산(FLOPS) 계산. FLOPS (FLoating point OPeration per Second, 플롭스) 는 초당 부동소수전 연산 횟수라는 뜻으로, 컴퓨터의 성능을 평가하는 가장 대표적인 지표입니다. 슈퍼컴퓨팅 등에서는 절대적인 성능 지표이고, 개인용 컴퓨터에 있어서도 (플롭스가 체감성능으로 이어지는 것은 아니지만) 성능 평가에 있어서 참고가 됩니다. 부동소수점은 실수를 표시할 때, 소수점을 고정하지 않고, 소수점의 위치를 따로 표기하는 방식으로 복잡한 연산이 필요한 슈퍼컴퓨팅 등에 기본적으로 쓰이는 방식입니다. 전체 비트는 부호를 나타내는 sign bit, 소수점의 위치에 대한 정보인 지수부분(exponent), 유효숫자를 표시하는 가수부분(fraction/mantissa) 으로 구성되어 있습니다. 가장 널리쓰이는 표준.. 2012. 8. 20.
ARM 부동소수점 연산 성능 비교 v12.7 #hottrendsContainer{display:none !important;}- v12.1 변경점1. 80여개이던 자료수가 200여개로 늘었습니다. 추가적인 리뷰로 인해 한자리 수의 증가는 있겠지만, 새로운 스마트폰 리뷰 사이트가 발견되지 않는한 이번처럼 급증하는 일은 없을 것으로 보입니다.2. 버전표시.12.1 은 12년 1월 기준이라는 얘기입니다.카탈리스트 방식을 따왔습니다.특별한 추가 자료가 없는한 갱신은 없습니다.3. ARM11, Cortex-A5 추가.Cortex-A5 는 저가형 스냅드래곤(싱글코어)에 제법 많이 사용되고 있습니다.4. 1GHz 기준 멀티스레드 성능 차트 추가.5. 싱글, 멀티스레드 간의 비율을 활용하여 .. 2012. 7. 1.
ARM 부동소수점 연산 성능 비교 v12.6 #hottrendsContainer{display:none !important;}- v12.1 변경점1. 80여개이던 자료수가 200여개로 늘었습니다. 추가적인 리뷰로 인해 한자리 수의 증가는 있겠지만, 새로운 스마트폰 리뷰 사이트가 발견되지 않는한 이번처럼 급증하는 일은 없을 것으로 보입니다.2. 버전표시.12.1 은 12년 1월 기준이라는 얘기입니다.카탈리스트 방식을 따왔습니다.특별한 추가 자료가 없는한 갱신은 없습니다.3. ARM11, Cortex-A5 추가.Cortex-A5 는 저가형 스냅드래곤(싱글코어)에 제법 많이 사용되고 있습니다.4. 1GHz 기준 멀티스레드 성능 차트 추가.5. 싱글, 멀티스레드 간의 비율을 활용하.. 2012. 6. 1.
ARM 부동소수점 연산 성능 비교 v12.4 #hottrendsContainer{display:none !important;}하필이면 말일에 모니터가 고장나는 바람에 이제야 올립니다.4일동안 사이트 순회를 못 하니, 감당을 못할 정도로 업데이트가 많더군요. -_-;;- v12.1 변경점1. 80여개이던 자료수가 200여개로 늘었습니다. 추가적인 리뷰로 인해 한자리 수의 증가는 있겠지만, 새로운 스마트폰 리뷰 사이트가 발견되지 않는한 이번처럼 급증하는 일은 없을 것으로 보입니다.2. 버전표시.12.1 은 12년 1월 기준이라는 얘기입니다.카탈리스트 방식을 따왔습니다.특별한 추가 자료가 없는한 갱신은 없습니다.3. ARM11, Cortex-A5 추가.Cortex-A5 는.. 2012. 4. 5.
반응형