본문 바로가기
반응형

전체 글984

ARM vs X86 성능 비교. (Ubuntu) ver.3 http://www.phoronix.com/scan.php?page=article&item=ubuntu_1210_linux35omap4&num=1 http://www.phoronix.com/scan.php?page=article&item=odroid_panda_linaro&num=1 등등 - 아톰 n270 12.10 결과 추가. - OMAP 4460 결과 갱신. - 엑시노스 4412 추가. (ODROID-X) - 기준이 되는 OMAP4460 11.xx 결과가 상승하면서, 전체 수치가 그에 맞춰 변동. - 엑시노스 4412 는 동클럭임에도 테그라3 와 상당한 차이를 보입니다. 우분투 버전이 같다면 테그라3 결과도 꽤나 상승할 것 같은데, 얼마나 될지는 돼봐야 아는거니까요. - 클럭당 성능에서 엑시노스 쿼드.. 2012. 9. 6.
해외판 갤럭시 노트2 스펙. http://www.glbenchmark.com/phonedetails.jsp?benchmark=glpro25&D=Samsung+SGH-I317&testgroup=system 모델명이 SGH-i317 입니다. 모델명으로 보아 미국 AT&T 용인 것으로 보이는데 확실한건 나와봐야 알겠지요. (AT&T 갤럭시 노트가 SGH-i717) 공개 스펙과 동일한 엑시노스 4412 1.6GHz 입니다. 해외판 제품의 AP가 엑시노스라는건 여러가지를 의미합니다. - LTE 지원일텐데, 베이스 밴드칩(BP)으로 삼성 CMC221S 가 사용되었을 것 (삼성 CMC221S (한국판 갤럭시S3 LTE 탑재)) - (국내(한국) 출시 제품 의외에) 미국 판매용으로 추정되는 제품에 자사의 BP 가 사용되었다는건, 해외 출시 제품에.. 2012. 9. 6.
모바일 GPU 성능 비교 v12.9 1. GLbenchmark 2.1 에서 2.5 로 변경했습니다. 이유는 크게 두가지입니다. - 2.1 에 비해 폴리곤 성능이 잘 반영되어있다. - 테스트 결과를 정리하기 쉽다. 단점도 있습니다. - 현재의 대다수 앱의 요구성능이 픽셀 성능 중심이기때문에, 실제 체감 성능 서열과 벤치마크 결과 사이에 차이가 발생할 가능성이 높다. - 안드로이드는 허니컴 이상만 지원하기때문에 테스트 가능한 기기가 크게 줄어듬. 2. 2.1 은 특별한 이유가 없는 한 스펙 분석정도에서나 쓸 생각입니다. 3. 의외로 같은 계열 사이에서는 스펙과 클럭의 차이가 수치적으로 잘 들어맞습니다. 테스트가 무거워져도 맞아야 될건 맞나봅니다. 4. OMAP4470 의 SGX544 가 추가되었습니다. 다른 SGX 계열과 결과를 비교해봤을 때.. 2012. 9. 1.
ARM 부동소수점 연산 성능 비교 v12.9 1. 스냅드래곤S4 Pro 결과를 추가했습니다. 스냅드래곤 S4 에는 Play, Plus, Pro, Prime 의 4가지 라인업이 있고 이번에 추가된건 Pro 입니다만, (APQ8064) Pro 내에서도 듀얼코어, 쿼드코어가 혼재되어 있기때문에 스냅드래곤 S4 듀얼, 쿼드 두가지로 분류해서 표기할 예정. 2. 스냅 S4 쿼드 결과를 보면 스펙대비 굉장히 높게 나옵니다. 최대치를 비교해보면 동클럭 듀얼에 비해 2.9 배 정도. 원래대로면 2배 정도 나와야하는데 말이지요. 이론적 최대치가 24GFLOPS 라서 무슨 수치가 나와도 이상하지 않다고 볼 수도 있긴한데... 린팩 버전이 달라서 그런건지, 구조적으로 다른 이유가 있는건지... 3. 스냅 S4 쿼드의 압도적인 결과때문에 분할된 그래프마다 축 최대값과 .. 2012. 9. 1.
삼성 갤럭시 노트2 디스플레이 분석. 삼성 모바일 언팩 2012 (베를린) 에서 갤럭시 노트2 가 발표되었습니다. 스펙은 미묘합니다. 모든 부분에서 나아진건 사실인데, 그렇게 임팩트를 주는 부분이 있는 것도 아닙니다. 발표 자체도 하드웨어보다는 소프트웨어적인 측면을 강조했지요. - Galaxy Note 2 GT-N7100 - - CPU : 엑시노스 4412, Cortex-A9 기반 1.6GHz 쿼드코어. 갤럭시S3 에 들어간 동종의 AP 클럭이 1.4GHz 였습니다. 갤럭시S3 에 비해 배터리 용량이 커졌기때문에 고클럭 버전이 적용된 것 같기도 합니다. 갤럭시S2 와 갤럭시 노트의 AP 클럭, 배터리 용량 관계도 이와 같았지요. - GPU : Mali-400MP4 533MHz 스펙적인 부분은 이전에 GLBenchmark 에서 다 유출되었습니.. 2012. 8. 30.
GPU 아키텍처별 효율 분석. (4) Nvidia vs AMD 앞서 했던 분석을 토대로 엔비디아와 AMD를 비교해보겠습니다. GPU 아키텍처별 효율 분석. (1) 기초 배경 설명. GPU 아키텍처별 효율 분석. (2) AMD GPU 아키텍처별 효율 분석. (3) Nvidia 일단 3Dmark11 결과가 비슷한 것, 동일 라인업에서 경쟁했던 제품을 비교. 아키텍처에 따라 최대 클럭, 최적 클럭이 다르기때문에 실제 성능을 따지는데 있어서 클럭을 무시할 수는 없습니다. 그래서 AMD와 엔비디아를 비교할 때, 클럭을 반영한 경우도 추가. - GF116 vs Juniper 서로 다른 클럭 상태에서 동일 성능을 보이는 SP수 비율을 계산해보면, (AMD : Nvidia =) 3.6 : 1 (이하 모든 비율은 SFU 포함 기준) 'Juniper 코어가 GF116 코어와 동등한 .. 2012. 8. 29.
GPU 아키텍처별 효율 분석. (3) Nvidia 엔비디아의 GPU에는 초월함수를 처리하는 SFU 유닛이 따로 존재하고, AMD와 다르게 이를 스펙상 SP숫자에 포함시키지 않습니다. 엔비디아 코어끼리의 비교에서는 SFU 숫자를 반영하지 않아도 결과는 달라지지 않습니다만, AMD GPU 와의 비교에서는 반영해야할 것으로 생각됩니다. 그래서 SP + SFU 를 전체 SP 수로 보고 분석할 겁니다. (SFU 반영 전) (SFU 반영 후) - 페르미 이전 코어들은 DirextX 11 을 지원하지 않아서, 3Dmark11 결과 자체가 있을 수 없습니다. - 페르미 GF110 의 SP 수치는 7.13 이 나옵니다. - GF114 는 5.99 를 보입니다. GF110 대비 -6% 입니다. 텍스처 수치가 -25% 인데, 이와 연관이 있을 것으로 생각됩니다. GF114.. 2012. 8. 27.
GPU 아키텍처별 효율 분석. (2) AMD 사전 정보는 이전 포스트 참고. (GPU 아키텍처별 효율 분석. (1) 기초 배경 설명.) 분석은 일단 나타난 지표를 고려해서 점수/(SP x GHz) (1SP가 1GHz 로 동작할 때 점수) 의 최대값을 정해서 각 아키텍처, GPU 별로 비교할겁니다. 최대값을 어떻게 찾느냐. 예시로 한 번 해보겠습니다. (길어서 2개로 분할했습니다.) AMD의 Cape verde 코어 제품의 결과를 모아놓은 것입니다. HD7770 의 결과 4개를 보겠습니다. 일단 메모리 대역폭을 제외한 3항목을 보면, 아래쪽 3개의 수치들은 오차범위에서 비슷한 값을 보이고 있습니다. SP, 텍스처, 픽셀 성능에 비례해서 점수가 잘 나온다는 의미입니다. 오버클럭을 해도 클럭에 비례해서 점수가 나왔다는거지요. 하지만 메모리 대역폭 항목(.. 2012. 8. 27.
GPU 아키텍처별 효율 분석. (1) 기초 배경 설명. 이전에 엔비디아와 AMD의 GPU와 그 연산 성능에 대해 간략히 다뤘습니다. (AMD GPU 부동소수점연산(FLOPS) 계산.) (Nvidia GPU 부동소수점연산(FLOPS) 계산.) (계산한 것은 이론적인 피크치일뿐이고, 게이밍으로 대표되는 일반적인 사용자 환경과는 동떨어진 부분이지만요.) GPU 제조사들은 새로운 GPU를 발표할 때마다, 더 높은 효율의 새로운 아키텍처, 유닛을 홍보합니다. 이번 포스팅에서는, 이런 아키텍처의 차이가 실제 환경에서 어떻게 나타나는지 분석해보고자 합니다. (어떤 결과가 나올지는 모르겠지만...) - 1 - 분석을 위해서는 절대적인 평가 지표가 필요합니다. 이 지표에는 그래픽 카드의 성능을 드러내는 요소가 반영되어야하고요. 여기에 가장 적합한 벤치마크 프로그램이 3Dma.. 2012. 8. 26.
Nvidia GPU 부동소수점연산(FLOPS) 계산. 플롭스(FLOPS) 관련 기초 내용은 이전 포스트 참고. (AMD GPU 부동소수점연산(FLOPS) 계산.) (1) G80/G92 계열 Geforce 8000, Geforce 9000, GT100, 일부 GTX200 계열에 사용. 32비트 단정밀도(Single-Precision) 지원. (Geforce 9000 만 지원) 64비트 배정밀도(Double-Precision) 미지원. G92 는 G80 에서 텍스처 유닛이 강화되고, 공정이 더 미세화되었다는 것 외에는 동일합니다. Geforce 9000 계열이 사골이라고 욕먹는 이유. (이하의 이런 류의 일러스트는 모두 後藤 弘茂(Hiroshige Goto)씨 출처입니다.) G80/G92 코어는 SM(Streaming Multiprocessor) - TPC(T.. 2012. 8. 21.
반응형