본문 바로가기
반응형

전체 글984

AMD GPU 부동소수점연산(FLOPS) 계산. FLOPS (FLoating point OPeration per Second, 플롭스) 는 초당 부동소수전 연산 횟수라는 뜻으로, 컴퓨터의 성능을 평가하는 가장 대표적인 지표입니다. 슈퍼컴퓨팅 등에서는 절대적인 성능 지표이고, 개인용 컴퓨터에 있어서도 (플롭스가 체감성능으로 이어지는 것은 아니지만) 성능 평가에 있어서 참고가 됩니다. 부동소수점은 실수를 표시할 때, 소수점을 고정하지 않고, 소수점의 위치를 따로 표기하는 방식으로 복잡한 연산이 필요한 슈퍼컴퓨팅 등에 기본적으로 쓰이는 방식입니다. 전체 비트는 부호를 나타내는 sign bit, 소수점의 위치에 대한 정보인 지수부분(exponent), 유효숫자를 표시하는 가수부분(fraction/mantissa) 으로 구성되어 있습니다. 가장 널리쓰이는 표준.. 2012. 8. 20.
반도체 강좌. (3) 에너지 밴드 차원에서의 반도체 해석. 오랜만입니다. 보는 분이 있을지 모르겠지만, 어쨌든 이전 편에서는 도핑, 캐리어, intrinsic 반도체, extrinsic 반도체에 대해 다뤘습니다. 이번 편에서는 앞서 다뤘던 요소들이 에너지 밴드 차원에서는 어떻게 나타나는지 다뤄보겠습니다. 앞서 다룬 내용이 바탕이 되기때문에 잘 모르겠으면 이전 편을 참고. (반도체 강좌. (2) 반도체와 캐리어.) (1) 에너지 준위에 따른 전자의 분포와 페르미 준위. (Fermi level) 반도체에서의 전류를 예측, 계산하기위해서는 캐리어의 농도를 알아야합니다. 캐리어의 농도는 Conduction band(이하, 컨덕션 밴드)에 존재하는 전자의 농도와 관련이 있기때문에 주어진 조건에서 컨덕션 밴드에 전자가 얼마나 있는지를 계산해야합니다. 전자니 홀이니 하는 것.. 2012. 8. 15.
엑시노스 5250 GPU 및 Mali-T604 분석. 간만에 소설 한 번 써보겠습니다. 소설이라함은 제가 확신을 가질 수 없는 부분이 몇 가지 존재하기때문입니다. 제 정보력과 능력 하에서 나올 수 있는 최선의 결론으로, 아마 틀리는 부분도 있고 맞는 부분도 있을겁니다. 이런 점 염두하고 보셨으면 합니다. - 얼마 전에 엑시노스 5250 의 화이트페이퍼가 공개되었습니다. (삼성 엑시노스 5250 (Exynos 5250) 세부스펙 공개.) GPU로 Mali-T604 가 탑재되는 것으로 나와있지요. ARM의 1세대 Mali-T600 시리즈의 IP가 발표된지는 꽤 오래되었지만, 실제 제품화가 다가오는건 이번이 처음입니다. 구조적으로 이전 세대와 크게 변화하기때문에 구체적인 구조, 성능, 스펙이 정확하게 밝혀지지 않은 상태이기도 합니다. 이제까지 ARM, 삼성 등이.. 2012. 8. 14.
Mali-400 이후 차기 ARM GPU 라인업. - Mali-450 MP Mali-400 MP 2개 붙인겁니다. 최대 버텍스 쉐이더 2 + 픽셀 쉐이더 8 ARM에서 이름붙이는 식이면 8코어까지 가능한겁니다. Mali-450MP8 개인적으로 이게 실제 나올지는 의문. 중국이나 대만의 저가형 AP에서는 가능할지도 모르겠습니다. 104 Mtri/s, 3.84 Gpix/s @ 480MHz - Mali-T600 맨 끝의 숫자는 코어개수로 이런 명명법은 이하 Mali-T600 라인업에 공통적으로 적용되는 것입니다. Mali-T600 부터는 Mali-400MP 와 같은 버텍스, 픽셀 쉐이더가 분리된 구조가 아닌 통합쉐이더 구조입니다. 이 통합쉐이더(쉐이더 프로세서)의 개수를 코어개수로 셉니다. 1. Mali-T60x (1세대 Mali-T600) Mali-T60x.. 2012. 8. 11.
삼성 엑시노스 5250 (Exynos 5250) 세부스펙 공개. http://www.samsung.com/global/business/semiconductor/minisite/Exynos/blog_Enjoy_the_Ultimate_WQXGA_Solution_with_Exynos_5Dual.html 엑시노스 5250 의 세부 스펙이 공개되었습니다. - 삼성 32nm LP HKMG 공정 32nm 를 건너뛰고 28nm 공정으로 나오는게 아닌가 하는 생각도 했는데, 32nm 공정으로 나옵니다. HKMG 공정이 얼마나 강력한지는 이전 포스트를 참고. (ISSCC에서 엑시노스의 32nm 공정 개요 발표) TSMC가 28nm의 더 낮은 공정이라하더라도 모바일용 제품을 생산하는데는 전통적인 Poly-Si/SiON 공정을 사용하기때문에 삼성의 공정쪽이 소비전력 측면에서는 더 우수합니.. 2012. 8. 10.
모바일 AP 둘러보기. (6) 국내에 그다지 알려지지 않은 AP들. 스마트폰, 태블릿에 들아가는 AP 그러면 보통 퀄컴, 삼성, 엔비디아, TI 정도가 알려져있지만, 그 외에도 다수의 업체들이 AP를 생산하고 있습니다. 국내에 잘 알려지지 않은 AP들을 알아보겠습니다. 1. Marvell Marvell 은 별로 알려져있지도 않고, 그나마 관심이 있는 사람들에게는 SSD, HDD 컨트롤러 제조사정도로 알려져있습니다만, 사실 AP 설계 역사는 짧지않은 편입니다. 인텔은 Xscale 이라는 ARM기반 프로세서 사업을 하고 있었는데, 2006년 커뮤니케이션 및 애플리케이션 프로세서 사업부를 6억달러에 마벨에 매각합니다. 초기에는 Xscale 이란 이름대신 PXA 라는 이름을 사용하고(하지만 동일한 ARMv5/Xscale 기반) , 이후로는 Marvell Sheeva 라는 자체 .. 2012. 8. 10.
GLBenchmark 2.5 등장 : GLBenchmark 2.1 에서의 변화점. http://www.glbenchmark.com/index.jsp GLBenchmark 2.1 은 OpenGL 기반 GPU 성능 테스트 애플리케이션입니다. Offscreen 모드를 통해 제품마다 해상도가 다르다는 변수를 해결한 유일한(맞나?) 벤치마크 앱으로, GPU 성능의 절대 평가가 가능한 유일한 앱이라고 볼 수 있습니다. 720p 해상도를 지원했지만, 폭발적으로 향상되는 GPU 성능으로 인해 수직동기화 프레임(60fps)을 넘어서는 GPU가 많아졌습니다. 게다가 720p 이상의 고해상도를 지원하는 제품들이 속속 출시되기도 했습니다. 또한 픽셀성능 위주의 프레임 산출방식으로 인해 버텍스 성능을 제대로 반영하지 못하는 문제도 있었습니다. GLBenchmark 2.1 의 벤치마크앱으로서의 수명이 다해간겁.. 2012. 8. 2.
모바일 GPU 성능 비교 v12.8 1. Allwinner A10, Mali-400MP4 266MHz 이 크게 향상되었습니다. 2. RK3066 과 비교를 통해 엑시노스4412 Mali-400MP4 를 400MHz 로 수정했습니다. 3. GLBenchmark 2.5 테스트가 나오기 시작했습니다. 이미 결과에 대한 정리가 들어갔으나, 초기에 급격하게 결과가 증가하는지라 공식적으로 정리해서 포스트하기에는 무리가 있어보입니다. 기존 강자였던 Mali-400MP, SGX543MP 계열의 몰락이라 칭하는 분도 있던데, 일단 그건 아니라는게 제 생각입니다. GLBenchmark 2.5 에 대한건 조만간 내용을 정리해서 따로 올리겠습니다. - v12.8 1. 수정항목 - SGX531 을 고클럭, 저클럭으로 분류. 이것은 구체적인 클럭을 알수는 없지만 .. 2012. 8. 2.
ARM 부동소수점 연산 성능 비교 v12.8 1. 테그라3 T33 멀티스레드 결과는 표본이 부족한 상태이기때문에 좀 더 지켜봐야할 것 같습니다. 상식적으로도 같은 제품에 클럭만 낮은 T30 보다 결과가 낮게 나오는게 정상은 아니겠지요. 2. 데이터가 쌓이다보니, 엑시노스4 쿼드와 스냅드래곤 S4 의 클럭당 성능이 거의 동급이 되었습니다. 엑시노스4 쿼드 결과가 상승한 것도 있지만, 스냅드래곤 S4 1.2GHz 결과가 클럭대비 저조한 것도 영향이 있습니다. 3. 클럭만 다른 테그라3 의 클럭당 성능이 제각각인건 아무래도 전반적으로 결과가 부족해서 평균값이 안정화되지 않은 탓이 커보입니다. 이는 멀티스레드 결과, 멀티코어 효율에 영향을 끼칩니다. 4. 스냅드래곤 S4 쿼드 APQ8064 (MDP) 결과가 몇개 나오기는 했는데, 400~600 으로 들쭉.. 2012. 8. 1.
소니 PS 비타 프로세서에 Wide I/O 메모리 사용. http://www.chipworks.com/en/technical-competitive-analysis/resources/technology-blog/2012/07/sony%E2%80%99s-ps-vita-uses-chip-on-chip-sip-%E2%80%93-3d-but-not-3d/ - 소니 PS 비타에 탑재된 프로세서 (CXD5315GG) CPU - Cortex-A9 쿼드코어 (1코어 OS용, 3코어 게임용) GPU - SGX543MP4+ 메인 메모리 - 512MB 그래픽 메모리 - 128MB 측면 엑스레이 사진. 아래부터 5개 층이 있습니다. 최하층과 두 번째층은 솔더 볼(Solder ball)로 연결되어 있고, 세 번째층과 다섯 번째층은 와이어로 연결되어 있습니다. 사이를 띄우기 위한 층으로.. 2012. 7. 24.
반응형