엑시노스 5420의 성능 추정을 했으니 실제로 어떤지 봐야겠지요.
(자아비판의 시간 ㄷㄷㄷ)
(
엑시노스 5420 사양. (Exynos5420 spec))
긱벤치 자료가 별로 없어서 못 하고 있었는데 이 정도면 나올만큼 나왔다고 판단됩니다.


- CPU : Cortex-A15 쿼드코어 1.9GHz
스냅드래곤800 2.3GHz, 테그라4 1.9GHz와 경쟁하기위해 1.9GHz가 필요했을 것이라고 추정했습니다.

긱벤치 테스트 결과 링크는 다음과 같습니다.
Exynos 5410 :
http://browser.primatelabs.com/geekbench3/171772
Exynos 5420 : http://browser.primatelabs.com/geekbench3/130434
Tegra4 : http://browser.primatelabs.com/geekbench3/9041
Snapdragon 800 : http://browser.primatelabs.com/geekbench3/226715
Bay Trail (Z3770) : http://browser.primatelabs.com/geekbench3/222439

엑시노스5410 : 싱글 1.8GHz, 멀티 1.6GHz
엑시노스5420 : 싱글 2.1GHz, 멀티 1.9GHz


원래 클럭에서의 정수연산 성능입니다.

엑시노스5410 대비 멀티스레드 클럭이 19% 상승했으나 멀티코어 성능은 11% 밖에 상승하지 않았습니다.
싱글코어에서는 16% 상승해서 클럭 상승(17%)에 어느정도 맞춰주네요.

테그라4, 스냅드래곤800, 베이트레일과 오차범위에서 동급입니다.


정수연산 동클럭 성능입니다.

엑시노스5410 대비 유의미한 정도로 떨어졌습니다.
테그라4와는 동급입니다.
스냅드래곤800과 베이트레일은 안드로이드 환경에서 동클럭 성능이 비슷하네요.




부동소수점 연산 성능은 그렇게 중요하지 않기때문에 그래프만 올리겠습니다.


덤으로 메모리 성능입니다.

엑시노스5410 대비 10% 정도 향상되었습니다.
현재 제품화 된 엑시노스5410/5420의 메모리 대역폭이 동일하다는걸 생각하면 의미가 있어보입니다.

눈에 띄는건 스냅드래곤800, 베이트레일과의 격차입니다.
지원 사양상 메모리 대역폭이 아무리 차이가 나도 스냅드래곤과는 17%, 베이트레일과는 33% 차이가 납니다.
일단 베이트레일 테스트에 사용된 제품의 메모리 사양을 알 수는 없지만 좋게 해석해서 최대 지원 대역폭이라면 메모리 인터페이스 버스 효율은 엑시노스와 비슷합니다.
하지만 스냅드래곤은 경우가 다릅니다.
50% 가까운 차이는 지원 대역폭의 차이로 설명하기에는 너무 크지요.
게다가 제가 알고있기로는 엑시노스5420, 스냅드래곤800의 테스트에 사용된 제품의 메모리 사양은 동일합니다.
테그라4도 엑시노스와 비슷한 것으로 보아 Cortex-A15와 Krait 400의 메모리 인터페이스 방식에 차이가 있는듯 합니다.


- GPU : Mali-T628MP6 700MHz 533MHz
GLBenchmark 2.7 T-Rex Offscreen 기준으로 29.1 fps를 예상했습니다.


(GLBenchmark 2.7 T-Rex Offscreen 최대값.)
갤럭시노트3 26.7 fps
갤럭시노트10.1 23.1 fps

예상이 틀렸네요.
18% 정도의 효율 상승을 예상했는데 그 부분이 사족이 되었습니다.
나중에 어떻게 최적화라는 이름으로 반영될지 모르겠지만 현재로는 예상이 틀렸네요.

두 제품의 결과가 다른데 클럭 차이때문인 것으로 보입니다.
갤럭시노트3는 700MHz 533MHz이고, 갤럭시노트10.1은 600MHz 460MHz로 보입니다.
결과 차이 15.6 - 클럭차이 15.9%


텍셀 결과도 비슷합니다.

결과 차이 16.7% - 클럭차이 15.9%


트라이앵글 성능은 92 Mtri/s로 예상했는데 600MHz 460MHz 결과와 맞네요.
결과 차이 8.7% - 클럭차이 15.9%


(GLBenchmark 2.7 T-Rex Offscreen 최대값.)
G6430 450MHz (애플 A7), Adreno330 550MHz (스냅드래곤800)와 비슷한 성능입니다.
테그라4는 완전히 밀렸다고 봐야하나요.

벤치마크에서 동급이지만 실사용 환경에서 동급이라는 의미는 아닙니다.
발열을 고려했을 때, AP의 소비전력에 한계가 있기때문입니다.
보통 스마트폰은 3W, 태블릿은 크기에 따라 4.5~6W 정도로 보고 있습니다.
(
http://news.mydrivers.com/1/265/265069.htm)
그렇다면 저 소비전력 범위 내에서 얼마나 성능을 낼 수 있느냐가 관건인데, CPU 로드와 GPU 로드가 동시에 최대로 걸리는 상황은 거의 없습니다.
CPU 로드 상황과 GPU 로드 상황을 구분해서 생각해도 됩니다.

우선 CPU는 크게 문제가 되지 않습니다.
산술적으로 CPU 로드시 소비전력이 최대 4.5~5.5W (쿼드코어)에 이르는데 작업 특성상 CPU 로드가 장시간 지속되는 경우가 거의 없습니다.
최대부하가 순간적으로 걸리기때문에 (소위 말하는 쓰로틀링으로 인한) 성능 손실은 적은 편입니다. 

문제는 GPU 로드입니다.
가장 대표적인 예인 3D 게임을 생각하면 알 수 있듯이 작업 내내 로드가 지속됩니다.
3D 게임같이 GPU 로드가 심한 경우 CPU의 소비전력은 0.8~1W 수준입니다.
스마트폰의 경우를 보면, 한계가 3W라고 했으니 GPU의 한계 소비전력은 2~2.2W가 됩니다.
결국 우리가 실사용에서 경험하는 GPU의 성능은 GPU의 최대 성능이 아닌 2W 정도의 소비전력 조건하에서 나오는 성능인겁니다.
그런데 2W 조건에서 GPU 성능은 측정장비를 사용하지 않는 이상 알 수가 없지요.
게다가 GLBenchmark에서는 쓰로틀링 해제 혹은 클럭 고정 기능을 하는 (소위 말하는) 부스트 코드가 적용되었다는 의혹이 있기때문에 GLBenchmark의 결과로도 실사용시 결과를 유추할 수 없습니다.

현재 상황에서 결론을 내보면, '최대성능은 비슷하나 실사용시 성능 우열은 미지수'


- 정리
CPU : 엑시노스5420 1.9GHz와 스냅드래곤800 2.3GHz는 동급.
GPU : Mali-T628 700MHz 533MHz의 최대성능은
         G6430 450MHz (애플 A7), Adreno330 550MHz (스냅드래곤 800)와 동급.

         실사용시 성능 우열은 미지수.


- 2014.01.15 GPU 클럭 수정.
(
엑시노스5420 Mali-T628MP6 클럭 정보 정정.)


- 2014.01.27. 클럭당성능 재계산.


 

Posted by gamma0burst Trackback 0 : Comment 27

댓글을 달아 주세요

  1. addr | edit/del | reply 날라차기 2013.11.30 03:00

    워 이런 시간에 글을 올리시다니. 부지런하십니다.

  2. addr | edit/del | reply ㅁㅁ 2013.11.30 08:45

    성능 별로 차이안난다고 게속 애기하고 다녀도
    오로지 스냅 짱짱맨 만외치는 이유가 뭘까요 아주 그냥 쓰레기 취급하던데

  3. addr | edit/del | reply 흡혈귀왕 2013.12.01 08:04

    요즘 인텔 내장 그래픽쪽에 관심을 가지고 DX벤치마크라던가 퓨처마크라던가
    찾아보며 대조하면
    하스웰 기준에서 최하위인 HD5000 성능이 벤치마크대로라면
    지포스 GT630M과 비슷하고

    아이리스 5200 Pro가 부동소수점연산은 지포스GTX650과 비슷할정도로
    진짜 성능업이 많이 됬더군요
    픽셀,텍셀,지오매트리도 로우레벨 벤치로보면 진짜 크게 향상됬는데

    정작 그에 상응하는 게이밍성능이 안나와서 참 그렇더군요...
    드라이버와 최적화 문제때문인지..
    인텔 내장 그래픽에 최적화된 게임들은 정말 억수로 잘돌리는거 보면
    최적화와 드라이버탓이 맞는듯하더군요....

    이걸보면 벤치랑 실사는 확실히 다른듯하네요...
    아이리스 5200도 벤치자체만 놓고보면 GT650M 급이라 나오니..ㅎㄷㄷ(퓨처, DX)

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2013.12.01 17:52 신고

      메모리 대역폭 부족때문일 가능성도 있습니다.
      3D마크같은건 진짜 순수 쉐이더 성능(연산성능이라고 봐도 됩니다.)만으로 점수가 잘 나오거든요.
      쉐이더 성능에 비례해서 점수가 나올정도니까요.
      11부터는 CPU 성능 부족으로 인한 병목까지 없어졌고요.
      그만큼 실제 게임성능과 차이가 생겼다고 봐야할겁니다.

      물론 최적화해주는 게임이 없는데다가 드라이버까지 발적화라는건 분명한 사실.

  4. addr | edit/del | reply 익명 2013.12.02 23:57

    항상 좋은정보 감사합니다
    t628 성능좋네요... 실성능은 스냅에 밀릴려나요?

  5. addr | edit/del | reply ㅁㅁ 2013.12.04 22:13

    근데 저 말리T628왜 오프스크린은 81프레임인데
    온스크린은 10프레임이상 떨어지는거지 ㄷㄷ

  6. addr | edit/del | reply ㅐㅐ 2013.12.05 08:35

    언제나 감사합니다.
    수납용은 언제까지 현역일지 ㄷㄷ

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2013.12.05 22:35 신고

      내년 하반기부터 고비가 오지않을까 싶습니다.
      순수 AP 성능측면에서도 따라잡히거나 역전될 가능성이 있고, 통신부분에서도 Cat.6 지원이 LTE-A 때 처럼 독보적으로 치고나갈 수 있는지가 관건이 될듯.

  7. addr | edit/del | reply 2013.12.07 12:05

    그럼 오차범위네에서 mali t628 700과 adreno330 550 이 동급이군요. 그럼 mali400 530 과 adren320 400도 오차범위네에서 텍셀성능이 동급인가요

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2013.12.07 20:33 신고

      최대치만 보면 전자가 900 Mtex/s 정도고 후자가 1000 Mtex/s 정도되어서 오차범위따져도 동급이라 보기 힘든데, 평균치나 중간치로 보면 오차범위 동급이라고 볼 수도 있습니다.

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2013.12.07 22:08 신고

      GFXbench 로우벤치 결과보고 말한겁니다.
      애플 A7은 3464 Mtex/s로 나옵니다.

  8. addr | edit/del | reply 미르 2013.12.08 01:54

    삼성이 독자설계와 14나노로 전력소비부분을 해결해야겠네요
    갤럭시s4 상황이 삼성에게 장기적으로 도움이될겁니다

  9. addr | edit/del | reply ㅁㄴ 2013.12.08 11:47

    이제..... 체리트레일 예측해 보실레요? ㅋ

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2013.12.08 18:46 신고

      베이트레일하고 비교하면......
      지금까지 나온 정보로 봐서는 CPU 성능은 클럭상승만큼이겠네요.
      그래픽 성능은 최소 2배. 클럭이 오른다면 그보다 더 높겠고요.

  10. addr | edit/del | reply ㅁㅁ 2013.12.08 14:21

    엑시노스 5420이 안투투에서 유독 달빅점수가 낮던데

    그건 왜그럴까요

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2013.12.08 18:47 신고

      그러게요.
      왜 그럴까요.
      안투투 달빅 테스트가 어떤 종류의 연산을 하는지 알 수가 없으니 모르겠네요.

    • addr | edit/del ㅁㅁ 2013.12.08 21:06

      아무래도 버그이거나
      종특일려나요?
      5410도 그정도 점수만 나오는건지...

      5410이랑5420의달빅성능은 같고 나머지는 5420이 뛰어나다던가...

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2013.12.08 21:59 신고

      스냅드래곤 외의 다른 AP를 사용하는 제품에서도 달빅 점수가 낮다면 스냅드래곤이 그 부분에서 강한거겠지요.
      그렇지 않다면 엑시노스가 약한거겠고요.

  11. addr | edit/del | reply 테그라크4 2014.01.16 01:01

    테그라4가 벌써 밀리다니 ㄷ
    죄송한데 테그라4의 텍셀치 와 버텍스치를 알려주세요..

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2014.01.16 20:16 신고

      정확히는 모르겠지만 이런듯 합니다.
      텍셀 : 2.7 Gtex/s @ 627MHz
      버텍스 : 336 Mtri/s @ 672MHz

  12. addr | edit/del | reply BlogIcon ㅇ.ㅇ 2014.04.22 09:19

    엑시5410은 hmp지원 아예 안되나요?
    5420도 마찬가지 ??

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2014.04.23 00:47 신고

      5420이 HMP를 지원하는 것과 5420 탑재 제품이 HMP를 지원하는건 다른 문제라고 봐야할듯 합니다.
      전자는 기술적으로 가능할듯한데 (실제로 시연도 했지요.) 후자는 좀 어렵다고 봅니다.