엑시노스5420의 기본적인 사양은 이미 밝혀졌습니다.
(
삼성 엑시노스 5420 (Exynos 5420))
사양과 관련된 구체적이고 자잘한 얘기를 해볼까 합니다.
얘기 특성상 그림, 사진은 거의 없습니다.


- 달라진 CPU 클럭.
기존에 1.8GHz로 알려졌던 CPU 클럭이 갤럭시노트3 발표와 함께 1.9GHz로 바뀌었습니다.
이는 일단 기존 제품에 대한 경쟁력 확보 차원에서 클럭을 올린 것으로 보입니다.
실제 1.6GHz인 엑시노스5410은 스냅드래곤800 2.3GHz 대비 17% 정도 낮은 성능을 보이고, 테그라4 1.9GHz 대비 20% 정도 낮은 성능을 보입니다. (정수연산 기준.)
(
긱벤치3를 통한 베이트레일 성능 비교.)
테그라4 1.9GHz는 쿨링팬의 은혜를 입은 성능이라지만 어찌됐든 성능이 높은건 사실.
태블릿 등에 들어간 1.8GHz 기준이라도 산술적으로 16% 정도 높은 성능을 보입니다.
종합하면 경쟁 제품이 20% 정도 높은 성능이라는 것.
이를 극복하려면 1.6GHz 대비 20% 이상 높은 클럭이 필요합니다.
1.6GHz x 1.2배 = 1.9GHz 라는 수치가 나오지요.


- GPU 클럭과 성능.
GPU 종류는 Mali-T628MP6 으로 확인되었습니다만 클럭은 불명입니다.
여기서 예전의 틀린 예측을 다시 한번 꺼내들어볼까요.
(
엑시노스 5420 사양. (Exynos5420 spec))
코드를 근거로 Mali-T604 700MHz라고 추측했었지요.
달리보면 종류는 틀렸지만 클럭은 아직 유효합니다.
700MHz를 부정할 방법은 무수히 많지만 그렇게되면 클럭은 미궁에 빠지겠지요.
무리가 있지만 700MHz가 타당한 클럭인지 근거를 찾아보겠습니다.

일단 경쟁 제품보다 성능이 높아야겠지요.
현재 경쟁제품이라하면 Adreno330, 테그라4 정도.
GL벤치마크 2.7 T-Rex 오프스크린 기준으로
Adreno330 550MHz - 26.4 fps
Tegra4 672MHz - 24.3 fps

Mali-T604 533MHz - 12.5 fps
이걸 근거로 계산해보지요.
Mlali-T628MP6은 Mali-T604 대비 사양은 1.5배, 클럭은 1.3배입니다.
곱하면 약 1.97배지요.

ARM 자료에 따르면 T62x는 T60x 와 비교해서,
50% 성능 향상 or 동일면적에서 전성비 향상.
(동일전력에서) 27% 클럭 상승, 24% 면적 감소, (동일성능에서) 19% 전력 감소 라고 합니다.
27% 클럭상승에 50% 성능향상이면 효율은 18% 정도 올라갔다고 계산할 수 있습니다.

사양 1.5배 x 클럭 1.31배 x 효율상승 1.18배 = 2.33배 -> 29.1 fps

그런데 엑시노스5410의 테스트 결과는 12.6 fps이고 삼성은 엑시노스5420의 그래픽 성능을 엑시노스5410의
2.3배라고 밝혔습니다.

12.6 fps x 2.3배 = 29.0 fps
너무 잘 들어맞네요.

이 클럭을 근거로 구체적인 이론성능을 뽑아보겠습니다.
픽셀성능과 연산성능은 간단히 나오니까 과정은 생략하겠습니다.

트라이앵글 성능이 불명인데 이전 제품을 토대로 추측해보겠습니다.
비교하는데 Mali-400보다는 비슷한 타입의 통합쉐이더 방식 제품이 적합하겠지요.
엑시노스5410을 쓰겠습니다.
SGX544MP3 533MHz : 267 Mtriangles/s -> GL벤치마크 결과 : 41 Mtriangles/s
실성능은 이론성능의 약 15% 수준입니다.
Mali-T604 533MHz의 GL벤치마크 결과는 평균 45 Mtriangles/s 입니다.
실성능과 이론성능의 비율이 같다면 Mali-T604 533MHz의 이론성능은 300 Mtriangles/s입니다.

대게 트라이앵글 성능은 클럭과 연산유닛 수를 곱한 값에 대해 비례 관계를 갖습니다.
SGX5 계열의 경우 비율이 1:12 (1/12) 입니다.
SGX544MP3 533MHz -> 533MHz x 6 / 12 = 266.5 Mtris/s
Mali-T604의 경우, 위의 가정이 맞다면 가장 가까운 정수 비율은 1:7 (1/7) 입니다.
이 비율을 Mali-T628MP6 700MHz에 대입하면 이론성능은 600 Mtris/s 가 나옵니다.
GL벤치마크에서는 92 Mtris/s 정도 나올듯.

Mali-T628MP6 700MHz면 이론성능은 다음 정도 되겠네요.
600 Mtriangles/s
4.2 Gpixels/s
142.8 GFLOPS


- 어떻게 클럭을 올렸는가.
CPU클럭은 0.1GHz 올라갔고 GPU클럭은 사양대비 상당한 고클럭입니다.
클럭상승은 소비전력 증가를 수반할 수 밖에 없는데 이런 선택을 했다는 것은 뭔가 믿는 구석이 있다는거겠지요.

우선 CPU부터 보겠습니다.
엑시노스5420은 갤럭시노트3에 들어간다고 하지요.
그 말은 갤럭시S4에 들어간 엑시노스5410과 비교해서 CPU 소비전력의 차이가 거의 없다는 얘기로 볼 수 있습니다.
클럭이 1.6GHz에서 1.9GHz로 18.8% 올라갔습니다.
이 클럭증가 = 소비전력증가 를 상쇄하기 위해서는 클럭당소비전력(W/Hz)이 18.8% 감소해야 합니다.
넉넉히 잡아서 18% 정도 클럭당소비전력이 개선되었다고 볼 수 있겠네요.

GPU를 볼까요.
엑시노스5410 대비 성능이 2.3배나 올라갔습니다.
아무리 신의 최적화가 이루어진다한들 같은 28nm 공정 사이에서 성능대비소비전력이 2.3배나 개선될 수는 없습니다.
소비전력 증가는 피할 수 없다는겁니다.
그렇다면 관건은 소비전력 증가를 얼마나 억제할 수 있는가 하는 것.

앞서 CPU에서 클럭당소비전력, 즉 성능당소비전력이 18% 정도 개선되었다고 추정했습니다.
이런 개선이 CPU에만 적용될리 없습니다.
GPU에도 적용되겠지요. (왜 그렇게 유추가 가능한지는 뒤에서 다루겠습니다.)
넉넉잡아 20% 개선되었다고 하겠습니다.

엑시노스5410의 GL벤치마크 결과는 12.6 fps였습니다.
성능당소비전력이 20% 개선되었다는건
같은 성능에서 엑시노스5420의 Mali-T628MP6과 엑시노스5410의 SGX544MP3의 소비전력을 비교하면 엑시노스5420 쪽이 20% 소비전력이 낮다는 얘기입니다.
SGX544MP3 533MHz의 소비전력을 1 이라고 하겠습니다.
Mali-T628MP6의 전성비가 SGX544MP3과 같다면 Mali-T628MP6 700MHz의 소비전력은 2.3이 될겁니다.
하지만 전성비가 20% 개선되었다고 합니다.
2.3 의 80% 수준, 즉 1.84 의 소비전력인겁니다.
실제로는 클럭을 높이기위해 전압이 올라갈 것이기때문에 소비전력은 2.2~2.3 정도가 되지 않을까 추측됩니다.
종합해보면 성능대비소비전력에서 큰 손해가 없는 수준이지 않을까 싶습니다.

문제는 그렇게 해서 소비전력이 어느 수준을 넘어서지 않아야 한다는건데 (5W 정도?) 해결가능한 부분이니 갤럭시노트3에 들어갔겠지요?
GPU 부하가 심할 때는 CPU 부하가 낮고, CPU 부하가 높을 때는 GPU 부하가 낮고 하는 식으로 시스템이 굴러가니까요.


- 어떻게 전력효율을 올렸는가.
크게 두 가지로 보고 있습니다.

1. 설계 최적화.
설계 최적화로 트랜지스터 수 줄이고 다이사이즈 줄이고 성능 올리는게 일상다반사.

2. 공정 변화.
삼성 공정에 28LPP, 28LPH가 있는데 28LPH가 적용되었다면 전력효율이 높아질 수 있습니다.
앞서 클럭당소비전력 개선이 GPU에도 적용될 수 있다고 한 이유가 이것때문입니다.
공정변화의 효과는 CPU, GPU를 가리지 않고 해당하니까요.

전체 소비전력 측면에서는 DRAM의 소비전력 감소도 영향을 끼칠듯 합니다.
하지만 다이가 4개 적층된 2GB와 달리 (갤럭시노트3에 적용될) 3GB는 다이가 6개 적층되었기때문에 소비전력 감소 효과는 상대적으로 적어질듯 합니다.


- Adreno330 클럭이 550MHz
중간에 아무 얘기없이 지나갔는데 Adreno330 클럭이 기존에 알려진 450MHz 말고 550MHz도 있는듯 합니다.
(아난드텍에서도 언급한 기억이 있음.)
GL벤치마크 결과를 보면 스냅드래곤800 탑재 제품 중 삼성 갤럭시S4 LTE-A만 26.4 fps고, 그 외의 제품은 모두 23 fps 정도입니다.
삼성과 그 외의 제품에서 클럭이 달랐던 스냅드래곤600이 생각나는 상황이지요.
GL벤치마크의 로우레벨 벤치마크에서 나온 텍셀성능으로 봐서 23 fps 쪽이 450MHz라고 봐야합니다.
같은 스냅드래곤800인데 삼성만 클럭이 높은 상황이 또 한번 나오다니......


- 갤럭시노트3에 GPU 클럭 700MHz로 들어갈 수 있을까.
앞서 Mali-T628MP6 700MHz의 소비전력이 SGX544MP3 533MHz의 2.3배 정도로 보인다고 했습니다.
엑시노스5410이 발열 = 소비전력 논란에 휩싸인 적이 있다는걸 생각하면 2.3배의 소비전력이 스마트폰에 들어간다고 보기 힘듭니다.
갤럭시노트3에 들어가는 것으로 알려져있는데 그러기 위해서는 클럭을 낮춰야 할겁니다.

클럭을 정하는데는 몇 가지 기준이 있을겁니다.
현 상황에서 짚어보면,
1. 쿨링팬을 사용한 쉴드를 제외한 테그라4 제품보다 성능이 높을 것.
-> 스마트폰끼리 비교에서 높으면 된거.
2. Adreno330 450MHz 보다 높을 것.
-> 아직까지 550MHz는 삼성 제품뿐이니 스마트폰에서 거기에 구애받을 필요는 없어보입니다.

위 조건을 종합하면 GL벤치마크 T-Rex 오프스크린에서 22~23 fps가 나와야 합니다.
앞서 700MHz에서 29 fps 정도 나올 것으로 예상했습니다.
산술적으로 22~23 fps가 나오는 클럭은 533MHz~600MHz 내외 입니다.
533MHz 정도면 700MHz보다 전압도 낮을테니 700MHz 설정 대비 소비전력은 40% 정도 낮아질 것으로 보입니다.
이 정도 감소면 스마트폰에 들어가는데 충분하지 않을까 싶네요.
이 경우 경쟁 제품 대비 성능상 확실한 우위를 보이기 어렵습니다.
성능우위를 위해서라면 600MHz를 선택해야하는데 이러면 소비전력 20% 정도 밖에 낮아지지 않습니다.
어떻게 될지는 두고 볼 일.

리하면 갤럭시노트3를 비롯한 스마트폰에는 533MHz로, 소비전력과 방열기구에 여유가 있는 태블릿에는 700MHz로 들어갈 것 같습니다.

참고삼아 Mali-T628MP6 533MHz에서의 이론성능을 써보면,
457 Mtriangles/s
3.2 Gpixels/s
108.7 GFLOPS



Posted by gamma0burst Trackback 0 : Comment 30

댓글을 달아 주세요

  1. addr | edit/del | reply Dafeno800 2013.09.17 00:24 신고

    이야 근데mali t 604와,adreno320 이 동클럭시 어떤게 스펙상 우위에 잇나요????

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2013.09.17 22:21 신고

      GL벤치마크 T-Rex 오프스크린에서
      Adreno320 500MHz가 17.3 fps
      Mali-T604 533MHz가 12.5 fps

      Adreno320이 동클럭에서 우위입니다.

  2. addr | edit/del | reply 흡혈귀왕 2013.09.17 20:22 신고

    드디어 이론 픽셀/지오매트리 성능이

    PS3와 XBXO360 GPU를 넘어섰네요..
    부동소수점연산은 아직 좀 부족하지만 이정도 성능이
    폰에서 구현되는 날이 올줄이야..ㅎㄷㄷㄷㄷ


    그리고 김마님 정말 대단하십니다;
    역시 이번에도 정확히 맞추셧네요....
    지금 엑시노스5420 로우레벨 벤치 뉴갤놋2013으로
    올라왔는데...

    정말 92Mtri/s 입니다....ㅎㄷㄷㄷㄷㄷ
    엑시5410때 처럼 정확히 맞추심

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2013.09.17 22:22 신고

      추가하겠지만 제 예상에는 태블릿에 700MHz로 들어가고 놋3 등 스마트폰에는 533MHz로 들어갈 것 같습니다.
      스마트폰에 700MHz로 들어가기에는 소비전력 부담이 클겁니다.

  3. addr | edit/del | reply 흡혈귀왕 2013.09.17 22:43 신고

    감마님 기회되시면
    현재 모바일 GPU들
    이론 쉐이더 Max성능 벤치결과 상관없이

    부동소수점연산과함께
    픽셀필레이트
    텍셀필레이트
    트라이앵글레이트
    버텍스레이트

    정리해주실수 있을까요?ㅎㄷㄷㄷㄷㄷㄷ

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2013.09.17 23:05 신고

      할 수는 있는데 시간이 많이 걸려서 감히 시도할 엄두가 안 나네요.;;
      미드가르드 계열 GPU(Mali-T6xx)의 트라이앵글 성능의 사양대비비율이 1:7 이라는거 유추하는데도 3시간쯤 걸렸거든요.;;

  4. addr | edit/del | reply ㅁㄴㅇㄹ 2013.09.17 22:50 신고

    어디선가 GPU성능이 2배좋아졌다는 걸 본적이있는데 그게 기준이 5250인지 5410인지 기억이 안나네요ㅠㅠ
    그나저나 스냅 800이 5410보다 CPU 성능이 좋던가요?

    • addr | edit/del 흡혈귀왕 2013.09.17 22:57 신고

      삼성이 공식적으로 이야기한게
      엑시노스5410대비 2.3배 향상된 그래픽성능이었습니다.
      2013 시그래프에서 엑시노스5250대비 2배라고 언급되긴했네요

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2013.09.17 23:03 신고

      긱벤치2에서는 스냅800 2.3GHz하고 엑시노스5410 1.6GHz하고 CPU성능이 같았는데 긱벤치3에서 스냅800 쪽이 높아졌습니다.
      개인적으로는 긱벤치3쪽이 타당하지 않은가 싶네요.

  5. addr | edit/del | reply 흡혈귀왕 2013.09.17 23:14 신고

    감마님 아드레노330과 아드레노320등이
    현재 DX벤치마크2.7과 2.5기준....그리고 3DMark 아이스스톰과 그래픽 벤치에서

    아드레노330이 지포스8500GT, 7900GTX, 7900GT 7900GS, 7800GT보다 높고
    아드레노320이 지포스7800GT와 7900GT 사이 성능으로 나오는데
    어느정도 결과값이 맞다고 보시나요?

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2013.09.17 23:22 신고

      이론성능이 높다면 충분히 가능하다고 봅니다.

      메모리 대역폭 차이로 인해 성능차이가 생길 것이라는 의견도 있을 수 있습니다만, 애초에 기존의 PC용 GPU와 모바일용 GPU는 메모리대역폭 요구치가 다릅니다.
      제한된 대역폭에 맞춰서 메모리대역폭 요구를 줄이기위한 기술이 다수 적용되어 있지요.

      게다가 최신 벤치마크로 갈수록 최신기술이 적용되어있지 않은 구형 제품은 비슷한 스펙이라 할지라도 결과가 상대적으로 낮을 수 밖에 없겠고요.

    • addr | edit/del 흡혈귀왕 2013.09.17 23:29 신고

      제가 군대가기전에 썼던컴이
      코어2듀오 E6400
      지포스7900GT
      2GB RAM
      23인치 1920X1080 모니터

      이었는데 뭔가 참 세월빠르다고 느껴지네요..ㅎㄷㄷㄷ
      폰이 이정도 따라온게...

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2013.09.17 23:31 신고

      저희 집 세컨컴이 7900gs ㅋㅋㅋ
      내장만도 못한 애물단지입니다.ㅋㅋ

    • addr | edit/del 흡혈귀왕 2013.09.17 23:34 신고

      지금생각해보면
      G70은 당시 경쟁상대였던 라뎅x1000 시리즈대비
      쓰레기였다고 가히 제입으로 이야기하겠습니다~ㅋㅋㅋㅋ

      AA와 HDR이 동시에 안되다니~!!!!!ㅋㅋㅋㅋㅋ

  6. addr | edit/del | reply 흡혈귀왕 2013.09.17 23:36 신고

    아참 감마님 그러고보니 아드레노330
    구글링해보면 클럭이 대충 550MHz로
    굳어지는거 같던데 정확한 쉐이더 성능이 안나와있더군요

    정확한
    픽셀/텍셀
    지오매트리 성능이
    어느정도될까요 아드레노330은?

  7. addr | edit/del | reply Favicon of https://random-ad.tistory.com BlogIcon JordanK 2013.09.18 20:50 신고

    스냅800 2.3Ghz와 엑시노스5410 1.6Ghz의 CPU 성능은 거의 동급 아니었나요? 다양한 벤치마크 결과를 보니 대략 동급 같던데 말이죠. 설사 차이가 난다 할지라도 20%까진 아닐 듯 싶은데...

    • addr | edit/del Favicon of https://random-ad.tistory.com BlogIcon JordanK 2013.09.18 20:54 신고

      긱벤치3 글도 80:100이 아닌 100:120인데 이러면 20% 차이가 아니죠(5410보다 800이 20% 좋다 는 맞지만 800보다 5410이 20% 떨어진다 는 아니라는 겁니다). 20÷120=16.7% 정도.

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2013.09.18 21:15 신고

      긱벤치2 기준으로 비슷하지요.
      보수적으로 잡으려고 긱벤치3 기준으로 해석한겁니다.

      % 부분은 어차피 러프하게 가는거고요.
      계산이 틀린건 맞으니 수정하겠습니다.

  8. addr | edit/del | reply 아잉 2013.09.19 17:40 신고

    갤4사고 좋아했는데 노트3 나오면서 깡통되게 생겼네요 ㅠ

  9. addr | edit/del | reply 미르 2013.09.20 04:43 신고

    5420의 핵심은 hmp의 구현이지요, 클럭은 안정적으로 가는게 좋을것같습니다.홍보영상까지 만들고 공개한시점을보면 삼성이 준비를 많이한것같습니다

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2013.09.20 12:51 신고

      물론 HMP 지원도 중요한 특징이지요.
      빅리틀 지원 관련해서 한꺼번에 다룰 예정입니다.

  10. addr | edit/del | reply ㅁㅁ 2013.09.20 19:01 신고

    빅리틀방식이
    3가지인걸로 아는데
    어떤게 가장 좋을거 같나요?
    클러스터?
    cpu마이그레네이션?
    HMP?

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2013.09.20 19:06 신고

      HMP가 가장 좋습니다.
      클러스터는 프로토타입이고 IKS는 현실타협, HMP까지의 시간벌이용이지요.

    • addr | edit/del ㅁㅁ 2013.09.20 19:54 신고

      가장 단순하고 편리한 방법이 가장 좋은 방법이긴 해요 ㅎㅎ

  11. addr | edit/del | reply ㅁㅇ호ㅗ 2013.09.23 11:59 신고

    그럼 결국 스냅800이 더좋은건가... 퀄컴이 이번엔 진짜 잘만든듯

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2013.09.23 23:27 신고

      종합적으로 비슷하지 않을까 싶습니다.
      스냅800이 잘 나온 물건이긴 하지요.

  12. addr | edit/del | reply 대단하십니다.^^ 2013.10.06 00:01 신고

    Mali t 628 지오메트리 벤치값 진짜로 맟추셧내요 ...

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2013.10.06 00:07 신고

      실제는 그보다 좀 높게 나오더군요. 100 정도...
      제품별 클럭 예상도 틀렸고, 프레임도 예상보다 안 나오고.