- 생각이 미친 발단이 이 글인데......

(링크 : https://www.seeko.co.kr/zboard4/zboard.php?id=freeboard&page=5&sn1=&divpage=18&sn=off&ss=on&sc=off&select_arrange=headnum&desc=asc&no=898125)

현재까지 올라온 긱벤치 결과를 보면 갤럭시S9와 S9+ 점수에서 유의미한 차이가 있는데 그 원인이 메모리 점수라는겁니다.

 

 

- 긱벤치 메모리 점수

싱글 메모리 점수 : S9 - 4494 , S9+ - 4804

(링크 : http://browser.geekbench.com/v4/cpu/7216307 , http://browser.geekbench.com/v4/cpu/7141518)

멀티 메모리 점수 : S9 - 4658 , S9+ - 4999

(링크 : http://browser.geekbench.com/v4/cpu/7235795 , http://browser.geekbench.com/v4/cpu/7249745)

 

현재까지의 결과로는 싱글 총점에서 100점 정도 차이가 나는데 메모리 외 항목에서는 거의 차이가 없습니다.

(일부 편차는 있습니다만...)

메모리 점수 차이에 의한 총점 차이는 60~70점 정도로 비중이 높은데 세부항목을 보면 특히 레이턴시 차이가 큽니다.

복사, 대역폭 항목은 5% 이하의 차이인데, 레이턴시는 10% 이상 차이가 납니다.

 

 

- 메모리에 어떤 차이점이?

갤럭시S9와 S9+ 사이의 메모리 차이라면 가장 먼저 용량 차이가 있습니다.

S9는 4GB, S9+는 6GB

그렇지만 용량 차이만으로 성능 차이를 설명할 수는 없습니다.

메모리 패키지 내부의 다이 구성의 차이가 있을리라 추측할 수 있고,

4GB = 32Gb, 6GB = 48Gb 인데 6GB의 성능이 더 높으니 4GB는 16Gb x2 구성이고, 6GB는 12Gb x4 구성이라고 추측할 수 있습니다.

(병렬화가 될수록 성능이 높아지는 개념.)

 

최근 두께 감소 경향으로 봤을 때 메모리 패키지 내에 다이 수는 4개를 실질적인 한계로 보아야합니다.

(2D 배치로 완결되어야지 3D로 적층되면 두께가 증가하니까...)

 

(링크 : http://www.techinsights.com/about-techinsights/overview/blog/samsung%E2%80%99s-galaxy-note-7-is-more-the-batteries/

http://www.techinsights.com/about-techinsights/overview/blog/apple-iphone-7-teardown/)

 

먼저 이전 제품을 보겠습니다.

갤럭시S8 4GB - K3UH5H50MM-NGCJ

(링크 : http://www.techinsights.com/about-techinsights/overview/blog/samsung-galaxy-s8-teardown/)

갤럭시 노트8 6GB - K3UH6H60AM-NGCJ

(링크 : https://www.ifixit.com/Teardown/Samsung+Galaxy+Note8+Teardown/97071)

 

K3UH5H50MM-NGCJ 는 10nm급 (18nm) LPDDR4X 입니다.

(링크 : http://www.techinsights.com/reports-and-subscriptions/open-market-reports/Report-Profile/?ReportKey=EXR-1707-801)

 

(링크 : https://www.samsung.com/us/samsungsemiconductor/pdfs/PSG2017_1H_HR_singles.pdf)

삼성의 2017년 상반기 카탈로그를 보면

K3UH5H50MM-NGCJ : 32Gb = 4GB, DDP = 패키지 내 다이수 2개

K3UH6H60AM-NGCJ : 48Gb = 6GB, QDP = 패키지 내 다이수 4

 

K3UH5H50MM-NGCJ가 18nm 제품인데 K3UH6H60AM-NGCJ가 함께 카탈로그 상 표기되었기때문에 같은 세대, 공정 제품으로 볼 수 있습니다.

그리고 18nm는 삼성에서 현재 양산 중인 최신 공정이라서 이 제품에 이은 다른 제품이 있으리라 생각하기 어렵습니다.

갤럭시S9/S9+에도 같은 메모리가 들어갈 가능성이 높고, 앞서 추측했던 패키지 내 다이 구성도 각 제품과 일치하여 그 가능성을 더 높입니다.

물론 메모리 패키지는 SoC 사이즈를 따라가기때문에 메모리 패키지 사이즈에 변화가 있을 수 있고, 그러면 파트넘버가 바뀌게 되겠지만 기본적인 내부 구성은 동일할 것으로 예상됩니다.

 

 

- 정리

1. 갤럭시S9/S9+ 간의 긱벤치4 총점에 유의미한 차이가 있고 이건 메모리 점수 차이의 영향이 큼.

 특히 레이턴시에서 성능 차이가 큼.

2. 메모리 패키지 내부 다이 구성에서

 갤럭시S9 4GB = 32Gb = 16Gb x2 / 갤럭시S9+ 6GB = 48Gb = 12Gb x4 로 차이가 있는 것으로 추정.

3. 메모리 내부의 병렬화 정도 차이로 메모리 벤치마크 결과에서 유의미한 차이가 발생한 것으로 추정.

 

 

 

Posted by gamma0burst Trackback 0 : Comment 43

댓글을 달아 주세요

  1. addr | edit/del | reply ㅁㅁ 2018.03.01 00:03

    아난드텍이 리틀코어에 L2캐시가 없다고 하는거 같다는데
    아직 펌웨어가 완전하지 않아서 버그땜에 이상하게 잡히는걸까요 아니면 진짜로 없는걸까요

    • addr | edit/del 굴단 2018.03.01 01:29

      그게 말이되나요;; 설마 아니겠죠 좀더 기다려 봅시다

    • addr | edit/del ㅁㄴㅇㄹㄹ 2018.03.01 23:47

      l2캐시는 없을수도있습니다.

      스냅드래곤845만해도

      빅클러스터와 리틀코어 클러스터간

      공유 l3캐시를 사용하는데

      엑시노스는 빅클러스터와

      리틀클러스터간 l3캐시가

      따로있더군요..


      근데 말이 l3캐시지

      실제론 리틀코어 l2캐시역할을

      하는거겠죠.. 레벨2캐시가없는데

      레벨3캐시가있을순 없으니까요

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2018.03.02 11:15 신고

      L3 캐시가 공유캐시가 아니라면 굳이 리틀클러스터에 L3 캐시를 넣을 이유가 없지요.
      차라리 적은 용량으로 L2 캐시넣는게 이득입니다.

      아난드텍 기사라지만 일단 반신반의고 다이샷이라도 나오는걸 기다려봐야겠지요.

  2. addr | edit/del | reply 굴단 2018.03.01 01:28

    아난드텍에 9810 각종 벤치 자료도 올라왔고
    9819과 845, A11 전력소모관련 얘기가 나왔는데 이거 분석하실생각은혹시 있나여

    https://www.anandtech.com/show/12478/exynos-9810-handson-awkward-first-results

    https://www.anandtech.com/show/12460/samsung-announces-the-galaxy-s9

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2018.03.02 11:16 신고

      전력, 성능 테스트 결과 제대로 된게 나오면 해볼 수도 있을거 같네요.
      저거 몇 줄을 뭘 근거로 믿고 쓸 수 있을까요.

  3. addr | edit/del | reply 흡혈귀왕 2018.03.02 11:21

    헛~!
    제글이 인용되었군요~(영광굴비!)

    애초에 두 모델 클럭을 다르게 했을거란 가능성이 한없이 제로에 가까워서
    세부점수를 살펴봤더니 메모리 점수가 크게나더군요~ㅋ

    그나저나 이럴경우 GFX벤치마크에서도 둘이 차이를 보여줄수도 있겠군요

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2018.03.02 11:55 신고

      메모리 벤치에서나 겨우 보이지 정수, 부동소수점 벤치에서는 차이가 안 보여서 그래픽 벤치에서도 영향은 거의 없을 것으로 예상합니다.

  4. addr | edit/del | reply ㅁㅁ 2018.03.06 14:42

    근데 메모리 병렬화로 레이턴시가 줄 수도 있나요? 데스크탑에서는 멀티채널을 구성해도 대역폭만 늘고 레이턴시는 안줄던데...

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2018.03.06 18:58 신고

      데스크탑이나 워크스테이션 자료보면 대역폭이 높아지면 레이턴시가 높아지고, 특정 효율 구간을 넘어가면 레이턴시가 급격히 올라가긴 합니다.

      그런데 본문건은 동일한 대역폭 내에서 내부적으로 구성에 차이가 있는걸로 추정하는 경우라 데탑하고 좀 다를듯 합니다.
      DRAM 레이턴시에서 주요한게 subarray 레이턴시인데 이는 SA(sense amplifier)에 연결된 비트라인 길이가 길어길수록 증가한다고 하니,
      (추정입니다만) 12Gb와 비교해서 16Gb의 뱅크 사이즈가 더 커지면서 peri에서 cell array까지 거리가 더 커진 영향이 아닐까 싶습니다.

  5. addr | edit/del | reply ㅁㄴㅇㄹㄹ 2018.03.07 11:10

    s9플러스를 받아서 써봤는데 맨해튼부분 배터리테스트를해보니까

    프레임은 s8플러스랑 거의같고(오히려낮기도하네요..) 배터리타임도 비슷하거나 살짝낮네요.

    이정도면 8895랑 gpu가 거의같은 수준인거같은데 845랑 너무차이가나는게 아닌듯싶은데

    어떻게생각하시나요? 너무 실망스러운 성능이네요. 전력효율이라도 좋아졌으면 모르는데

    맨해튼 배터리테스트해보니까 걍 동급이더군요..

  6. addr | edit/del | reply ㅁㄴㅇㄹㄹ 2018.03.08 23:13

    asdaf

  7. addr | edit/del | reply ㅁㄴㅇㄹㄹ 2018.03.08 23:15

    며칠동안 갤9 작동클럭내역보니까 부스트클럭 거의안돌아가더라구요

    2.3~2.7ghz 이 클럭 돌아간시간이 1분정도입니다.

    참고로 화면켜져있는 시간만 수십시간입니다.

    다른폰같은경우 제 사용패턴으로볼때 화면켜짐시간중

    3~5%정도는 최대클럭으로 돌아가는거와달리 0.02%정도만 최대클럭으로

    돌아갔다는 소리인데 아무래도 부스트클럭으로 싱글스레드점수가높은것과

    베이스클럭 점수에서 높은건 엄청난 차이가있는듯합니다..

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2018.03.09 19:30 신고

      안드로이드가 멀티코어 잘 쓰나보네요.

    • addr | edit/del ㅇㅇ 2018.03.10 00:06

      안드로이드가 잘 쓴다기보단 안드로이드 도 잘 쓰는거죠 윈도우고 iOS고 안드로이드고 멀티코어화 되면서 다들 잘 쓰고있음

      싱글 멀티 둘다 중요한 지금 상황에서
      1~2코어 싱글코어성능만 좋은건 그닥인듯

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2018.03.10 00:38 신고

      안드로이드는 멀티코어 제대로 못 쓴다는게 그들 논리 아니었습니까.
      그러면서 싱글스레드 성능 부족까고.
      싱글코어 중시하다가 애플이 HMP가니 그제서야 멀티코어도 입에 담기 시작하고 이제와서는 싱글성능 질 따지기 시작하고.
      참 기가막힌 태세전환입니다.
      듀얼코어 넣어놓고 멀티코어 성능 운운하는거 뻔뻔한겁니다.

    • addr | edit/del ㅇㅇ 2018.03.10 00:54

      팩트 1 : 멀티코어 성능이 중요하지 않다는말은 아무도 한적없음. 심지어는 어그로꾼 웰벙시코마저도 싱글도 멀티처럼 중요하다, 둘다 중요하다고 말했었음.
      팩트 2 : 애플이 멀티 따라잡으니까 멀티도 중요하다고 한 사람은 어무도 없음. 엑시노스가 싱글 발리더니 그 엑시노스 사랑꾼등이 중요하다던 멀티까지도 발린다고 말했을 뿐.
      팩트 3 : 극단적으로 싱글or멀티 친화적인 작업(1코어만 쓴다거나, 8코어 모두 100% 쓴다거나)이 아닌 이상 다수코어 사용시 싱글코어 성능 중요한 것이 사실임.

  8. addr | edit/del | reply 감마님 2018.03.10 14:34

    분석글 쓰시는 블로거가 그렇게 편파적이셔도 됩니까?

    엑시노스 비판하는 의견을 두고 그들의 논리라느니 하시는거 굉장히 보기 좋지 않습니다.

    솔직히 틀린 말도 하나 없는것 같거든요.
    '싱글 멀티 둘다 중요하고 멀티코어 사용시에도 싱글코어 성능은 중요하다.'
    전혀 틀린 말로 안 보입니다.

    '싱글코어도 중요하다'는 말은 '멀티코어가 중요하지 않다'라는 말이 아닙니다.

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2018.03.10 15:01 신고

      그들의 논리가 단순히 그렇게 좋게 표현할 내용이 아니니까요.
      싱글, 멀티 둘 다 중요하다. 같은 점잖은 논리가 아니에요.

      애플 AP 싱글코어 압도하고 멀티코어 밀릴 때는 (iOS는 그렇다쳐도) 안드로이드는 멀티코어 제대로 못 쓴다는 놀라운 논리로 엑시노스를 비롯한 HMP 적용 제품들 다 까내렸지요.
      아난드텍 자료를 대표로 안드로이드가 멀티코어 활용이 충분하다는 자료들이 있는데도 말이지요.
      (아이러니하게도 이번 엑시노스9810 싱글부스트 코어 논란도 역으로보면 안드로이드가 멀티코어 활용 잘 한다는 반증이지요.)
      그러더니 애플도 HMP 적용하고 멀티코어에서 점수가 높아지니 그런 얘기가 쑥 들어가고 극단적으로는 iOS가 멀티코어 잘 쓴다는 얘기까지 나오기 시작했지요.
      바탕에 깔린 최종 목표 주장에 유리해지니까 입장 바뀐겁니다.
      엑시노스가 싱글코어 점수에서 좀 따라오니까 그 싱글코어 성능이 실사에서 제대로 활용 못 한다는 논리가 등장했지요.
      애플 A칩이 벤치에서 보이는 싱글코어 성능, 클럭이 실사에서 그대로 드러난다는 근거는 아직 어디에도 없는데 말입니다.

      이런 태도가 객관적이고 일관되었으며 편파적이지 않은가 보지요?

      어차피 저는 본문에 기술적인 내용만 얘기하지 거기에 대한 감정적인 내용, 평가같은거 안 넣습니다.
      (쓸데없이 싸우기나하니까)
      그래서 엑시노스, 애플 A칩 비교를 놓고 쓰레기니 뭐니 평가내리는거 안 하고 쓸데없는 짓거리라고 생각합니다.
      (그들 말하는거보면 각 항목에서 모두 1등 못 하면 쓰레기인데 정작 본인들이 띄워주려는 제품이 1등 못 하는 부분은 무시하는 이중잣대를 보이지요.)
      그런데 그들은 굳이 남의 집에 쳐들어와서 쓰레기니 뭐니 하는 쓸데없는 편가르기와 평가짓을 해서 시비걸고 분란을 유도하려고 하지요.
      본인들이 제품에 대해 뭐라고 생각하든 자유고 관심도 없습니다만, 그걸 남한테 우겨서 납득시키고 동의를 받고 싶으면 최소한의 상식적인 수준의 논리와 일관된 태도라는걸 보여야 됩니다.
      한글 문법상 틀린거 없고 문장만 구성된다고 그게 논리적으로 맞는게 아닙니다.

      말이 안 통하는 상대에게도 객관적이고 온화한 태도를 바라신다면 오산이고 무의미한 기대입니다.
      어차피 그들 입장에서는 본인 논리가 안 먹힌다는 이유만으로 거꾸로 말이 안 통한다고 하겠지만 뭐가 객관적인건지는 기술이나 데이터가 말해주겠지요.
      지금 리플은 최근 몇몇 단편적인 리플만보고 판단하신거라 믿겠습니다.

    • addr | edit/del ㅁㄴㅇㄹ 2018.03.10 16:28

      안드로이드가 멀티코어 못쓴다고한사람은 아무도없어요~ 멀티성능 부정한사람은 더더욱 없구요~
      A9는 2코어 멀티 4500이고 7420은 8코어 멀티 5000인데
      8코어를 항상 100% 쓰는건 말도안되지만 2코어 쓰는건 쉬우니 8코어 5000짜리보다 2코어 4500짜리인게 더 좋다고 한거죠~
      어떻게 그게 안드로이드는 멀티코어를 못쓴다고 주장한게 되나요? 어이가 없음~
      아난드텍 그것도 모든 고사양작업에서 8코어 골고루 100% 쓴다면 몰라도 멀티코어 활용 잘한다는거랑 서버시스템마냥 모든코어 100% 쓴다는말이랑 달라요~

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2018.03.10 17:01 신고

      ㅁㄴㅇㄹ//
      당연히 여기서는 못 하겠지요.
      애초에 억지스러운 주장이니까.

      거꾸로 누구도 서버마냥 멀티코어 100% 활용한다고 한적 없습니다.
      그런건 서버 정도가 아니라 HPC에서나 나오는거고, 리테일에서는 대다수가 겪을 일 없지요.
      (잘 해야 렌더링, 인코딩 정도인데 스마트폰에서 그럴 일은 없어보이네요.)
      안드로이드의 멀티코어 활용은 단순하게 멀티코어 프로그래밍 여부의 문제가 아니라 OS가 멀티스레딩, 멀티태스킹을 제대로 지원하느냐 아니냐와 더 밀접합니다.
      (개개의 앱이 싱글스레드만 조진다고 멀티코어 활용이 부족하다거나 하는 식의 관점이 잘못 됐다는거.)
      그 부분에서 안드로이드는 충분히 지원하고 있고 아난드텍이 보여준 것도 OS차원의 지원과 앱의 최적화 유무 등이 섞인 결과입니다.
      비판하는 입장에서 나는 그런 적 없는데? 라는 식으로 얘기해도 밑돌빼서 위돌 괴는 논리일뿐이고, 결국 해야하는건 멀티코어 활용, 싱글/멀티 성능의 유효성에 대한 반박이어야 되는데 그걸 제대로 하는걸 본적이 없군요.

      그리고 멀티코어 성능 비교에 대한 기준은 결국 긱벤치 끌고 오는데, 엑시노스9810 싱글코어 점수가 실사에서 보기 힘든 의미없는 벤치마크일뿐이라는 주장의 근간은 실사시 코어 동작, 클럭 변화 모니터링 결과입니다.
      이에 대해 애플A칩의 싱글, 멀티 우위를 자신있게 말할 수 있으려면 마찬가지로 (벤치마크 값이 아닌) 실사시 모니터링 결과를 갖고 와야지 제대로 된 잣대가 되겠지요.

    • addr | edit/del ㅁㄴㅇㄹ 2018.03.10 19:10

      님이 말하신 안드로이드가 지원하는 멀티사용에 대해서는 그 누구도 부인하지 않는다니까요.

      애초에 싱글 멀티 논란이 나왔던게
      7420 vs A9 시절에 멀티 조금 높은 대신 코어 많고 싱글 딸리는게 좋느냐 그 반대가 좋느냐 때문에 나왔던건 아실테구요?
      안드로이드가 코어분배를 잘 지원하는건 모두가 인정하는 상황에서 그것과 더불어 성능을 내기 위해 결국 중요한건 앱들이 많은 코어수를 다룰수 있냐 아니냐인데
      이 관점에서 보면 결국 싱글코어와 코어수 또한 멀티코어 못지않게 좋다는 결론이 나왔던거구요.

      여기서 싱글코어 성능이 중요하다는 얘기가 나왔던 거지 멀티코어 점수는 무의미하다는 얘기는 도대체 나올 구석도 없고 정말 도대체 본적이 없거든요.

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2018.03.10 20:15 신고

      ㅁㄴㅇㄹ//
      각종 커뮤니티에서 분탕질치던 글들은 제가 헛것을 본건가요.
      (물론 님이 그랬다는건 아닙니다. 누군지도 모르니...)
      이 블로그에서 그런 개싸움이 거의 안 보였을뿐 별별 경우 다 봤고 겪었습니다.

      말씀하신 결론은 상당히 시간이 지나서 잠잠해진 후에 중론이 된거고, 그 전까지 대세를 점하지 못 했을뿐 꾸준하게 멀티코어 무용론에 가까운 얘기들이 나왔습니다.
      (거기에 'iOS의 반쪽짜리 멀티태스킹 운운'같은걸로 반박하는 진흙탕 싸움이 이어졌지만......)
      이런 일들은 애플이 커스텀 아키텍처를 쓰기 시작한 A6부터 본격화됐고 A9에서 절정을 맞았다고 봐도 됩니다.
      이런 흐름이 사그라들고 말씀하신 내용이 중론으로 굳어지는데 결정적 계기가 된게 A칩이 리틀코어, HMP(A10~A11)를 도입한거고요.

  9. addr | edit/del | reply ㅁㄴㅇㄹ 2018.03.10 19:13

    그런데 A칩의 싱글 멀티 우위를 증명하기 위해 실사시 모니터링 결과가 필요하다는 말은 A칩에서도 9810처럼 싱글 부스트가 있을수 있다는 말인가요?
    아니면 벤치마크가 실성능이랑 연관 없을수도 있다는 벤치마크 무용론인가요?

    전자라면 저도 A11이 어떻게 작동하는지 모르니까 동의하지만 후자라면 말이 안됩니다

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2018.03.10 20:01 신고

      벤치마크 무용론이라는건 너무 멀리갔네요.
      엑시노시 긱벤치 싱글 돌아갈 때 조건이 실사에서 거의 경험할 수 없는거라는거까지는 대부분 인정하는 부분이지만,
      거기서 더 나아가서 A칩하고 비교하는데서 오류가 나올 수 있는거지요.
      A칩에 싱글부스트가 있을 수도 있고, 임의로 설정하지 않았어도 순전히 TDP 문제로 2코어 로드시에 클럭이 떨어질 수도 있는거고요.
      비교를 할거라면 둘 다 긱벤치 결과끼리만 비교를 하든가, 둘 다 실사용 조건을 기준으로 비교를 해야지
      한 쪽은 실사에서도 당연히 긱벤치 때처럼 돌아갈거라 생각해서 기준으로 삼고, 한쪽은 실사 모니터링 결과를 기준으로 삼는건 맞는게 아니니까요.

      물론 그런 식으로 비교를 해도 A칩 성능이 더 높다는 결론은 마찬가지일겁니다.
      이미 피크를 뽑아낸 긱벤치 결과에서도 좋게 봐줘야 동급 수준이지 엑시노스가 밀리니까요.
      빅코어가 다 돌아가도 현재는 2코어이니 엑시노스로 치면 2.7->2.3 혹은 2.3->1.8로 떨어지는 정도로 예상할 수 있기도 하고요.

      애플이 HMP 구조 도입하면서 쓰로틀링 특성이 이전 제품 대비 상당히 취약해졌는데 A11에서도 경향은 크게 바뀌지 않을거고 (자료가 없을뿐) 그게 어느 수준이냐 여부가 하나이고,
      삼성이 멀티코어 로드시 클럭, 특히 4코어 클럭마저 자연스러운 쓰로틀링에 맡기지 않고 아예 fix해버렸는데 이게 역으로 최소 1.8GHz는 나름 장시간 유지되는, 쓰로틀링 특성 측면에서는 개선으로 나타날 수 있을 가능성이 있는게 두번째입니다.
      이 두 가지가 어떻게 나타나느냐를 확인해서 실사 성능(정확히는 클럭이고 그것과 긱벤치 결과를 기준으로 한 가상 성능의 비교이지만) 차이를 판단해야된다고 봅니다.

      뭐 일부의 판단처럼 A칩은 긱벤치 기준으로 삼고, 엑시노스는 실사시 기준인 4코어 로드 클럭 1.8GHz, 잘 해야 2코어 로드 클럭 2.3GHz로 잡아서 성급히 결론 낼 문제는 아니라는거고요.

  10. addr | edit/del | reply BlogIcon ㅁㄴㅇㄹ 2018.03.10 21:30

    생각이 깊으신 분이네요

    싱글 부스트클럭 개념이 아니라 TDP를 맞추기 위해 코어수에 따라 클럭을 줄인 것일수도 있다라.
    생각해보면 같은 방식이지만 전력소모가 빡빡하냐 항상 TDP안쪽으로 유지하도록 하는 방식이냐의 차이점이 있군요

    저도 그런 생각을 잠시 하긴 했늗데 굳이 그랬을까? 하는 생각을 했습니다.

    먼저 성능을 올리면 올리고 싶었을 삼성이 굳이 그런 방법을 택했을까요. 애플을 상대해야 할 삼성이 굳이 클럭을 내린다? 굳이 돌려 생각해야 할 이유가 있을까요.
    TDP 안쪽의 클럭사용으로 싱글 4000 멀티 9000의 성능을 갑자기 냈다고도 생각이 되지 않구요

    그리고 실제 전력소모를 보면 루즈한 전력소모를 사용하도록 설정되었다기엔 무시할수 없는 전력소모량을 가집니다.
    아난드텍 리뷰에서도 엑시노스가 스냅드래곤보다 전체적으로 많은 전력소모를 한다고 서술되어 있구요

    그리고 사실 그 방식이 맞다고 치더라도
    것도 실사용에서 효용이 떨어지면 떨어졌지 좋지는 않죠.
    일단 TDP 제한을 통한 스로틀링으로 제어하는 방식과 미리 TDP까지의 전력을 사용하는 클럭으로 제한하는 방식에서 클럭은 같게 유지된다고 가정하면, 떨어지기 전까지 peak 성능만큼은 스로틀링을 통해 떨구는 방식에 비해 미리 클럭을 제한해둔 쪽이 더 낮은 것이 확실하니까요.
    (루즈하게 말해서 이정도지, winrar 벤치마크에서 1코어는 스냅드래곤을 이기는데 2코어 이상에서는 집니다.)

    클럭 설정은 오히려 내렸다기보다는, 풀로드시 유지할 수 있었던 일정 시간만큼 유지할 수 있는 클럭과 전압을, 각 코어 사용 수마다 설정했으리라고 봅니다. 부스트클럭을 사용했다는 말이지요


    정확한건 스로틀링 벤치가 나와봐야 아는 거지만, 지금 상황에서 생각해 봤을 때 물론 가능한 얘기긴 하지만 그럴거 같지도 않고 그렇다고 가정해도 더 좋은 점이 없으므로 굳이 나눠서 생각해야 할 필요는 없을 것 같습니다.

    A11는 벤치로, 9810는 실사용으로 비교한다라...
    A11이 부스트클럭을 사용한다고 보기는 힘듭니다(점수 비율을 생각해 보세요).
    실사용으로 비교해야 한다는 것은 결론적으로 말하자면 스로틀링일 텐데, 그것도 벤치마크로 측정이 가능한 부분이기도 하구요.

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2018.03.10 22:28 신고

      어디까지나 가설이니까요.
      굳이 갖다붙이면 S.LSI가 발표한 클럭보다 낮춘 상태로 넣은 것도 긍정적인 근거로 볼 수 있긴 합니다.
      전력을 더 신경썼다는거니까요.
      쓰로틀링 특성을 개선하겠다는 목표하에서 이루어진 작업이라기보다는 전력이나 배터리 타임을 위한 작업의 부수적인 효과로 쓰로틀링 특성 개선이 따라왔다고 볼 수도 있겠고요.

      A11이 부스트 클럭 안 쓸 가능성이 높긴합니다.
      A11은 HMP를 써서 확인할 수 없지만 A10까지 애플 제품 긱벤치 점수를 보면 멀티코어/싱글코어 점수가 비율이 1.95~2.0 으로 거의 코어 개수 비례해서 나옵니다. (메모리나 총점은 제외하고...)
      부스트 클럭 썼으면 그렇게 안 나오지요.
      A11은 다를 가능성이 0은 아니지만 일단은 거의 없다고 봐야겠지요.
      쓰로틀링 특성이 문제인데 A10 테스트 자료(긱벤치 무한루프였던걸로 기억)보면 max 클럭 대비 클럭 떨어지는 %는 스냅이나 엑시랑 비슷했습니다.
      A11이 비슷한 특성을 보이고 엑시9810이 앞서 가설대로 4코어 로드에서 쓰로틀링 특성이 전작대비 개선됐다면 의외의 결과가 나올지도 모르지요.

      이렇게 썰을 풀어봐도 결국 가설이라서 테스트 결과가 나오기 전까지는 다 보류상태로 놔두는게 맞다고 봅니다.
      뭔가 잠정적인 결론 내려고 해봤자 그걸 위한 가정이 객관적이기는 힘들고 자기 입맛대로 설정할 가능성이 높으니까요.

  11. addr | edit/del | reply 허허허 2018.03.12 23:40

    거의 ㅇ♫♪♩ㅋ 빼박인데
    점잖게 댓글 달아주시네요

  12. addr | edit/del | reply ㅇㅇ 2018.03.14 00:21

    매번 좋은 글 잘 읽고 있습니다.
    S9 펌웨어가 떴던데 이제 CPU 클럭에 대한 논란이 해결되겠지요?

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2018.03.14 01:05 신고

      논란의 핵심을 뭐로 보느냐에 따라 다른데
      제가 보는 기준에서는 SW 튜닝으로 큰 변화는 없을거 같습니다.

  13. addr | edit/del | reply qwerty 2018.03.15 18:31

    감마님 블로그 자주 오는데 특정 정치색?의 공격을 받으시는군요 힘내십쇼

  14. addr | edit/del | reply ㅁㄴㅇㅎ 2018.03.25 04:50

    엑시노스9810 다이샷분석을보면 a55클러스터가 유독 타 제품보다 작던데(심지어 10nm공정 a53클러스터보다 작은)

    진짜 l2캐시가 안들어간거갔습니다.. l2캐시를 왜 안넣은건가요? 성능면에서 분명 들어간거보다

    성능이낮을텐데.. 설마 다이크기줄일려고..? 아무리그래도 그렇지 l2캐시안넣은건 좀 그렇네요..

    현재 s9쓰고있는데 유독 이전버전보다 리틀코어갈구는정도하고 클럭돌아가는게

    a53보다도 많이갈궈지는거같은 느낌이듭니다.(모니터링을했을때요)

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2018.03.25 17:06 신고

      다이 이미지봐서는 L2 들어간거 같던데요.
      아난드텍이 뻘소리했다는게 제 생각입니다.

  15. addr | edit/del | reply ㅇㅇ 2018.03.25 12:38

    전체 면적보면 9810은 100mm^2가 넘어가든데
    이제는 면적도 애플한테 밀림;; 애플은 90mm^2 도 안되던데

    • addr | edit/del A TNT 2018.03.25 13:26

      별도의 통신칩까지 합하면 애플쪽이 차지하는 공간이 훨씬 많아집니다. 그리고 9810은 애플 AP 내에 들어가는 빅코어가 2개가 아닌 4개가 들어간걸 감안해야죠

    • addr | edit/del 2018.03.25 13:38

      애플 통신칩 ♬♩♩같은건 맞는데
      통신칩 뺀 나머지 얘기하는거니까
      그거에서는 삼성이 밀리는게 맞는듯요
      그리소 빅코어 4개 박은건 삼성이 2개 박는거보다 더 낫다고 판단해서 그렇게 한걸텐데
      그걸 감안할필요가 없죠 그게 아니었으면 성능이 낮아질거라는 판단하에 달았을텐데

    • addr | edit/del ㅁㄴㅇㅎ 2018.03.25 17:03

      그 빅코어가 2개가아니라 4개인데

      멀티성능이 더 떨어지니 한심한일이죠.

      코어가 많으면 많을수록

      멀티스레드에선 유리한데

      그 빅코어가 4개인데도

      2개짜리 a11보다 멀티성능이

      떨어진다는건 한심한일에가까운데

      그걸 크기면에서 실드치려하시다니..

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2018.03.25 17:24 신고

      면적 더 작아진다고 최종 제품인 폰이 소비자한테 더 싸게 가는 것도 아니니 소비자 입장이라면 성능만 따지면 됩니다.
      면적 얘기를 꺼낸다는 면적대비성능 측면에서 보는거고 아키텍처 분석의 영역으로 가는겁니다.
      엔지니어링 입장이라는거고 그런 관점에서의 논의라면 면적이 그럴 수 밖에 없는 이유정도는 설명할 수 있지요.
      그걸갖고 쉴드로 치부하는건 역으로 그냥 까고 싶다는 의사표현이지요.

    • addr | edit/del ㅇㅇ 2018.03.25 17:40

      코어가 4개가 들어가서 면적이 넓어졌다는데
      그건 무슨 4개 안넣으면 망하는 징크스 같은게 있어서 2개 넣어도 되는걸 4개 넣은게 아니라
      엔지니어링 입장에서 그게 최적이라고 판단했기 때문에 4개를 넣은거죠

      4개를 넣어서 면적을 키웠는데도 떨어진다는 것은 엔지니어링 입장에서 봤을 때 삼성이 밀리는 게 맞죠

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2018.03.25 17:41 신고

      면적 얘기를 하자면 엑시노스9810이 119mm2 정도인데 모뎀이 10mm2 정도 빠집니다.
      CPU는 M3 1코어(캐시포함) 면적은 몬순(A11) 1코어랑 비슷하거나 몬순이 약간 더 큽니다.
      리틀코어는 A55가 1.8~1.9mm2 정도, A11은 2.8mm2 정도입니다.

      GPU는 sdm845 대비 2배 이상으로 10mm2 이상 낭비됐다고 봐야겠지요.

      GPU에서 까먹고, 모뎀추가된거 합치면 20mm2 이상이고, 이 정도면 할만큼 한거 같긴한데 GPU가 까먹는게 너무 크네요.

      결과로 보여줘야하기때문에 이제와서 의미없는 가정으로 치부하겠지만 4코어 구성은 현재 엑시노스9810 CPU 성능과 관련된 잡음의 부정할 수 없는 근본 원인입니다.
      4코어를 넣으면 동시에 싱글 성능까지 잡으려니 한계가 오는거지요.
      말 그대로 의미없는 가설입니다만 만약 빅코어가 2개였다면 설계상 면적 마진이 늘어서 고클럭에 최적화된 배치가 가능했을겁니다.
      1코어당 전력 여유는 당연한거고, 최저-최고 클럭간 차이도 줄어들테니 타겟 클럭에 대한 전력 효율도 더 나아졌을거고요.

    • addr | edit/del ㅇㅇ 2018.03.25 17:47

      엔지니어링 측면에서 면적과 성능을 비교하고 있는데
      코어가 많기 때문에 면적이 증가할수밖에 없다는 것은 본질 흐리기죠
      그 코어가 왜 많아졌을까요.
      아 아쉽네 코어가 적었으면 면적 비슷했을텐데~ 이렇게 비교가능한게 아니죠
      면적이 줄어들면 성능이나 전성비 등 떨어지는 곳이 생기게 마련이니까요.(면적만 줄어들고 끝나면 4코어 박은 삼성이 바보죠)
      연결되어 동시에 생각해야 하는걸 따로 떼어서 비교하다니..

      어쨌거나 무슨 이유든 간에 코어를 늘렸고 면적은 증가했는데 그만큼 성능이 나오지 않으니까 밀렸다고 하는 건데요.

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2018.03.25 18:00 신고

      ㅇㅇ//
      그러니까 면적, 성능만 놓고 1차원적으로 비교하는건 사용자적인 입장이고 충분히 나올 수 있어요.
      그런 관점에서 나온 결론은 결론대로 유효하고요.

      엔지니어링 관점이라는게 단순히 면적대비성능, 전력대비성능 계산으로 그치는게 아니라 기존부터 내려오는 각 사의 기획 상황, 기술적으로 처한 현실에서 왜 그런 선택을 할 수 밖에 없었느냐, 결국 왜 이 모양 이 꼴이 되었는가.에 대한 이해?해석?추정?까지 가는겁니다.
      그런 일련의 과정이
      효율, 성능, 전력 등에서 떨어지는 부분에 대해 면죄부를 주기 위해서 하는 얘기가 아니라,
      향후 제품에 대해 기대치를 얼마나 둘 것인가 어떤 방향으로 흘러갈 것인가에 대한 이해도를 높이는거고요.
      (물론 인터넷 상으로는 오용하거나 오해하는 사람들이 대다수입니다만.)
      그런 관점의 얘기를 하는데 마치 쉴드라도 치는 것처럼 받아들이시는거 같네요.

      9810에서 20mm2 빠지면 A11 면적이랑 비슷해지는데, 면적 비슷한 빅코어가 2개 더 들어가고도 면적이 비슷해진건 A11에 NPU가 들어가서 그런거 같네요.