- 차기 엑시노스, 스냅875 긱벤치 결과 찌라시

(https://www.clien.net/service/board/park/15384053)

 

(https://www.clien.net/service/board/park/15389434)

 

 

- 저 내용을 뜯어보기에 앞서 Cortex-A78, Cortex-X1 성능에 대해 정리를 해놓는게 필요.

아직 실제 제품 벤치마크가 나온게 없기때문에 ARM 발표 내용을 참고할 수 밖에 없는데

(늘 그렇듯이) 어필하고 싶은 부분만을 강조해서 표기해놨기때문에 대충보고 자의적으로 해석하지말고 조건, 기준을 잘 따져야됨.

 

sustained 성능은 A77 대비 +20%

SPECint 2006, 싱글코어 1W 기준.

 

SPECint 2006 기준.

왼쪽 그래프에서 A77 2.6GHz와 A78 3.0GHz 성능이 20% 차이면 동클럭 성능은 A78이 +4%

오른쪽 그래프에서는 공정이 다르니 전력을 따져보기는 정확도가 떨어지고,

A77 2.3GHz와 A78 2.1GHz 성능이 같다면 동클럭 성능은 A78이 +10%

 

싱글코어.

SPECint 2006 피크성능, 7FF 공정에서 Dhrystone 전력, 면적.

세 제품 다 같은 공정이란 의미인지 A78만 7FF라는건지 모르겠음.

저렇게 표기했으면 다 같은 공정이란 의미일 가능성이 높긴한데 굳이 제품별로 년도를 표기한게 년도별 공정 차이를 의미할 가능성도 있을듯.

클럭을 모르니 동클럭 성능 비교는 패스.

동일 공정에서 A78 면적은 A77 대비 -5%

 

싱글코어, SPECint 2006, 3.0GHz 조건에서 X1은 A77 대비 피크 성능 +30%

X1 동클럭 성능은 A77 대비 +30%

 

싱글코어, SPECint 2006, 3.0GHz 조건에서 동클럭 성능 비교.

X1은 A77 대비 +30%, A78은 A77 대비 +7%

 

A77 코어 구성과 비교인데 A77을 2019 디바이스로 표기한걸 봐서는 동일 공정은 아닌듯.

앞선 A78 자료로 보아 A77은 7FF 공정이고 A78, X1은 5FF 공정 기준이지 않을까 추측됨.

성능은 앞의 내용과 같은 얘기이고,

A78 4코어 구성에서 1코어가 X1로 바뀌면 A77 구성 대비 -15%던 면적이 +15%로 바뀜.

이 값으로 계산하면 X1 코어 면적은 A78 코어의 2.4배 정도가 되는데 실제 그럴 수도 있고, L3 캐시 증가 등 CPU 클러스터 전체 면적을 기준으로 했다면 X1 코어 면적 증가치는 저것보다는 크게 줄어들 수 있음.

엑시노스9820 경우를 보면 L3 캐시 면적이 CPU 전체 면적의 30% 정도여서

이 값을 참고해서 L3 캐시 면적 증가가 클러스터 면적에 반영되어 있다고 가정해서 계산해보면 X1 면적은 A78의 1.8배 정도가 됨.

사실 엑시노스M4 코어가 A75의 3.6배 수준이라서 성능 중시형 코어가 성능-면적 밸런스형 코어보다 2.4배 큰게 과도한건 아님.

 

성능, 전력 그래프여서 클럭관련된 내용을 뽑아내기는 어려울듯.

 

3.0GHz 기준.

SPECint/fp 2006 기준 A78 성능은 A77 대비 +7%, X1 성능은 A77 대비 +30%

 

 

- 정리하면

SPECint/fp 2006에서 동클럭 성능은 A77 대비 A78이 +7%, X1이 +30%

(A78이 +4% 일 가능성도 있으나 꾸준히 7%를 언급하고 있으니 일단 이 쪽 값을 선택.)

면적은 공정에 따라 다르겠지만 A77 대비 A78이 -5%~ -15%, X1은 1.8~2.4배 정도로 추측.

 

다시 찌라시 내용으로 돌아가서 찌라시 내용이 사실이라고 보고 분석해보면

 

 

- 스냅875

스냅875 긱벤치

싱글 1159 / 멀티 4090 , 싱글 1102 / 멀티 4113

 

스냅865+(A77) 싱글 점수 최대치가 986이고 1GHz당 점수로 보면 319점/GHz

(https://browser.geekbench.com/v5/cpu/3812023)

(뻔한 얘기이긴한데) 1159점을 A77 결과로 보면 클럭은 3.63GHz로 터무니없는 클럭.

SPECint/fp 결과와 긱벤치 결과 간에 확실한 경향이 잘 안 보여서 ARM 발표 값을 그대로 쓰는게 정확하지는 않지만

딱히 쓸만한 내용이 없으니 A78이 A77 대비 동클럭 성능 +7%라는걸 대입해보면 A78 3.4GHz로 계산됨.

클럭이 너무 높게 보이는데......

일단 ARM 자료를 보면 1W에서 7FF 공정 A77 코어가 2.6GHz, 5FF 공정 A78 코어가 3.0GHz인데 A78 클럭은 믿기 어려운 값임.

A77 발표 당시 7nm 3GHz로 발표했지만 실제 클럭은 그에 못 미쳤고 7nm 끝물에 와서야 3GHz를 넘었음. (스냅865+)

현재로는 5nm A78이 3GHz가 가능하다는건 참고 수준에 그치는 내용임.

빅코어는 Cortex-X1으로 가정하고 앞서 했듯이 SPECint/fp 성능 향상치 = 긱벤치 점수 향상치 로 가정해서 역산하면 2.8GHz으로 합리적인 수준임.

 

멀티점수를 보면 A78일 가능성도 높게 볼 수 있는데,

긱벤치5 멀티점수는 리틀코어를 제외한 빅, 미들코어의 코어별 점수를 합한 것과 비슷해서 멀티점수로 미들코어 클럭을 대략적으로 계산할 수 있는데

같은 아키텍처 4코어 중 1코어만 클럭을 올리는 구조를 쓴 이후 스냅드래곤 긱벤치 점수를 보면 멀티모드에서도 1코어는 최대 클럭으로 동작하는 것으로 보임.

고클럭 1코어가 최대 클럭으로 동작하고 나머지 3코어는 미들코어 클럭으로 동작한다고 가정하면 미들코어 클럭은 2.9GHz가 나옴.

스냅865이 빅코어 2.84GHz, 미들코어 2.42GHz로 17% 차이인데 같은 패턴으로 계산하면 스냅875 빅코어 클럭은 3.4GHz가 나와서 앞서 싱글점수 기준으로 계산한 값과 일치함.

또한, ARM 자료에서 7FF 1W에서 A77 클럭이 2.6GHz인데

스냅865 미들코어가 클럭이 2.42GHz인걸보면 멀티코어 모드에서 1코어당 할당되는 전력은 1W 미만이고 정확한 전력량은 가늠하기 어렵지만 대충 ARM 자료상 클럭이 7% 빠진게 실제품 미들코어 클럭이라고 보고

5FF A78에 같은 방식을 적용해보면 실제품 클럭은 2.8GHz 정도가 돼서 위의 계산값과 비슷함.

일단 빅코어 3.4GHz, 미들코어 2.9GHz로 계산되는 것.

 

즉, 실제로 5LPE 공정에서 A78이 3.4GHz가 가능하든, 지금 가정한 A78의 클럭당점수가 낮아서 클럭이 높게 계산된 것이지 실제로는 A78 클럭당점수가 더 높고 클럭도 위 계산치보다 낮든

스냅875는 X1 코어없이 A78 4코어로 구성되었을 가능성이 높은 것.

여기서 남은 변수가 5LPE-5FF 공정 간 성능차이인데, 만약 5LPE 성능이 5FF보다 낮을 경우 위에서 5FF 기준으로 계산했던 클럭을 달정하기 어려움.

그렇게되면 All 코어가 A78이란 결론이 무너지든가, 긱벤치5에서 A78의 클럭당점수 가정보다 높다는 결론이 되는 것.

 

 

 

- 차기 엑시노스

차기 플래그십 엑시노스 긱벤치

싱글 1302 / 멀티 4250 (멀티는 당연하고 싱글에서도 A13 턱 밑까지 쫓아옴.)

 

위에서 했던 것처럼 SPECint/fp 성능향상치 = 긱벤치 점수 향상치로 보고 X1 클럭당점수를 A77 대비 +30%로 반영해서 계산하면 싱글 클럭은 3.1GHz.

A78 기준으로하면 3.8GHz가 나와서 빅코어가 A78일 가능성은 거의 없음.

5G 모뎀 통합일 가능성이 높은 상황에서 저 큰 X1 코어가 2개나 들어가긴 어려울듯.

성능 이득도 그렇게 크지 않고...

 

스냅875에서 했던 방식으로 멀티점수에서 미들코어 클럭을 계산해보면...

스냅875처럼 멀티모드에서 ALL 코어가 최대 클럭으로 동작한다면 미들코어 클럭은 2.9GHz

하지만 이전 제품처럼 멀티코어 모드에서 빅코어 클럭이 낮을 가능성은 있기때문에 멀티코어 동작에서의 빅코어 클럭을 가정해야됨.

 

빅코어 x2 + 미들코어 x2 구성이었던 엑시노스9820,9830 클럭을 참고 할 수 있는데,

싱글클럭, 멀티클럭이 엑시노스9820은 2.73GHz, 2.08GHz 이고, 엑시노스9830은 2.73GHz, 2.0GHz(추정)이었음.

(링크 :  갤럭시 S20 커널 정보(엑시노스9830, 엑시노스3830, 엑시노스9630, 2020, NEUS)

 링크 : 엑시노스 9820 커널 (Exynos9820))

멀티모드에서 클럭이 25%정도 떨어지는건데 같은 식으로 계산하면 차기 엑시노스의 빅코어 멀티클럭은 2.4GHz

2.4GHz에서의 X1 1코어 긱벤치 점수는 992점이 되고 4250-992= 3258점이 나머지 A78 3코어의 점수라고 보고 역산하면 A78 클럭은 3.2GHz가 나옴.

이건 터무니없는 클럭으로 엑시노스 미들코어 성능이 스냅875 빅코어 성능에 육박한다는 의미이고, 다른 한 편 멀티코어 모드에서 빅코어보다 미들코어 성능이 더 높다는 의미도 돼서 그대로 받아들이기 어려움.

(단순 계산으로도 4코어 4250점이면 1코어당 점수는 최소 1000점 이상.)

이 방법은 안 맞는 것.

 

다른 방향으로 해보면, 이전 제품을 보면 멀티클럭으로 계산해보면 빅코어 1코어 점수와 미들코어 1코어 점수가 거의 같음.

이런 식으로보면 멀티모드에서 1코어당 점수는 1063점이고 클럭으로 환산하면 X1 2.56GHz, A78 3.1GHz

 

이전 정보를 보면 5nm에서 2.9GHz 찍은 CPU 개발 정황이 있는데

(링크 : 구글 엑시노스 찌라시)

이걸 여기에 대입해서 Cortex-X1 2.9GHz 점수가 1302점으로 보면 클럭당점수는 449로 A77 대비 +40%

SPECint/fp 향상치와 차이가 있는데 이걸 A78에 똑같이 산술적으로 반영하면 A78 클럭당점수는 A77 대비 +15%

이 값들을 반영하면 X1 싱글클럭 2.9GHz, 멀티모드에서 2.4GHz, A78 클럭 2.9GHz

스냅875처럼 멀티모드에서 ALL 코어가 최대 클럭으로 동작한다면 미들코어 클럭은 2.7GHz

 

이걸 스냅875 결과에 다시 적용해보면 빅코어 클럭 3.1GHz, 미들코어 2.7GHz

스냅875 클럭은 확정하긴 어렵지만 그나마 이 쪽이 현실적인 값으로 생각됨.

 

 

- 결론 : 스냅875, 차기 엑시노스 긱벤치 찌라시

1. Cortex-A78, Cortex-X1 성능

Cortex-A77 대비 동클럭 성능

A78 : SPECint/fp 2006 +7% / 긱벤치5 +15%?

X1 : SPECint/fp 2006 +30% / 긱벤치5 +40%?

 

2. 차기 엑시노스 추정

긱벤치5 찌라시 싱글 1302 / 멀티 4250

Cortex-X1 x1 + Cortex-A78 x3

싱글부스트 클럭이 적용되었다면, X1 싱글 2.9GHz, 멀티 2.4GHz / A78 2.9GHz

싱글부스트 클럭이 적용되지 않았다면, X1 2.9GHz / A78 2.7GHz

 

3. 스냅드래곤875 추정

긱벤치5 찌라시 싱글 1159 / 멀티 4090 , 싱글 1102 / 멀티 4113

Cortex-A78 고클럭 x1 + Cortex-A78 x3

빅코어 클럭 3.1GHz, 미들코어 클럭 2.7GHz

 

 

 

Posted by gamma0burst Trackback 0 : Comment 8

댓글을 달아 주세요

  1. addr | edit/del | reply 2020.09.21 22:41

    비밀댓글입니다

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2020.09.22 21:02 신고

      그동안 공정 성능 발표한거로 숫자 맞춰보면 5LPE가 5FF보다 2% 정도 성능이 높은걸로 나오거든요.
      그런데 커뮤니티에서 도는 7LPP 공정 성능이 예상보다 낮았다는 썰들이 사실이라면 5LPE 성능이 5FF보다 낮을 가능성도 있어 보입니다.
      1~2% 정도 낮은걸로 목표성능 미달이라는 얘기를 하지는 않을거 같거든요.

  2. addr | edit/del | reply A TNT 2020.09.24 07:57

    https://browser.geekbench.com/v5/cpu/3876448.gb5 이것도 찌라시긴 하고 점수가 예상보다 낮긴 한데 2.9 x1 + 2.8 x3 + 2.2 x4네요.

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2020.09.24 21:03 신고

      클럭차이로 봐서는 X1이 거의 확정인듯 하네요.

    • addr | edit/del BlogIcon A TNT 2020.09.24 23:01

      클럭 부스트가 적용된 환경에서 X1 2.9 + A78 2.8에 A55 2.2가 들어간 것이라고 해석하는게 맞겠지요? SPEC 기준으로는 A13보다 미묘하게 열세, GB5 기준으로는 A13과 동급이며, GPU는 G78 10 중반 갯수의 클러스터 넣어서 전작 대비 +25% 향상. 이렇게 나오지 않을까 싶네요. 뭐 이정도면 경쟁작을 넘을 수 있는건 아니지만 리스크는 확실히 해소된 셈이네요.

      생각해보면 퀄컴이 일찍 자사 커스텀 코어를 놓았을때 삼성도 빨리 결정해야 했던게 아닐까 싶습니다. 이미 다 지나간 시점에 이런 말은 무의미 하지만요.

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2020.09.25 22:21 신고

      부스트 클럭인지 고정 클럭인지는 계산 좀 해봐야될거 같네요.
      커스텀 코어는 엔비디아가 ARM 먹어버리는 바람에
      버린게 결과적으로 잘한 일이 될지 못 한 일이 될지 두고 볼 일이 돼버린거 같네요.

  3. addr | edit/del | reply Exynos 8895 2020.09.28 23:45

    근데 엑시노스 1000은 이번에 Mali G78일거라던데 몇 코어 정도 들어갈거라 예상하시나요? ARM 레퍼런스로 면적을 좀 줄여도 GPU 성능 확보하려면 저클럭에 16~20코어로 갈거란 말을 들어서 여쭤 봅니다

    • addr | edit/del Favicon of https://gamma0burst.tistory.com BlogIcon gamma0burst 2020.09.30 23:32 신고

      이번에 모뎀이 통합될 가능성이 높으니 GPU 면적에 여유가 없긴 마찬가지일겁니다.
      G78 면적이 크게 개선된 것도 아니고요.
      MP수 늘리는데 제한이 있을겁니다.
      면적으로보면 잘 해야 현상 유지 수준이 아닐런지...

      성능으로보면
      GFX벤치 맨해튼 피크 성능은 엑시990가 스냅865보다 4% 정도 낮고,
      이 상태에서 시작해서 스냅875 성능 수준에 맞추는 정도로 가정하고,
      스냅855 -> 스냅865에서 GPU 성능 향상치보니까 24% 정도네요.
      스냅875에서도 같은 향상치라고 가정하면 합쳐서 엑시노스는 28% 성능 향상이 필요하네요.
      거의 30%

      5LPE 공정 개선치가 11%고 G78 전성비 개선치가 10%면 합쳐서 약 22%
      28% 올리려면 MP수가 5% 늘어야되니 소수점 올리면 MP12로 나오네요.

      면적으로보면
      7LPP -> 5LPE 면적이 20% 감소(면적 효율이 +25%이니)인데 이건 셀 라이브러리 간 비교에서 피크치인걸로 보이고 최소치는 15% 감소 정도로 보입니다.
      GPU 면적이 이전 세대와 같다고 가정하고 저 수치로 역산하면 사양이 18~25% 증가할 수 있는거고 MP수로는 MP13~14가 되네요.

      가정이 많긴하지만 일단 대충 계산한걸 종합하면 G78 MP12~14 인데 클럭을 낮춰서 전성비를 최대한 쥐어짜서 성능을 올리려면 MP14, 면적 중시라면 MP12로 갈듯한데
      엑시노스990에서 MP수 줄인 선택이 좋은 결과를 얻지 못한걸로 보여서 MP14 쪽으로 갈 가능성이 높아보이네요.

      MP14가 분명 MP수가 늘어난건 맞는데 최대 MP16되는 G77로 MP11한거에 비하면
      최대 MP24가 되는 G78로 MP14한게 MP수 늘어난 것처럼 보이지 않는 느낌도 있긴하네요.
      스케일링 규모를 늘린거지 MP 하나당 성능이 줄어든게 아니라서 규모가 늘어난게 맞는데도 말이지요.