구글 텐서G3 CPU 성능 이슈 분석. (Tensor G3, S5P9865) (update 23.10.25.)

- 텐서G3 벤치마크 관련 이슈들에 대한 분석, 추정.

픽셀8 출시 후 커뮤니티에서 한동안 시끄러웠는데 지금은 흥미가 떨어졌는지 잠잠해짐.

그동안 나왔던 내용과 개인 의견 정리해봄.

설계 주체의 문제, 발열 원인이 어디인지, 픽셀8 방열 설계가 상대적으로 부실한건 사실이지만 절대적인 기준에서 함량 미달인지 등의 문제가 얽혀서 경우의 수가 매우 복잡함.

정리를 잘 해보려해도 전체가 한 눈에 들어오기 쉽지 않은 내용이라 이걸 감안하고 보시길...

- 긱벤치

긱벤치5,6 IPC 비교.

빅코어 아키텍처로 Cortex-X3를 쓰는 스냅드래곤8 gen2, 엑시노스2300과 비교.

세 제품 모두 코어 리비전은 r1p0

IPC를 비교해보면 긱벤치5에서는 스냅8 gen2 대비 -7%, 긱벤치6에서는 스냅8 gen2, 엑시노스2300 대비 -5%를 보임.

여기서 확인할 수 있는 점은

1. 엑시노스2300과 스냅8gen2의 빅코어 IPC는 동급임.

2-1. 텐서G3의 CPU 설계가 삼성일 경우.

만약 알려진대로 텐서G3의 CPU 설계를 삼성에서 했고 베이스가 엑시노스2300이라면 텐서G3의 IPC가 떨어지는건 어떤 문제가 있다는 것임.

엑시노스2300 커널 내용을 보면 엑시노스2300 CPU 클럭은 최대 3.07 / 2.65 / 2.11GHz(빅/미들/리틀) 이었는데

( 엑시노스 커널 정보. (갤럭시A14 5G 소스, 2023.03.11.) )

텐서G3는 초기 벤치에서는 3.02 / 2.45 / 2.15GHz이었고 출시 사양은 2.91 / 2.37 / 1.70GHz로 초기 사양보다 클럭을 낮췄음.

( 구글 텐서 G3 긱벤치5 초기벤치. (Tensor G3, S5P9865, Ripcu )

그리고 픽셀8 분해를 통해 베이퍼 챔버도 없는 구글의 부실한 방열 설계가 확인되었음.

엑시노스2300의 3.07GHz가 실사용이 불가능한, 커널 상에만 존재하는 값이라고 볼 수도 있겠으나 공정상 그렇게 큰 차이가 나지도 않는 엑시노스2400, 스냅8 gen3의 빅코어 클럭을 봤을 때 절대 그렇게 무시하고 넘길 수 있는 값은 아님.

하지만 다른 한 편으로는 테스트 플랫폼도 아니고 SM-S919O라는 갤럭시 제품명으로 된 테스트 결과에서 2.6 / 2.59 / 1.82GHz라는 다소 낮은 클럭 셋팅이 확인됨.

( 엑시노스2300 긱벤치ML 초기 결과 분석. )

어쨌든 이를 통해 다음 가설이 가능함.

가설2-1-1 : 삼성은 갤럭시 방열 설계 TDP를 기준으로 구글에 최대 클럭을 전달했고 구글은 초기에 그 값으로 테스트를 해봤으나 픽셀의 방열 설계로는 감당할 수 없는 수준이어서 다운클럭해서 출시했다.

다른 한 편으로 엑시노스2300 긱벤치6 시스템 정보를 보면 빅코어, 미들코어 클럭이 2.02GHz로 매우 낮음.

SM-S919O ML 테스트 클럭도 빅코어, 미들코어 클럭이 같아서 성능을 최대로 뽑아낸 셋팅은 아닌 것으로 보임.

긱벤치6에서는 빅코어, 미들코어 클러스터 구분도 안 한 것에 비해 ML 테스트에서는 구분이 되어있어서 좀 더 개발이 진척된? 셋팅인거 같기는 함.

최악으로 가정하면 겨우 2.02GHz가 가능할 정도고, 최선으로 가정하면 2.6GHz은 무난하고 그 이상을 타겟으로 최적화 중이었다고 볼 수도 있음.

어쨌든 가능성만 보자면

가설2-1-2 : 엑시노스2300 CPU 설계부터 전력에 문제가 있었고 이걸 그대로 가져서 쓴 텐서G3가 일반 클럭으로 동작하면서 문제가 드러난 것이다.

긱벤치에서 텐서G3의 IPC가 낮은건 진짜 IPC가 낮은게 아니라 최대 클럭으로 싱글코어 테스트를 통과하지 못 할 정도로 발열이 있기때문이다.

2-2. 텐서G3의 CPU 설계가 구글일 경우.

가설2-2-1 : 구글의 칩 설계 역량이 삼성보다 못 하다?

가설2-2-2 : 구글의 설계는 문제가 없었지만 픽셀의 방열 설계가 부실한 탓이다?

- specint06

골든리뷰어의 IPC, 전성비 측정 결과.

빅코어 결과를 보면 기준이 될 스냅8 gen2에 비해 IPC가 -15%, 전성비는 -36%

미들코어 결과를 보면 스냅8 gen2에 비해 IPC가 -8%, 전성비 -34%

모두 전성비가 전작 텐서는 물론이고 낮은 공정성능으로 까인 엑시노스2100, 2200보다도 낮음.

전작 텐서나 베이스가 됐을 것으로 예상되는 엑시노스 결과를 보면 같은 아키텍처 간 비교에서 IPC가 최대 10% 정도 떨어지는건 특이한 일이 아님.

테스트 오차든 발열 문제든 설계 문제든 있을 법한 차이인 것.

여기서 의문점은 빅코어의 낮은 IPC와 빅코어, 미들코어 모두에서 나타나는 지나치게 낮은 전성비임.

왼쪽은 위 차트를 공개하기 전 골든리뷰어에서 올린 텐서G3 테스트 결과인데 462.libquantum 항목이 제대로 테스트되지 않는다는 것이었음.

테스트 결과를 봐도 시간이 오래걸리고 소비전력도 낮아서 정상 구동된게 아님을 알 수 있음.

그 결과 총점이 43.52인데 위 차트의 빅코어 결과도 43.52인걸보면 이 문제를 결국 해결하지 못 하고 그대로 쓴 것으로 보임.

실제로 해당 항목의 25.05라는 점수는 비정상적으로 낮은 점수인데 아난드텍의 자료 (그나마 저게 최신)를 참고하면 스냅888 Cortex-X1 2.84GHz로 106.55가 나오는 테스트임.

(https://www.anandtech.com/show/16463/snapdragon-888-vs-exynos-2100-galaxy-s21-ultra/4)

텐서G3 스펙상 저거보다 낮은 점수가 나오는건 가능성이 거의 없다고 볼 수 있는데 25.05 대신 106.55를 적용해서 specint06 점수를 재계산하면 49.10이 나오고 이걸로 IPC를 계산하면 16.87이 나옴.

스냅8 gen2 대비 -5%인데 이 정도 차이는 납득할만한 수준이고 106.55는 사실상 최소 가정값이기때문에 (일어날 일은 없겠지만) 462 항목이 제대로 테스트된다면 차이는 더 줄어들었을 것임.

IPC 문제는 코어 전체의 전반적인 문제가 아닌 특정 테스트 항목이 원인이었던 것.

다만 이렇게 점수를 정상화시켜서 전성비를 재계산해봐도 10.45로 크게 달라지지 않음.

게다가 이건 기존의 전력값인 3219.54W를 그대로 사용한건데 실제 정상 구동된다면 다른 테스트처럼 5~5.5W 내외가 나올 것이기때문에 전성비는 오히려 떨어질 가능성이 높음.

3. specint06 테스트에서 빅코어 IPC 문제는 코어 전체의 전반적인 문제가 아닌 특정 테스트 항목의 문제이다.

4. specint06 테스트에서 빅코어, 미들코어 모두 전성비에 문제가 있다.

- GPU 테스트

골든리뷰어 테스트 결과.

같은 아키텍처인 D9200과 전성비를 비교하면 오차범위 동급임.

D9200 공정인 TSMC N4P인데 이와 비교해서 이 정도 전성비면 삼성 4LPP(SF4) 공정은 문제가 없어 보임.

5. GPU 전성비 테스트를 보면 삼성 공정 문제는 없다.

텐서G3 GPU가 실제 MP8인데 1개를 컷해서 MP7로 출시했다는 루머도 있음.

사실이라면 그 덕에 GPU 전성비가 잘 나왔다고 볼 수도 있겠으나

클럭-전압 특성으로 인해 같은 성능이라도 저코어-고클럭에 비해 다코어-저클럭이 전성비가 좋다는걸 고려하면 컷칩으로 내는건 전성비를 낮추는 방향이고

수율, 성능때문이 아니라 애플처럼 후속 제품을 위한 성능향상 마진 확보 차원일 가능성도 있어서 이 부분은 지금 결론내기는 어려움.

specint06 테스트 결과를 통해 설계가 어느 쪽이든 발열(전력) 측면에서 문제가 있는건 확인되었음.

픽셀8의 방열 설계가 일반적인 수준의 발열도 감당하지 못 할정도로 부실하고, 이것이 벤치마크시 CPU가 최대클럭으로 동작하지 못 하게 만들었느냐의 문제가 남는데

GPU 벤치마크에서 GPU가 4.7~5.8W를 소비함에도 준수한 전성비가 나왔음.

(실제 칩 전체 소비전력은 저것보다 높을 것임.)

픽셀8 방열 설계가 저 정도 발열은 감당할 수 있다는 것임.

CPU 벤치마크에서 소비전력 증가치는 4.3W, 2.18W 불과해서 픽셀8 방열 기구로 감당할 수 있는 수준으로 봐야하고, 테스트시 클럭 저하가 있다고 보기 어려움.

클럭 저하가 있다해도 다른 스마트폰, 칩과 비슷한 수준이지 픽셀8이 독보적으로 심하다고 보기 어려울듯.

(GPU와 CPU 싱글코어의 면적까지 고려한 열밀도 관점에서 CPU가 불리하다고 할 수도 있는데 그런 부분까지 끌고 들어와서 텐서G3 CPU를 옹호하는건 좀 없어보이는거 같음.)

6. CPU 성능 저하의 원인을 부실한 픽셀8 방열 기구로 보기는 어렵다.

다른 스마트폰에 비해 부실한건 사실이지만 CPU 성능 문제의 주원인은 칩에 있다.

- 요약

1. 엑시노스2300과 스냅8gen2의 빅코어 IPC는 동급임.

2-1. 텐서G3의 CPU 설계가 삼성일 경우.

가설2-1-2 : 엑시노스2300 CPU 설계부터 전력에 문제가 있었고 이걸 그대로 가져서 쓴 텐서G3가 일반 클럭으로 동작하면서 문제가 드러난 것이다.

~~긱벤치에서 텐서G3의 IPC가 낮은건 진짜 IPC가 낮은게 아니라 최대 클럭으로 싱글코어 테스트를 통과하지 못 할 정도로 발열이 있기때문이다.~~

2-2. 텐서G3의 CPU 설계가 구글일 경우.

~~가설2-2-1 : 구글의 칩 설계 역량이 삼성보다 못 하다?~~

~~가설2-2-2 : 구글의 설계는 문제가 없었지만 픽셀의 방열 설계가 부실한 탓이다?~~

3. specint06 테스트에서 빅코어 IPC 문제는 코어 전체의 전반적인 문제가 아닌 특정 테스트 항목의 문제이다.

4. specint06 테스트에서 빅코어, 미들코어 모두 전성비에 문제가 있다.

5. GPU 전성비 테스트를 보면 삼성 공정 문제는 없다.

6. CPU 성능 저하의 원인을 부실한 픽셀8 방열 기구로 보기는 어렵다.

다른 스마트폰에 비해 부실한건 사실이지만 CPU 성능 문제의 주원인은 칩에 있다.

- 가설 정리

CPU와 GPU의 전성비 이렇게 갈리는 것, 특정 테스트에서 문제가 있는 칩을 그대로 출시한 것은 모두 텐서G3 설계 주체에 대한 문제로 연결됨.

같은 공정으로 제조된 두 블록에서 서로 다른 전성비를 보이는걸 파운드리 탓으로 돌리기는 어려움.

먼저 특정 테스트 문제에 대해 다뤄보면

긱벤치나 specint같은 테스트는 제조사 입장에서 피해갈 수 없기때문에 이런 문제는 빠르면 시뮬레이션, 못 해도 샘플 테스트 단계에서 걸러지는게 정상임.

그래서 이 문제가 여러 검증 단계를 기적적으로 뚫고 누구도 눈치채지 못 한체 출시됐다는건 성립할 수 없는 얘기임.

즉, 구글은 이걸 알고도 칩을 그대로 쓰고, 제품을 출시했다는 것임.

그렇다고 무대책으로 제품을 내놓을 수는 없으니 하드웨어 버그를 SW로 우회조치해서 출시했고 그 때문에 돌아는가지만 성능손실이 극심하다고 볼 수 있음.

그렇다면 왜 제대로 수정하지 않고 그대로 냈는가가 의문임.

삼성, 구글의 관련 부서가 정상적으로 돌아갔다면 촉박한 일정이 원인일 가능성이 높음.

하드웨어 버그가 발생했으면 설계를 수정해야되는데 수정해서 다시 백엔드~테이프 아웃~양산까지의 절차를 다시 밟기에 시간이 부족했던게 아닐런지...

일정에 쫓겼다면 일단 초기 물량은 SW로 땜빵해서 물량보내고 이후 리비전된 제품이 나오는 경우도 기대해볼 수 있겠으나 픽셀 판매량을 고려하면 가능성이 매우 낮아보임.

설계 주체로 넘어가면

(엑시노스2300이 양산 취소되지 않고 출시된다든가 하는 식으로 추가적인 정보가 있다면 경우의 수를 더 줄이고 진상에 다가갈 수 있겠지만 현재로는)

CPU, GPU 각각 설계가 삼성, 구글인 4가지 경우의 수가 있음.

구글의 설계 가능성을 다루는건 루머에 이어 최근 실제 구글이 차기 텐서칩을 TSMC에서 테스트 생산한 이력이 확인되었기때문임.

( 팹리스 파운드리 단신 (2023.10.13. 퀄컴, 삼성, 구글) )

이는 구글이 설계 영역에서 완전히 삼성과 결별하려는 시도를 했다는건데 구글의 자체 설계 역량없이는 불가능한 시도이고

그런 역량이 갑자기 생기는 것이 아니기에 텐서G3에서도 구글이 제한적이더라도 설계에 참여했을 가능성을 열어둔 것.

1. CPU, GPU 모두 삼성 설계.

삼성이 CPU를 설계했다면 공정, 코어 구성이 같은 것으로 보이는 엑시노스2300 설계를 그대로 가져왔을 가능성이 높음.

루머로는 evt까지는 진행됐다고 하고 테스트 이력에서 갤럭시 제품까지 나왔던 것을 보면 MX에 샘플 제공이 가능했던 단계까지 진행됐던 것으로 보임.

아무리 삼성의 설계 능력이 떨어진다해도 개선된 공정에서 이전 세대 제품보다 전성비가 떨어진다는건 상식적으로 납득하기 어려움.

그렇다면 엑시노스2300은 CPU 설계 최적화나 버그 픽스가 끝지 않은 상태에서 개발이 중지됐다고 볼 수 있음.

엑시노스2300 양산취소, 텐서G3 사양 루머가 인터넷에 공공연히 나온 시기를 보면 엑시노스2300 양산 취소는 22년 5월경, 텐서G3 사양은 22년 8월경임.

삼성 내부의 결정을 내린 시점이 각각 그보다 빠르다해도 엑시노스2300 개발 중단과 텐서G3의 수주 확정 사이에는 3개월 이상의 차이가 있는 것.

그리고 텐서G3 사양 확정부터 출시까지 1년 2개월 정도가 걸리는데 양산에 필요한 시간만 1년에 가까운걸 고려하면 설계-양산까지 절차를 밟기에는 턱없이 짦음.

중단됐던 CPU 작업 다시 시작했을텐데 아무 것도 안 하고 양산에 넘겼다고 볼 수는 없겠지만 정말 필수적인 작업만해서 넘겼다고 보는게 타당하고, 그 결과가 빅코어의 특정 기능 문제, 낮은 전성비라고 해석할 수 있음.

(상식적인 선에서 일이 진행됐다는 가정에서 그렇게 볼 수 있는 것이고 최악의 가정으로는 삼성이 여러 이유로 노력없이 미완성 설계를 그냥 던졌을 수도 있음.)

그런데 이렇게 일정 문제를 원인으로 잡으면 삼성 GPU도 설계했는데 전성비가 양호하다는게 설명하기 어려움.

CPU는 그나마 엑시노스2300이란 베이스라도 있지 G715는 삼성에서 쓰지도 않아서 일정 문제가 더 크게 다가올텐데 CPU보다 좋은 결과를 냈다는게 됨.

외부 업체나 인력 여유가 있는 해외의 다른 설계부서에 넘겼을 가능성, ARM의 POP같은걸 활용했을 가능성 정도를 생각해볼 수 있겠으나

그게 가능했다면 CPU도 그렇게 했으면 될 문제여서 어느 쪽이든 CPU, GPU의 완성도 차이는 설명하기 어려움.

(중저가형 엑시노스를 위해 미리 설계해뒀다는 가설도 가능하겠으나 이건 너무 편의주의적 해석인듯.)

2. CPU 삼성 설계, GPU 구글 설계.

CPU 부분은 1에서 다룬 그대로고 GPU가 구글 설계라면 CPU, GPU의 완성도 차이가 어느 정도 설명이 가능해짐.

구글 내부에서는 삼성에서 생산할 것을 염두해두고 미리 작업하고 있었다고 볼 수 있음.

3. CPU 구글 설계, GPU 삼성 설계.

CPU를 구글에서 설계했다면 2의 GPU 경우처럼 되어야하기때문에 완성도가 떨어질 수 밖에 없는 이유가 있어야됨.

텐서G3도 TSMC에서 생산하려다가 실패했고, TSMC 공정에 맞춰 설계하던걸 엎고 삼성 공정에 맞춰 다시 설계하느라 일정이 촉박했다는 가설이 가능함.

그렇다면 삼성은 구글에 비해 비슷하거나 더 짧은 기간에 GPU 설계를 잘 해냈고 구글은 CPU 설계를 제대로 못 했다는 얘기가 됨.

삼성과 구글의 설계 역량에 차이가 있다는 결론이 나는 것.

4. CPU, GPU 모두 구글 설계.

1번 경우처럼 두 블록의 완성도 차이는 모순될 수 밖에 없음.

개인적으로는 2번 가능성이 제일 높고 작게나마 1번 가능성이 있다고 생각함.

- 정리, 요약

지금까지의 가설에 사견에 의한 가중치를 포함해서 정리하면 다음과 같음.

1. 삼성, 구글의 설계 능력은 문제없음.

2. 삼성 파운드리 SF4(4LPP) 성능은 양호함.

3. 엑시노스2300 양산취소, 구글 내부 사정으로인해 텐서G3의 개발일정이 촉박했고 이 때문에 CPU 설계 완성도를 최대로 올리지 못 한 것으로 추측.

4. GPU 설계 완성도가 양호한건 삼성에 텐서G3 생산을 맡기기 전부터 구글이 설계하고 있었기때문이 아닌가 추측.

- update (2023.10.25.)

추가 확인 결과 텐서G3 설계는 CPU 프론트엔드 삼성/백엔드 구글, GPU 구글인 것으로 추정됨.

( 구글 텐서(Google Tensor) 설계 주체 검증. )

CPU 설계에 삼성, 구글 모두 관여했다 할지라도 앞서 언급한 CPU 문제를 납득하기 어려운건 그대로여서 위의 정리, 요약이 바뀌지는 않음.

4번의 추측이 사실로 확인됐다는 것, 여러 가정으로 추정한 가설이 새로운 사실이 나타났음에도 유효하다는 것 정도가 수확인듯.

- 텐서G4 예상 (Tensor G4, S5P9875?)

구글이 텐서G4를 TSMC에서 생산하려다가 수익성 문제로 거부당했다는 루머가 있었고, 시험생산까지 해본 이력이 나와서 구글이 자체 설계능력이 있고 탈삼성하려는 의도가 있다는건 분명해졌음.

그럼에도 결국 텐서G4는 삼성에서 생산하는 흐름으로 보임.

그렇다면 1년마다 발표되는 텐서 스케줄상 텐서G4 일정도 그렇게 여유로워 보이지 않음.

이번에서 삼성(엑시노스) 설계를 대량으로 끌어쓸 수 밖에 없는 상황인 것.

베이스는 엑시노스2400이 될 가능성이 높으니 Cortex-X4, Cortex-A720, Cortex-A520 구성이고 공정도 같은 4LPP+(SF4P)

CPU 클러스터는 엑시노스2400과 같은 1+2+3+4의 가능성이 있겠으나 이전 텐서(G1)에서 변덕부린 이력이 있고, 클러스터 변경시 스케줄러까지 바꿔야해서(특히 1+4+4에서 1+2+3+4는 복잡해지는 방향.) 구글이 그런 번거로움? 귀찮음? 피하려 한다면 계속 1+4+4의 구성을 유지할 가능성도 있음.

GPU는 텐서 →텐서G2 에서 아키텍처가 바뀐 사례가 있어서 G720일 가능성이 높음.

하지만 텐서G3 GPU가 실제 MP8인데 1개를 컷해서 MP7로 출시했다는 루머가 사실이라면 풀침인 G715 MP8로 나올 가능성이 있음.

이렇게 된다면 텐서G3가 MP7로 나온건 수율의 문제가 아니라 텐서G4의 TSMC 생산이 무산된 것의 영향이라고 볼 수 있음.

TSMC 생산을 타겟으로 G720 설계를 했는데 이게 무산되고 촉박한 일정으로 삼성에서 생산하게 되니까 기존 G715 설계를 활용할 수 밖에 없게 되었고, 똑같은 사양으로 공정 성능 향상에 따른 클럭향상만 적용해봤자 텐서 G3 → 텐서 G4 의 성능향상이 너무 작아짐.

성능 격차를 위해 텐서G3 MP1을 비활성화해서 MP7로 냈다는 가설이 가능해짐.

이 경우 공정 성능 향상치를 클럭 향상에 온전히 투입한다면 텐서G4 GPU 성능은 텐서G3의 +26% 정도로 예측.

저작자표시 비영리 변경금지

'스마트폰 > 기타업체 ETC' 카테고리의 다른 글

구글 텐서G4 추정 긱벤치5 결과. (Tensor G4) (1)	2024.02.14
구글 텐서(Google Tensor) 설계 주체 검증. (3)	2023.10.25
하이실리콘 Hi3660 그래픽 성능. (HiSilicon Hi3660) (11)	2016.08.24
LG 뉴클런2 추정 유출 벤치 분석. (LG Nuclun 2 ?) (12)	2016.07.18
Renesas R-Car H3 (1)	2016.03.23