Cortex-A78 제품군 Specint06 결과 분석.
- 엑시노스1480 specint06 결과가 올라와서 같은 아키텍처쓰는 제품들 IPC, 전성비(power efficiency)를 비교해봤음.
변수에 대한 보정없이 아키텍처가 같다는 것만으로 IPC, 전성비 값 비교하면서 본인 입맛대로 결론내리는 경우가 많은데 바로잡을 필요가 있음.
- 테스트 결과 소스
(https://twitter.com/negativeonehero/status/1775866791656603728)
엑시노스1480
테스트 세트 전력에서 아이들 전력을 빼야 코어 전력을 알 수 있는데 엑시노스1480은 아이들 전력값이 없음.
엑시노스1380 테스트에서 아이들 전력이 0.467W였는데 이 값과 큰 차이가 없을거라고 보고 같은 값을 써서 계산했음.
스냅드래곤 780G, 엑시노스1380
(https://gall.dcinside.com/mgallery/board/view/?id=galaxy&no=874122)
그 외 데이터는 골든리뷰어.
- 정리/분석
위 3개는 플래그십 제품, 아래는 하이엔드/미드레인지 제품.
1. 플래그십 - 하이엔드/미드레인지의 차이.
5LPE 공정 제품끼리 비교해보면...
E2100-SD888 비교하면 IPC는 4%, 전성비는 36% 차이.
그런데 E2100-E1280을 비교하면 IPC 18%, 전성비 34% 차이가 나고
SD888-SD780G를 비교하면 IPC 14%, 전성비 26% 차이가 남.
같은 아키텍처라도 플래그십에서 미들코어로 있을 때 IPC, 전성비가 훨씬 높다는걸 알 수 있음.
아키텍처가 같다고 플래그십, 미드레인지 제품을 섞어서 비교하면 안 된다는거임.
플래그십에서 결과가 훨씬 잘 나오는 이유로 보통 L3캐시나 시스템 캐시같은걸 들 수 있겠으나 확실한 근거는 없음.
캐시용량에 따른 IPC 변화를 제대로 테스트한 (공개된) 자료를 본적이 없고, 커뮤니티에서 캐시가 성능에 영향을 끼친다는 주장도 공개되는 ARM 자료나 X64 코어 자료를 통한 추측일뿐임.
기업 내에서는 그런 자료가 굴러다니겠지만 공개적으로 자료 제시가 안 된다면 단언할 수 없다는게 개인적인 생각임.
예를 들어 캐시가 두 배 늘어서 IPC가 올랐다고 해도 향상치가 한 자릿 수냐, 두 자릿 수냐에 따라 해석이 완전히 달라짐.
2. SD695의 높은 전성비.
SD780G-SD778G-SD695를 비교하면 IPC는 최대 5% 차이로 비슷한 수준이고 전성비는 SD695가 제일 높음.
SD695 전성비는 클럭을 낮추면서 전성비가 좋아졌다고 넘어갈 수도 있겠지만
공정이 같은 SD778G와 비교한다해도 클럭이 10% 낮아졌는데 전력이 23%나 내려간건 좀 갸우뚱함.
높은 전성비가 낮은 클럭 덕이라는 가정이 맞다면 N6 공정에서 2.4GHz가 스윗스팟을 크게 넘긴 클럭이라는건데 그렇게 클럭마진이 낮을런지 의문임.
3. 5LPE-N6 비교.
전성비를 비교하면 SD780G-SD778G에서 16%, SD780G-SD695에서 34% 차이가 남.
차이를 작게 잡아도 전력효율만 보면 한 세대 차이고, 5nm-6nm라는 노드 표기까지 고려하면 1.5세대 차이라고 할 수 있을 정도라고 봄.
개인적으로는 초기 5LPE의 안 좋은 상태를 보여준다고 생각하는데 더 부정적으로 보는 쪽에서는 이견이 있을듯.
4. 5LPE 공정의 개선?
E1280-E1380을 비교하면 IPC 5%, 전성비 7% 향상이 있음.
공정 개선(안정화)의 영향을 최소로 잡아도 2%
5. 설계의 차이?
공정이 같은 SD780G-E1280을 비교하면 IPC 8%, 전성비 44% 차이가 남.
전성비 차이의 원인을 공정이라고 볼 수가 없고 설계에 차이가 있다고 볼 수 밖에 없음.
삼성과 퀄컴의 CPU 설계 컨셉(세부사항), 역량의 차이 혹은 Kryo 세미커스텀과 ARM 레퍼런스의 차이 정도로 추측됨.
만약 전자라면 상황이 심각한거고 텐서 CPU의 성능, 전력 문제의 원인으로 설계를 지목할 근거가 될 수도 있음.
후자라면 단순한 택갈이 정도로 인식되던 Kryo가 생각보다 의미있는 세미커스텀 코어라는게 됨.
6. 4LPP 공정의 개선 수준.
E1380-E1480을 비교하면 IPC 2%, 전성비 20% 개선임.
코어 전력이 비슷한걸 보면 2.3W 내외를 전력 기준으로 삼고 가능한 최대 클럭(2.75GHz)으로 셋팅한듯한데
클럭을 안 올리고 전작(E1380) 수준으로 클럭을 유지했다면 전성비 개선은 더 극적으로 보였을듯.
- 종합
Specint 결과를 비교할 때 아키텍처가 같다는 기준만으로 이 제품 저 제품 다 섞어서 비교하는건 제대로 된 비교가 아님.
설계 업체, 제조 업체(공정), 제품 라인업상 위치 등 최대한 공통점이 많고 차이점이 적은 제품 간 비교를 해야 의미있는 결과를 얻을 수 있음.
예를 들면 공통점이 아키텍처 밖에 없는 E1480-SD695를 비교하면서 4LPP 공정이 N6보다 전력효율에서 49% 열등하다는 식의 잘못된 결론을 내서는 안 된다는거.