본문 바로가기
스마트폰/인텔 Intel Atom

인텔 체리트레일(Cherry Trail/View) GPU 사양/성능 추정. (update 2015.03.13)

by gamma0burst 2015. 3. 8.

 

- 체리트레일 사양 분석/추정이라고 했지만 사실 인텔 내장 그래픽 유닛 전반에 대한 학습을 정리한겁니다.

틀린 부분이 있을 수도 있으니 참고바랍니다.

(뭐 깊게 들어갔다고 학습인지 모르겠지만요.)

 

 

- 체리트레일 사양

성능에 관한 인텔 공개 자료는 많은데 최근 것만 올리겠습니다.

최근 인텔이 아톰 라인업을 X3/X5/X7 로 정리하면서 표면적으로는 체리트레일이라는 코드네임이 안 보입니다.

코드네임으로는 그대로 남아있을듯 하지만요.

체리트레일은 X5/X7 라인업에 해당하고 X3 라인업은 CPU만 아톰코어이고 통신 모뎀, GPU 등은 외부 IP를 활용합니다.

 

 

14nm 공정

CPU : Airmont 기반 최대 쿼드코어 2.4GHz - 사실상 실버몬트와 같은 코어로 공정만 14nm로 변경됐다고 보면 됩니다.

GPU : Gen8 12EU/16EU, 최대 600MHz - 기존 베이트레일이 4EU 최대 900MHz 선.

메모리 : LPDDR3-1600 - LPDDR3-1066에서 클럭만 올라갔습니다.

그 외 부분은 표를 참고.

 

 

GFX벤치 티렉스 오프스크린 기준 베이트레일(Z3795) 대비 최대 2배.

 

 

 

- 인텔 그래픽

체리트레일 GPU세대가 Gen8 이라고 하지요.

최근 세대를 간단히 보면,

 

1. Gen7

아이비브릿지에 들어간 것.

구성은 크게 두 가지.

6EU/1TMU, 16EU/2TMU

1TMU는 4Tex/cycle

 

2. Gen7.5

해즈웰에 들어간 것.

구성 : 10EU/1TMU, 20EU/2TMU, 40EU/4TMU

10EU당 1TMU

베이트레일에 들어간 세대로 베이트레일에는 4EU/1TMU로 추정.

1TMU는 4Tex/cycle

 

1EU당 32bit x4 SIMD FPU가 두개 들어감. (총 32bit 유닛이 8개)

연산성능은 이 FPU를 따라감.

HD4400 (20EU, 1.1GHz)을 예로 들면,

(Mul + Add) x 8SIMD x 20EU x 1.1GHz = 352.0 GFLOPS

 

3. Gen8

브로드웰에 들어간 것.

구성 : 12EU/2TMU, 24EU/3TMU, 48EU/6TMU

8EU당 1TMU

1TMU는 4Tex/cycle

체리트레일에 들어갈 것으로 알려진 사양은 16EU, 600MHz

연산성능과 관련된 부분은 Gen7.5와 동일.

 

 

- GFX벤치 테스트 결과

1. 베이트레일 성능.

4EU

1TMU, 4Tex/cycle

778MHz

맨해튼 오프스크린 : 10.9 fps

티렉스 오프스크린 : 21.1 fps

ALU : 42.4 fps

텍셀 필레이트 : 3097 MTex/s

(링크 : http://gfxbench.com/device.jsp?benchmark=gfx30&os=Android&api=gl&D=Acer%20A1-840%20FHD)

(레노버 요가 태블릿이 최고 결과는 더 높은데 결과 수를 봤을 때 신뢰성이 떨어집니다.)

 

Z3745 결과로 클럭과 사양이 Z3795와 같음.

(Z3795 링크 : http://ark.intel.com/products/80267/Intel-Atom-Processor-Z3795-2M-Cache-up-to-2_39-GHz?q=Intel%C2%AE%20Atom%E2%84%A2%20Processor%20Z3795%20%282M%20Cache,%20up%20to%202.39%20GHz%29)

(Z3745 링크 : http://ark.intel.com/products/80270/Intel-Atom-Processor-Z3745-2M-Cache-up-to-1_86-GHz?q=Intel%C2%AE%20Atom%E2%84%A2%20Processor%20Z3745%20%282M%20Cache,%20up%20to%201.86%20GHz%29)

 

2. 체리트레일 추정 결과.

윈도우 시스템 결과라서 구체적인 시스템 정보가 나오지 않음.

결과는 두 가지입니다.

 

16EU (x7-8700)

2TMU, 8Tex/cycle

맨해튼 오프스크린 : 20.1 fps

티렉스 오프스크린 : 35.3 fps

ALU : 117.0 fps

텍셀 필레이트 : 4371 MTex/s

(링크 : http://gfxbench.com/device.jsp?benchmark=gfx30&os=Windows&api=dx&D=Intel%28R%29%20CherryView%20HD%20Graphics)

 

12EU (x5-8500/8300)

2TMU, 8Tex/cycle

맨해튼 오프스크린 : 20.0 fps

티렉스 오프스크린 : 35.9 fps

ALU : 99.1 fps

텍셀 필레이트 : 4064 MTex/s

(링크 : http://gfxbench.com/device.jsp?benchmark=gfx30&os=Windows&api=dx&D=Intel%28R%29%20HD%20Graphics%20manual-gen8_2014-13144)

이게 왜 12EU 결과인지는 뒤의 분석에서 설명하겠습니다.

 

 

- 결과 분석

1. 16EU

텍셀 필레이트 결과에서 나오는 클럭은 4371/8 = 546MHz 입니다.

클럭은 최소 500MHz는 넘으니 문제는 12EU/16EU 어느 쪽이냐는 것.

 

ALU 결과를 보면 117.0/42.4 = 2.76, 베이트레일의 2.76배 입니다.

ALU 결과는 연산성능에 비례하니

12EU라고 가정하면 클럭은 716MHz

16EU라고 가정하면 클럭은 537MHz

인텔의 발표 사양으로 봤을 때, 16EU쪽인듯 합니다.

 

맨해튼, 티렉스 결과가 제대로 나온 것인지는 뒤에서 따져보겠습니다.

 

2. 12EU

텍셀필레이트 결과에서 나오는 클럭은 4064/8 = 508MHz 입니다.

인텔이 공개한 사양에 500MHz/600MHz 사양이 둘 다 있기때문에 어느 쪽인지 확신할 수 없는 상태.

 

ALU 결과는 99.1 fps로 99.1/42.4 = 2.34배 입니다.

ALU 결과는 연산성능에 비례하니

12EU라고 가정하면 클럭은 606MHz

16EU라고 가정하면 클럭은 454MHz

 

12EU로 가정했을 때, 클럭에 인텔발표 사양과 잘 들어맞는 값이 나왔습니다.

16EU로 추정되는 제품과의 ALU 결과로 보아 이건 12EU 사양인 제품인 것으로 보입니다.

 

3. 맨해튼, 티렉스

ALU결과로 나온 사양과 맨해튼, 티렉스 결과를 정리하면 이렇습니다.

 

16EU

맨해튼 오프스크린 : 20.1 fps

티렉스 오프스크린 : 35.3 fps

 

12EU

맨해튼 오프스크린 : 20.0 fps

티렉스 오프스크린 : 35.9 fps

 

뭔가 이상하지요.

EU 숫자가 차이가 나는데 성능이 비슷합니다.

ALU를 통해 나온 결과로 봤을 때는 12EU 결과가 600MHz에서 나올 수 있는 최적값이라고 볼 수 있습니다.

(현재로는 말이지요.)

그렇다면 16EU는 아직 저기서 성능이 더 올라갈 가능성이 있습니다.

 

GPU 세대도 다르고, 백엔드사양도 다르지만 베이트레일 결과를 기준으로 클럭당성능을 비교해보면,

(기본적으로 비슷한 구조이니...)

 

베이트레일 4EU

맨해튼 : 10.9/0.778 = 14.01 fps/GHz

티렉스 : 21.1/0.778 = 27.12 fps/GHz

 

체리트레일 12EU

맨해튼 : 20.0/0.6 = 33.33 fps/GHz

티렉스 : 35.9/0.6 = 59.83 fps/GHz

 

베이트레일 대비 각각 2.38배, 2.21배로 올랐습니다.

EU 사양이 3배에 저런 성능 향상이고, 성능이 EU사양에 선형적으로 비례한다고 가정하면,

EU사양이 4배(=16EU)에서 각각 3.17배, 2.95배로 계산됩니다.

 

그러면 16EU 600MHz에서의 성능을 계산하면,

 

 

클럭당성능

맨해튼 : 14.01 x 3.17 = 44.41 fps/GHz

티렉스 : 27.12 x 2.95 = 80.00 fps/GHz

 

600MHz에서의 성능은

맨해튼 : 44.41 fps/GHz x 0.6GHz = 26.6 fps

티렉스 : 80.00 fps/GHz x 0.6GHz = 48.0 fps

 

 

- 정리

최종적으로는 이 정도가 나올듯 한데, 역시 나와봐야 알 수 있는 일이겠지요.

 

Atom x7-8700

인텔 Gen8 16EU

2TMU, 8Tex/cycle

600MHz

맨해튼 오프스크린 : 26.6 fps (추정)

티렉스 오프스크린 : 48.0 fps (추정)

Mali-T760MP8 700MHz 수준 (엑시노스7420) (추정)

연산성능 : 153.6 GFLOPS

텍셀필레이트 : 4.8 GTex/s

 

Atom x5-8500

인텔 Gen8 12EU

2TMU, 8Tex/cycle

600MHz

맨해튼 오프스크린 : 20 fps (추정)

티렉스 오프스크린 : 36 fps (추정)

Adreno420, 애플 A8 수준. (추정)

연산성능 : 115.2 GFLOPS

텍셀필레이트 : 4.8 GTex/s

 

 

- 2015.03.13 12EU 사양 추정 추가. 내용 수정.

 

 

 

댓글18