- 이매지네이션에서 차기 모바일 GPU인 PowerVR 시리즈7 을 발표했습니다.

http://blog.imgtec.com/powervr/powervr-series7xt-gpus-push-graphics-and-compute-performance

http://blog.imgtec.com/powervr/new-powervr-series7xe-family-targets-the-next-billion-mobile-and-embedded-gpus

http://www.imgtec.com/powervr/series7xt.asp

http://www.imgtec.com/powervr/series7xe.asp

 

 

- 시리즈 7XE

저가형입니다.

 

 

GE7400 : 1클러스터(USC) - 클러스터당 8파이프라인(FP32 x16 + FP16 x32)

GE7800 : 1클러스터(USC) - 클러스터당 16파이프라인(FP32 x32 + FP16 x64)

 

테셀레이션 co-processor는 옵션입니다.

하드웨어 테셀레이션 지원이 옵션이라는 얘기.

 

 

 

벤치마크 A,B,C는 GFX벤치 이집트/티렉스/맨해튼으로 추측됩니다.

6XE와 비교해서 같은 사양에서 티렉스 +45%, 맨해튼 +41% 이라는데 6XE 쓰는 제품이 거의 없어서 비교가 의미가 있을지 의문.

 

 

- 시리즈 7XT

아무래도 이게 메인이지요.

 

 

하드웨어 테셀레이션 지원.

FP64를 지원합니다만 옵션입니다. 제조사에 따라 들어갈 수도 있고 안 들어갈 수도 있고.

7XE와 달리 전부 1클러스터(USC)당 16파이프라인입니다.

FP32 x16 + FP16 x32 + (FP64 x1 : 옵션)

Open GL ES 3.1 지원. (AEP)

 

 

라인업은 이렇습니다.

GT7200 : 2클러스터(USC) - FP32 x64 + FP16 x128 + (FP64 x2 : 옵션)

GT7400 : 4클러스터(USC) - FP32 x128 + FP16 x256 + (FP64 x4 : 옵션)

GT7600 : 6클러스터(USC) - FP32 x192 + FP16 x384 + (FP64 x6 : 옵션)

GT7800 : 8클러스터(USC) - FP32 x256 + FP16 x512 + (FP64 x8 : 옵션)

GT7900 : 16클러스터(USC) - FP32 x512 + FP16 x1024 + (FP64 x16 : 옵션)

 

 

시리즈 6XT와 비교해서 동일사양일 때, 최대 60% 성능향상이 있다고 합니다.

벤치마크 A,B,C는 GFX벤치 이집트/티렉스/맨해튼으로 추측됩니다.

그렇다면 같은 사양에서 티렉스 +61%, 맨해튼 +35%

요즘 왠만하면 성능 향상치 갖고 장난 안 치는걸 생각하면 상당한 성능향상입니다.

 

 

전력효율이 올라가서 쓰로틀링이 없다고 합니다.

Tier1 디바이스는 애플 제품같은데(이매지네이션 입장에서 애플만한 고객이 없지요.) 거기서 쓰로틀링에 의한 성능 저하가 20% 미만이라는듯.

(제품별로 GPU 쓰로틀링이 어느 정도인지 알아봐야할듯.)

 

 

일부 기사를 보면 최대 1.5TFLOPS라고 하는데 이건 FP16 기준일 가능성이 높습니다.

16클러스터인 GT7900 기준이라고 FP32에서 1.5TFLOPS가 나오려면 1.46GHz가 나와야하는데 이건 불가능한 수준이지요.

FP16 기준이라면 732MHz로 가능합니다.

사양을 생각하면 높은 클럭이지만 터무니없는 클럭은 아니고, 이매지네이션이 연산성능을 과장해서 말하는 경향이 있다는걸 생각하면 FP16이 맞겠지요.

 

 

- 사실 특별한 내용이 없습니다.

아키텍처 정보 자체는 알아두면 좋겠지만 그렇다고 그걸로 제품화될 성능을 추정할 수는 없으니까요.

 

- 2014.11.21

슬라이드 추가로 찾아서 내용 추가했습니다.

http://pc.watch.impress.co.jp/docs/news/event/20141120_676975.html

 

 

 

Posted by gamma0burst Trackback 0 : Comment 17

댓글을 달아 주세요

  1. addr | edit/del | reply 흡혈귀왕 2014.11.16 21:04 신고

    드디어 테셀레이션과 FP64 지원이군요.....

    최초의 PowerVR6 발표때도
    테셀레이션과 FP64 언급이 있었던걸로 기억하는데
    어느순간 나중에 추가 발표때 싹 들어가고

    지오매트리 쉐이더까지만 지원으로 말바꿨는데..(뭔 문제가 있었던지 아님 시기상조라 느꼈던지)

    가만 생각해보면 애네들이 GPU 정보가 제일
    적은듯하네요..스펙시트도 그렇고

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2014.11.16 21:34 신고

      저렇게 연산유닛 구성 알려주는 것만해도 고맙지요.
      말리는 정보나오는게 거의 없는 수준이니까요.

      FP64나 테셀이나 당장 쓸모가 있는지는 모르겠네요.
      AEP 지원 측면에서 의미가 있을 것 같긴한데 말입니다.

  2. addr | edit/del | reply Favicon of http://ㄴ BlogIcon ㅋㅋㅋ 2014.11.19 09:59 신고

    하 말리 이ㅂㅅ들은 기술력이 딸리는건가 일부로 안만드는건가? ㅡㅡ

  3. addr | edit/del | reply 궁금 2015.01.10 11:50 신고

    그렇다면 A9X는 8클러스터 A9는 4클러스터로 나온다는 가정하에

    60%성능향상이 있다는 건가요?

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2015.01.10 14:24 신고

      A9X, A9 사양은 지금으로는 알 수 없지요.
      애플 AP와 별개로 시리즈6과 시리즈7 GPU의 성능 차이가 그렇다는겁니다.
      수치로 봐서는 같은 6클러스터끼리의 비교로 보이네요.

  4. addr | edit/del | reply ㅁㅋㅊㅍ 2015.11.03 03:25 신고

    a9가 gt7600이라는 가정하에 저 스로틀링 표를 사실이 되어버렸네요.

    제가 6s+를 가지고있는데 벤치를아무리재도 33.6프레임으로 내려가지않습니다.

    티렉스 온스크린은 수직동기화가걸려서 맨해튼 온스크린,오프스크린,티렉스오프스크린

    이렇게체크하고 벤치끝나자마자 바로 다시돌리고 반복해도

    20분정도 돌리면 33.6프레임이나오는데 여기서 30분동안 계속 반복해줘도

    33.6프레임 미만으론 내려가지않는군요. 대략 13~14%정도 스로틀링걸리는거니까..

    여름이나 크기가작은 6s도 많이내려가봤자 20%정도 선이겠네요.

    아무튼 대단합니다. 아난드텍 분석으로는 7420 gpu가 5w정도 전력을소모한다는데

    비슷하거나 더 낮은 전력소모로 7420의 1.5배의 가까운 성능을 내주는군요;;

    그리고 저 표가 정말 사실이되어버린건 20%미만스로틀링도있지만

    7420을 단 노트5나 갤럭시s6는 롱텀퍼포먼스에서 스로틀링이 심하게걸려서

    프레임이 반토막나버린다는거.. 퀄컴 810은 좀 덜하긴하지만

    이것도 60%수준으로 떨어져버리니.. 저기 표보면

    40~60%정도 드랍된다고 써있는데 40%드랍은 스냅드래곤

    60%드랍은 말리760정도로 생각해보면 딱 맞기도하구요
    (이정도면 시리즈7발표당시 경쟁기기의 정보를 알고있었던건지도
    모를정도로 절묘하게 딱 맞는군요 ㅡㅡ;)

    뭐 6s+의 gpu전력소모를 자세히 알지는 못하지만

    분해해보면 히트파이프같은것도없고 방열판도 특별히

    달려있지 않는걸보면 특별히 전력소모가 심한거같지도않네요.

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2015.11.03 07:33 신고

      원래 기존에도 이메지네이션 GPU가 long term performanc는 잘 나왔습니다. (애플, 인텔 정도 밖에 없긴하지만...)
      경쟁사 제품 정보는 당연히 알고 있을겁니다.
      저 그래프가 아무 근거도 없이 나온게 아니라 실측 data로 만들었을테니까요.

    • addr | edit/del BlogIcon A TNT 2015.11.03 12:55 신고

      전력소모쪽은 좀 아닌거 같습니다. 확실히 쓰로틀링 없이 성능 유지는 잘되지만 동일 밝기(280nits)에서 GFX 배터리벤치 돌린거 보면 6s+가 최하위권이라...

    • addr | edit/del ㅁㅋㅊㅍ 2015.11.03 15:54 신고

      아난드텍분석이 잘맞다면 배터리 10wh약간안되는 갤럭시s6역시 2시간도 못버터야 정상입니다. 화면크기차이에다가 아몰이 전력소모 유리한거 생각하면 이매지네이션 gpu가 전력소모가 그닥 높지않다고밖에 생각안듭니다... 또 수직동기화 걸리는 배터리테스트 60프레임이 7420 스로틀링 안걸이는 최대 프레임이랑 비슷하기도 하구요. 그런거보면 전력효율이 이전에비해 아쉬운거지 타사gpu랑 비교하면 여전히 좋은거죠.. 저도 절대전력소모가 낮다고는 생각안합니다. 단지 퍼포먼스 생각하면 전력효율이 좋다는거죠.

    • addr | edit/del ㅁㅋㅊㅍ 2015.11.03 16:02 신고

      플웨즈테스트도 좀 그런개 한쪽은 성능이높아 수직동기화걸리고 한쪽은 스로틀링이 왕창걸리는데 그냥 뭉뚱그려 배터리테스트타임을 그리잡아놓으면 이건 좀 아니라는 생각이 .. 저런식이면 스로틀링 덜걸리는 쪽이 무조건 낮게나올수밖에 없죠.. 저도 아이폰으로 배터리테스트 1시간넘게돌렸는데 60프레임 계속나옵니다 반면 갤럭시는 원래 티렉스 fhd기준 50프레임 후반대인데 중간에 스로틀링 팍팍걸려서qhd 온스크린에서 15-17프레임나와요..fhd로 생각하면 30프레임 미만입니다;; 저런 결과를보고도 무작정 배터리테스트에서 오래간다고 좋아하면 .. 예전에 엔비디아가 지포스500에서 성능제한해서 발열잡은걸로 아는데 그거보다 더합니다.

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2015.11.03 16:36 신고

      GFX벤치 배터리 테스트는 온스크린 기준입니다.
      오프스크린 성능 기준으로 얼마 떨어지고 이런건 안 맞는 비교.

      플웨즈 테스트 방식이 맘에 들고 안 들고는 개의 의견이겠으나, 배터리 테스트의 기본 목적을 생각하면 성능은 별 상관없습니다.
      실사에서 배터리 타임이 어떠냐가 주목적일테니까요.
      그렇기때문에 그걸 놓고 GPU 소비전력이나 전성비를 비교하는건 무리가 있겠고요.

      쓰로틀링 얘기하면서 아이폰하고 비교들어가면 해상도 차이를 언급 안 할수가 없습니다.
      그걸 놓고 해상도 낮은 쪽은 수직동기화로 성능 압승이고 해상도 높은 쪽은 얼마 떨어지고 이런 얘기해봤자 긁어 부스럼입니다.

      아이폰이 GPU 쓰로틀링에서 유리한건 이매지네이션 GPU 덕이 크다고 봐야 합니다. (물론 애플 설계 효과가 아예 없다고는 못 하겠으나...)
      SGX544 쓰는 엑시노스5410도 롱텀 퍼포먼스와 티렉스 온스크린 성능 차이를 보면 아이폰하고 유사한 경향을 보이고 있을 정도니까요.

    • addr | edit/del ㅁㅋㅊㅍ 2015.11.03 17:01 신고

      수직동기화 감안하고 글 쓴겁니다. 어쨋든 성능이 절반넘게 떨어지는건 사실이니까요.. 그리고 실제 게임에서 수직동기화걸리거나 해서 성능 다 안쓰는경우도 많아서 실제 비교라고 보긴 힘들죠..

    • addr | edit/del ㅁㅋㅊㅍ 2015.11.03 17:07 신고

      근데 이매지네이션쪽이 스로틀링에 강한이유는 뭔가요? 전력소모가 적어서 그런건가요?? 원인이 무엇이든 저런건 좀 본받았으면 좋겠습니다. cpu야 애플에엔 쿼드코어이상이 대세니까 cpu를 최대성능으로 쓸일도 별일없지만 gpu는 지속적인 부하가 계속걸리니 유지력이 중요하니까요..

    • addr | edit/del BlogIcon 2015.11.03 17:11 신고

      배터리 테스트할때 어차피 전력소모 기반 쓰로틀링은 인텔만 먹이니 상관 없습니다. 그때걸리는 쓰로틀링은 써멀쓰로틀링이니까요 그렇다고 잉폰이 딱히 다른폰들보다 발열이 적은것도 아니고요(물론 벤치마크 기준입니다. 실사할때는 api나 최적화, os특성등으로 아이폰이 유리)

      그런데 노트5 롱텀 퍼포먼스가 60%까지 떨어진다는 자료가 있나요?

    • addr | edit/del Favicon of http://gamma0burst.tistory.com BlogIcon gamma0burst 2015.11.03 17:25 신고

      온스크린 테스트도 수직동기화 걸려서 실사 수준으로 볼 수 있습니다.
      테스트 결과보면 아시겠지만 온스크린 결과는 60 fps 안 넘어갑니다.

      중간중간 사실관계랑 다른 부분 얘기하시는데 지금 여기서 중요한건 그런게 아니니까 그냥 패스합니다.
      쓰로틀링은 까놓고 말해서 Adreno나 이매지네이션보다 Mali가 전성비가 안 좋기때문이겠지요.
      이게 치명적인 수준이냐 아니냐는 사람마다 분명한 시각차이가 있고요.

    • addr | edit/del ㅁㅋㅊㅍ 2015.11.03 19:59 신고

      롱텀퍼포먼스는 gfx벤치가면있습니다.