Arm GPU 首次支持硬件光追,帶着手機也能進入元宇宙?

Arm正在模糊虛擬和現實的界限,連發佈會的開場也開在虛擬世界,移動設備離元宇宙將越來越近。


雷峯網消息,本週Arm發佈最新的面向移動端的計算產品組合,包括兩款CPU(高性能Cortex-X3、高效性能Cortex-A715),三款GPU(Immortalis G715、Mali-G715、Mali-G615)。

最值得一提的旗艦級GPU產品Arm Immortalis(中文意思“不朽”),這是Arm GPU的全新系列,Immortalis G715也是Arm首款移動端支持硬件光線追蹤(Ray Tracing)的GPU。當然,也是Arm能夠將移動設備作為元宇宙入口的關鍵。

GPU實現新的里程碑,Arm在市場上最有優勢的移動CPU產品中,性能與功耗的平衡被放在了更重要的位置。

不過,要滿足遊戲、元宇宙、AI等對於計算不斷提升的需求,還是需要CPU、GPU等組合的異構計算。因此,Arm在今年同樣強調全面計算解決方案(TCS22),TCS22相比上一代能夠實現28%的性能提升,16%的能耗降低。

更有意思的是,從Arm透露的產品路線圖看,Arm已經準備好衝入元宇宙的時代。

硬件光線追蹤進入移動終端

GPU並非Arm的傳統強項,但其在移動設備市場依舊具有強大的市場統治力,Arm Mali GPU 出貨量已超過 80 億顆。因此,Arm推出硬件級別光線追蹤移動GPU,對於移動市場光線追蹤生態的發展,和光追的普及將具有重要價值。


Arm 高級副總裁兼終端事業部總經理 Paul Williamson直言,Arm推出的全新旗艦級GPU 產品Immortalis,是為了滿足移動應用與遊戲對於硬件與性能的新需求。

過去幾年間,無論是高通、聯發科這樣的移動SoC提供商,還是小米、OPPO、vivo等手機OEM,都看準了手遊市場的機會,將提升GPU以及遊戲體驗作為賣點。手機上可以玩越來越多視覺效果出色的3A遊戲。

遊戲之外,AR、VR、MR,以及元宇宙都對視覺體驗提出了更高要求。

顯然,無論是桌面端還是移動端GPU都需要邁向下一個階段,而Arm Immortalis無論從命名還是性能都是面向新時代的產品。

Immortalis傳承了Mali GPU的技術積累,相比上一代Mali-G710,Immortalis-G715性能提升15%,能耗節省15%,機器學習性能提升2倍,是Arm迄今為止性能最強的GPU。

高性能會同時帶來功耗的挑戰,對於使用電池供電的移動設備,對功耗又極其敏感,如果不能控制好功耗,就無法帶來良好體驗。對此,Paul  Williamson表示,Arm 的光線追蹤單元只佔用了約 4% 的着色器核心面積,僅耗費非常小幅的功耗,就能在相關領域帶來3倍性能提升。




圖中左側為未開啓光線追蹤,右側為開啓光線追蹤

Arm也給出了基於其光線追蹤GPU的效果展示,以及峯值性能及FPS/W性能。據悉,Arm的光線追蹤實現是基於標準的 Vulkan API,開發者的可及性非常高。


除了支持硬件光線追蹤的Immortalis GPU,Arm還同時推出了Mali-G715和Mali-G615,Mali G715相比Immortalis-G715主要的差別是不支持硬件光線追蹤,只有7-9個着色器內核(Immortalis-G715有10-16個)。

定位高端的Mali-G615(去年推出的Mali-G610的更新產品)的着色器內核數量為1-6個。2022推出的新款GPU均具備的可變速率着色 (Variable Rate Shading) 圖形功能,能夠在降低能耗的同時,提升遊戲性能。

相比GPU支持硬件光線追蹤的亮點,Arm的CPU產品更新就缺乏亮點。

CPU性能提升同時更關注能效

2021年,Arm推出了面向新十年的Armv9架構,並推出了首代基於新架構的一系列CPU產品。去年,Arm預計,新一代架構Armv9將保持超過業界CPU性能提升的速度,未來兩代移動和基礎設施CPU的性能提升將超過30%。


今年推出的全新Arm Cortex-X3,與最新款的安卓旗艦智能手機(運行的上一代Cortex-X2的SoC)相比,性能提升25%,與主流筆記本電腦處理器(Intel Core i7 1260p 28w)相比,性能提升了34%。


作為Arm移動端的性能標杆,也是定製CPU項目,Cortex-X3進行了一系列的技術升級,解碼器每週期指令從5個提升到6個,亂序執行窗口從288提升到320個,整數ALU單元從4個提升到6個,L2緩存容量也從512KB提升到了1MB。

性能提升的同時,Cortex-X3的功耗表現應該也會成為今年旗艦安卓手機關注的焦點。

將被更廣泛使用的新一代CPU是專注於高效性能的Arm Cortex-A715,與上一代Cortex-A710 相比,性能僅提升5%,能效提升 20%,可以媲美Cortex-X1的性能。



為了兼顧能效表現,Cortex-A715的CPU集羣採用了基於大小核 (big.LITTLE) 的配置。



另外,去年推出的Armv9架構高效小核CPU Arm Cortex-A510也迎來更新,性能不變的同時將功耗降低5%,並且更新版的DSU-110所支持的CPU集羣內核數增加50%,實現了不同等級消費級設備的可擴展性。


從Arm在Cortex-A715中引入大小核配置提高能效,以及更新版Cortex-A510降低功耗,都表明Arm移動端CPU目前在性能和功耗的平衡中所面臨的巨大挑戰,這也是手機SoC設計公司和手機OEM都希望Arm能夠提升的部分。

Paul Williamson告訴雷峯網(公眾號:雷峯網),“性能和功耗要做好平衡,涉及到的因素非常多。我們與合作伙伴共同致力於在芯片以及SoC設計兩方面做出最佳的選擇。同時,我們也與操作系統廠商和其他軟件生態系統的夥伴合作,確保軟件開發能夠充分利用整個系統的資源。”

Arm衝向元宇宙

從2021年開始,Arm就更加強調全面計算的重要性。

Paul Williamson指出,“Arm全面計算解決方案專注於設計的可擴展性,這也是我們能通過GPU的配置 ,滿足廣泛應用的需求。例如,我們可以使用少量的核心數來實現非常高效和緊湊的設計,也可使用大量的核心數來實現終極的視覺體驗。在 CPU 集羣中,我們可以採取類似的方法,針對每個應用採用不同的 CPU並進行不同的配置。”

CPU、GPU、AI加速器組合的異構計算正變得越來越重要,Arm面向未來十年,也正在規劃全新的產品線進一步提升其全面計算產品組合。

Paul Williamson透露,Arm在大核 CPU 產品線中我們有新的項目Hunter和Chaberton,GPU產品線有Titan和Krake。同時還在投資系統 IP,以確保低延遲的內存路徑和系統級緩存性能。


想要將計算和應用推向新的時代,軟件生態和開發者也不可缺少。開發者可及性方面,Arm在不斷提升Arm計算庫和Arm NN框架,確保開發者能訪問硬件性能。Arm也在持續提升安全性能。


其中非常值得關注的是應用程序轉向64位,中國主要的應用商店已表明,到今年 8 月,所有新上架的應用都應該是64位,沒有過渡到64位的應用會因為性能欠佳讓用户感到失望。Arm全新的CPU產品中,也僅有Cortex-A510還支持32位。這也在一定程度上表明,從硬件到應用,Arm都在為XR和元宇宙做準備。

而Arm也已經準備好衝向元宇宙的新時代。

雷峯網原創文章,未經授權禁止轉載。詳情見轉載須知


資料來源:雷鋒網
作者/編輯:包永剛

如果喜歡我們的文章,請即分享到︰

標籤: Arm GPU  硬件光追  元宇宙