NVIDIA 秀肌肉,給 AI 以算力,也用算力做 AI

5 月 30 日,NVIDIA 股價創下新高,達到 404 美元,此時 NVIDIA 市值也正是超過 1 萬億美元,成為這個星球上第一家市值超過萬億美元的芯片公司。

如今近兩個月時間過去了,NVIDIA 市值更進一步,目前穩定在 1.1 萬億美元附近,這一輪 NVIDIA 的股價突進,外界認為直接的推進劑只有一個,那就是 AI。

無論是 OpenAI 的 ChatGPT,還是國內的一些大模型,其算力來源都離不開 NVIDIA 提供的 Tensor Core GPU(區別於 CUDA Core GPU,這種 GPU 適用於人工智能深度學習需要的矩陣預算)。現在在 NVIDIA 官網,他們對自己的定義就是「人工智能計算領域的領導者」。

其實,除了像 A100 或者 H100 這樣的 Tensor Core GPU 之外,NVIDIA 的自動駕駛芯片自然也是和 AI 緊緊相連,因為它要實時處理來自於激光雷達、毫米波雷達和攝像頭等傳感器帶來的數據信息,進行實時的駕駛決策,這其中涉及到大量的人工智能計算。至於英偉達的老本行,消費級顯卡這塊,其實也是和 AI 離不開關係。


DLSS 3 、Reflex 和支持它的遊戲們

2023 年 7 月 20 日,NVIDIA 在上海舉辦 GeForce RTX 40 系列媒體品鑑會,講述的重點是新上市的 GeForce RTX 4060 系列顯卡,以及 DLSS 3 技術,還有通過 RTX 顯卡加速的各種應用。

DLSS(Deep Learning Super Sampling)技術用 AI 從低分辨率的輸入中輸出更高分辨率的幀,比如 DLSS 可利用 AI 將 1080P 畫質提高到 4K,同時使用 1080P 的計算能力,這意味着性能的顯着提高。沒有 AI 和專用的 Tensor Core 加速,DLSS 是不可能實現的。

最新一代的 GeForce RTX 40 系列 GPU 支持 DLSS 3,DLSS 3 在 DLSS 2 超分辨率技術的基礎上增加了 AI 驅動的幀生成技術,以進一步提高性能,比如最新的《賽博朋克 2077》超速模式技術預覽版支持完整的路徑追蹤。可以説,沒有 AI 的進步,就沒有開啓全景光線追蹤的可玩幀率。

在品鑑會線上,大半區域都留給了各種遊戲,比如開放世界動作 RPG 遊戲《鳴潮》,《鳴潮》是一款畫質達到次世代水準的二次元動作遊戲,在戰鬥中,我們可以操縱角色打出漂亮的高速連擊;也可以面對敵人的兇猛攻勢施展極限閃避;以及在部分特定的招式下,漂泊者們還可以見招拆招,針對 BOSS 的攻擊進行拼刀逆勢反擊;還有 QTE 協奏作用玩法等等,這些機制都大大增加了戰鬥的機動性。

作為庫洛遊戲和 NVIDIA 達成合作的首款遊戲,本次提供的 Demo 支持了 DLSS3 技術,另外,它也支持 NVIDIA 的 Reflex,這是競技遊戲中測量減少延遲的技術。在《守望先鋒:歸來》等 FPS 射擊遊戲裏面,我們點擊鼠標開槍,到屏幕顯示子彈命中敵人的毫秒級時間裏,有非常多的「延遲」:

  • 外設延遲:輸入設備處理機械輸入並將這些輸入事件發送到 PC 所需的時間
  • 遊戲延遲:CPU 處理對遊戲世界的輸入或更改並提交新幀供 GPU 渲染所需的時間
  • 渲染延遲:從待渲染的幀排隊列齊到 GPU 完全渲染幀之間的時間
  • PC 延遲:幀在 PC 上傳輸所需的時間。這包括遊戲延遲和渲染延遲
  • 顯示延遲:GPU 完成幀渲染後,顯示器呈現新圖像所需的時間
  • 系統延遲:涵蓋整個端到端測量的時間 – 從外設延遲開始到顯示延遲結束

NVIDIA  Reflex 包括了兩種主要的新技術:NVIDIA Reflex SDK 和 NVIDIA Reflex 延遲分析器,前者可以讓遊戲引擎即時完成渲染任務,從而消除 GPU 渲染排隊現象,降低 CPU 反壓;Reflex 延遲分析器能夠監測到鼠標點擊,並測量屏幕上的相應像素(比如槍焰)產生變化所需的時間,從而顯著玩家操作到畫面顯示之間的延遲時間,摳出幾毫秒到幾十毫秒的優勢。


除了《鳴潮》之外,NVIDIA 還展出了一系列支持 DLSS 3 和 Reflex 的遊戲,其中包括《重生邊緣》、《永劫無間》、《暗黑破壞神 IV》、《賽博朋克 2077》等等。

在這些較新的遊戲之外,還有一款《傳送門:序曲》RTX 版,《傳送門》是一款 15 年前風靡遊戲圈的解謎作品,對於現在的玩家來説,年紀頗大的這款手機看起來已經相當簡陋,不過 NVIDIA RTX Remix 技術可以為遊戲 MOD 愛好者提供簡便且驚豔的光線追蹤製作效果。

《傳送門:序曲》RTX 版在原版的基礎上做了材質和光線的重新制作,豐富了更多的畫面細節,包括煙霧、水面效果等,讓遊戲的真實性更為突出。圖像效果能夠得到進一步降噪處理,讓畫質更為細膩。玩家可以以現代化的視角,來重新體驗一款 15 年前的經典作品。它的發佈和流行也意味着 RTX 的技術集成門檻非常低,即使是十幾年前的老遊戲,也可以輕鬆實現 RTX 化。這令很多遊戲開發商歡欣鼓舞,他們可以將正在開發或已經發布且廣受好評的遊戲進行簡單的改造就可以實現 RTX 的高級特效支持,包括逼真的光線追蹤特效和 DLSS 3 加持下的超高幀率。


最能體現 Reflex 技術的遊戲則是《無畏契約》, 結合 Reflex 鼠標和顯示器,這個技術能夠提供給電競玩家全新的超低延遲電競體驗,在電競區搭載的 GeForce RTX 4060 設備上可以實現 1080p ,fps 360+延遲低於 10ms;1440p,fps 240+ 延遲低於 20ms 的頂級電競體驗。

NVIDIA 助力本地 AI 創作

雖然大語言模型服務的算力基本上都在雲側,本地設備算力基本不影響體驗,但是端側的一些應用其實也相當考驗端側的 AI 能力,因而顯卡性能某種意義上來説,也約等於端側的 AI 性能。

除了展示以 DLSS 3 和 Reflex 等和 AI 相關的遊戲技術之外,NVIDIA 助力本地 AI 創作也是活動現場重要的展示環節。


最典型的例子就是 B 站知名 UP 主特效小哥首發的採用 NVIDIA Studio 加速和 AI 輔助創作的 CG 作品《Flower》。

這個作品使用 RTX GPU 加速, NVIDIA Omniverse 和虛幻引擎渲染,Stable Diffusion 創作。針對運行在本地的 Stable Diffusion, GeForce RTX 40 系列顯卡能夠為用户提供較上一代相比高達 1.5 倍的圖像生成速度,提升創作者使用 AI 進行創作的效率。

除了與 Stable Diffusion 這類開源 AI 工具的契合之外,NVIDIA 還展示了剪映專業版在 40 系顯卡支持下,利用第八代 NVENC 編碼器和 AV1 編碼技術,提升 2 倍的視頻導出速度。

在 NVIDIA Canvas 上,由 AI 和 NVIDIA RTX GPU 提供算力支持,用户將簡單的筆觸快速轉換為逼真的風景圖,現在 Canvas 支持 360° 全景圖,用户不僅可以製作出精美的環繞式環境貼圖,將其用作 3D 場景的背景,而且可以測試各種概念和氛圍。

作為這一輪 AI 浪潮當中最大的受益者質疑,NVDIA 在本次活動上展示的顯卡、AI 技術和 AI 應用其實是裏用户最近的,也是用户感受門檻最低的,至於更遠更強的自動駕駛和大語言模型等雲側 AI 計算,和用户還有一段距離,但正如蜂窩網絡成就了移動互聯網時代,遍佈於雲側和端側的算力,則是 AI 時代的動力來源,是 AI 的空氣和水。


資料來源:愛範兒(ifanr)

如果喜歡我們的文章,請即分享到︰

標籤: NVIDIA  AI