英偉達 AI 的 iPhone 時刻來了
今天 3 月份的 GTC 大會上,英偉達 CEO 黃仁勳拋出金句「AI 的 iPhone 時刻已經到了」
現如今,時隔 5 個月後,更準確的説,或許黃仁勳的金句可以改寫為「英偉達 AI 的 iPhone 時刻已經到了。」
生成式 AI 的爆火,讓人們得以窺見下一個風口,無數科技巨頭爭先搶後地躬身入局生成式 AI 賽道,試圖打開這道充滿機遇的科技大門。
但想法很主觀,現實很客觀,算力、模型、數據一直是 AI 發展的三大要素,AI 芯片所代表的算力既是人工智能的底層基石,也是打開這道科技大門的鑰匙。
而現如今,這把通往未來的鑰匙正掌握在英偉達的手中。
58 年前,英特爾創始人之一戈登• 摩爾在蒐集 1959 年至 1965 年集成電路上晶體管數量的數據基礎上,提出了著名的摩爾定律。
隨後新的推斷又湧現了出來,兩年的時間間隔被縮短到了 18 個月。
在摩爾定律的作用下,CPU 和 GPU 的處理性能都獲得了指數級的增長,2000 年以後,CPU 從單核走向多核,核心數量得到大幅提升。
AI 深度學習的訓練和推理大量依賴矩陣計算和浮點計算,對算力提出了極高的要求,而 GPU 能夠大規模並行計算,在矩陣和向量計算上遠超 CPU,成為高性能計算的「寵兒」。
此外,高速的內存寬帶、可擴展性強的算力池、專門優化的深度學習框架、雲端部署支撐等優點,也堅定確立了 GPU 在 AI 時代的算力核心地位。
成立於 1993 年 4 月,英偉達最初便是靠 GPU 起家,通過不斷的創新和發展,逐漸成為了高性能計算領域的領導者。
根據 Jon Peddie Research 發佈的 GPU 市場數據統計報告,英偉達以 84% 的市場份額排名第一,排名第二的 AMD 為 12%,第三位的英特爾為 4%。
A100 和 H100 都是英偉達專門為 AI 計算設計的頂級數據中心 GPU,在訓練和推理大型神經網絡方面,性能都遠超其他競爭對手,二者也都採用專門的 Tensor Core 和數據流架構,堪稱英偉達手裏的兩張王牌芯片。
今年以來,英偉達主打的就是「你買的越多,省的也越多」,非常熟練且「貼心」地推出各種迭代更新的 GPU。
3 月,英偉達一口氣發佈了 H100 NVL GPU、L4 Tensor Core GPU、L40 GPU 以和 NVIDIA Grace Hopper 四款 AI 推理芯片。
兩個月後,5 月的台北電腦展上,黃仁勳發佈了用 256 個 NVIDIA GH200 Grace Hopper 超級芯片組成的超級計算機 DGX GH200。
就在兩週前,黃仁勳又發佈了搭載 HBM3e 內存新版 GH200 Grace Hopper,這也是世界上首個搭載 HBM3e 內存的 GPU 芯片。
HBM3e 內存是一種新型的高帶寬內存技術,在運算速度上 HBM3e 能比 HBM3 運算速度快 50%,提供最高 5TB/秒的傳輸速率。
訓練和推理是 AI 大模型的非常重要的兩個步驟,而這恰恰是 GH200 所擅長的部分。在黃仁勳看來,未來 GH200 的典型應用場景就是大語言模型,並且「加速運算」、「AI 運算」將逐漸取代傳統 x86 GPU 的「通用計算」。
過往無數的案例證明,優異生態系統一旦構築成護城河,外來者在競爭中便佔了下風。
英偉達過硬的生態系統自然少不了競爭對手的蓋章認證,神經網絡科學家 Naveen Rao 曾在英特爾擔任過副總裁與人工智能平台事業部總經理。
他發現英偉達的最大優勢不僅僅在於芯片本身,而是英偉達擁有一個具有大量優秀人工智能程序員的大型社區和集散地。
CUDA 是英偉達基於其生產的 GPUs 的一個並行計算平台和編程模型,目的是便於更多的技術人員參與開發。
開發人員可以通過 C/C++、Fortan 等高級語言來調用 CUDA 的 API,來進行並行編程,並進行高性能計算,這種生態系統的建立使得許多開發者依賴於 CUDA。
此前,黃仁勳向外界透露,CUDA 在全球已經擁有超過 400 萬開發者和超過 3000 個應用程序,CUDA 下載量累計達到 4000 萬次,全球 有 40000 家大型企業正在使用英偉達的產品進行加速計算,已有 15000 家初創公司建立在英偉達的平台上。
龐大的數字折射出英偉達顯著的先發優勢,倘若其他對手想要推出新的硬件,則還需要考慮追趕這個已經形成的人工智能創新生態系統。
交易的兩端,一端連着賣方,一端連着買方。
4 月份,「雙標」的馬斯克一遍聯名簽署禁止訓練 AI,一邊偷偷掃貨 1 萬張 GPU 來開發大模型,甚至還不忘在 X 上公開吐槽:「似乎每個人、每條狗都在購買 GPU」。
上個月,甲骨文董事長在公開場合表示,甲骨文公司將斥資數十億美元購買英偉達的 GPU,以擴大針對新一波人工智能公司的雲計算服務。
得算力者得天下,在你追我趕的生成式 AI 賽道上,國內也同樣蔓延着求「芯」若渴的焦慮。
據英國《金融時報》報道,中國互聯網巨頭正爭相搶英偉達高性能 AI 芯片,今明兩年的訂單價值高達 50 億美元。
其中百度、騰訊、阿里巴巴以及字節跳動今年向英偉達下達的支付訂單金額合計 10 億美元,總共採購 10 萬張 A800,相當於每張 A800 芯片的價格達到 1 萬美元,明年再交付餘下的 40 億美元。
需要説明的是,A800 本質上是 A100 的「閹割版」。由於去年 8 月份受到政策影響,英偉達只能面向中國大陸市場推出不受限制的替代版本。
不少行業人士認為,GPU 已經成為市場上公認的稀缺貨,一芯難求的局面在未來的一兩年內依舊難以緩解。
因此,在 GPU 供不應求的持續追捧下,英偉達的 GPU 甚至成為一些 AI 初創公司的硬通貨。
作為一家雲計算初創公司,CoreWeave 想要獲得創業貸款並不是一件容易的事情。但「不看僧面看佛面」,得益於英偉達的投資人身份,CoreWeave 甚至可以將 H100 GPU 作為抵押物,輕易獲得了 23 億美元的貸款。
在貸款方看來,這自然不會是一筆虧本的買賣。
一方面,這筆貸款能夠讓 CoreWeave 的計算規模和實力得到快速擴張,增強償還貸款的能力,另一方面,英偉達明年將推出更多迭代的 GPU,憑藉與英偉達密切的合作關係以及這筆高額度貸款,CoreWeave 還可以在搶購 GPU 上奪得先機。
正如前面所提到,既然頭部大廠在市場上都搶不到 GPU,那實力並不雄厚的 AI 初創公司的處境顯然更加堪憂。
於是乎,一些聰明的 AI 初創公司只能選擇另闢蹊徑,抱團取暖,投入英偉達的懷抱。
今年 6 月份,人工智能初創公司 Inflection AI 官宣,完成 13 億美元的新一輪融資,值得注意的是,嶄新的投資名單裏首次出現英偉達的身影。
Inflection AI 表示,將和合作夥伴 CoreWeave 以及英偉達一起,構建世界上最大的 AI 集羣。
看似歡喜的強強聯合更像是一種無奈的抉擇,Inflection AI CEO Mustafa Suleyman 接受《紐約時報》的採訪時表示:「公司沒有義務使用英偉達的產品,但競爭對手沒有提供可行的替代方案。」
事實上,Inflection AI 將全力打造一台先進的超級計算機,其中包括近 700 個 Intel Xeon CPU 的四節點機架服務器,以及配備了 22000 個 H100 GPU。
如此龐大數量的 GPU,讓旁人羨慕之餘,很難不讓人聯想到英偉達 GPU「肥水不流外人田」的優先提供策略。
當然,生成式 AI 的春風拂過,全球 GPU 供不應求,價格水漲船高,英偉達也在這次 AI 浪潮中賺得盆滿缽滿。
去年底,消息人士向投資銀行公司的 Raymond James 透露,H100 GPU 的成本為 3320 美元(當前約 24181 元人民幣),而英偉達選擇以 25000 至 30000 美元(當前約 18.2 萬至 21.9 萬元人民幣)的價格出售這些 GPU。
雖然這一説法可能沒有考慮到運輸物流等其他成本,不過僅從生產成本 / 售價的比例來看,英偉達 H100 GPU 簡直就是一個「超級搖錢樹」。
此外,據外媒 Tomshardware 報道,英偉達今年內計劃出售超過 55 萬塊 H100 GPU。倘若屬實,這意味着英偉達光從 H100 GPU 中獲得的收益就已經是個天文數字。
生成式 AI 給英偉達帶來的驚喜遠不止於此。
今年是英偉達的「而立之年」,在五月的最後一天,英偉達成為全球第一家市值突破 1 萬億美元的芯片公司,這也是歷史上第九家躋身萬億市值俱樂部的科技公司。
2024 財年第一財季財報顯示,英偉達第一財季營收為 71.92 億美元,與上一財季的 60.51 億美元相比增長 19%,淨利潤為 20.43 億美元,每股收益和營收均超過華爾街分析師的預期。
此外,本月 24 日發佈的第二財季財報也預計營收超過 100 億美元,截至發稿前,英偉達的市值已經達到 1.16 萬億美元,市盈率達到 244.09 倍,增長勢頭持續看好。
今年 6 月,身穿畢業服的黃仁勳受邀參加了中國台灣大學的畢業演講,用過往的人生經驗寄語畢業生!
歷史的機遇稍縱即逝,GPU 的賽道註定是贏者通吃的賽道。
一直狂奔的黃仁勳抓住 AI 的機遇,讓誕生於路邊連鎖餐廳的英偉達成功躋身於萬億美元俱樂部,成為了這波 AI 浪潮的最大贏家,也將繼續領跑這個時代。
資料來源:愛範兒(ifanr)
現如今,時隔 5 個月後,更準確的説,或許黃仁勳的金句可以改寫為「英偉達 AI 的 iPhone 時刻已經到了。」
生成式 AI 的爆火,讓人們得以窺見下一個風口,無數科技巨頭爭先搶後地躬身入局生成式 AI 賽道,試圖打開這道充滿機遇的科技大門。
但想法很主觀,現實很客觀,算力、模型、數據一直是 AI 發展的三大要素,AI 芯片所代表的算力既是人工智能的底層基石,也是打開這道科技大門的鑰匙。
而現如今,這把通往未來的鑰匙正掌握在英偉達的手中。
58 年前,英特爾創始人之一戈登• 摩爾在蒐集 1959 年至 1965 年集成電路上晶體管數量的數據基礎上,提出了著名的摩爾定律。
引用集成電路上可容納的晶體管數目,約每隔兩年便會增加一倍。
隨後新的推斷又湧現了出來,兩年的時間間隔被縮短到了 18 個月。
在摩爾定律的作用下,CPU 和 GPU 的處理性能都獲得了指數級的增長,2000 年以後,CPU 從單核走向多核,核心數量得到大幅提升。
AI 深度學習的訓練和推理大量依賴矩陣計算和浮點計算,對算力提出了極高的要求,而 GPU 能夠大規模並行計算,在矩陣和向量計算上遠超 CPU,成為高性能計算的「寵兒」。
此外,高速的內存寬帶、可擴展性強的算力池、專門優化的深度學習框架、雲端部署支撐等優點,也堅定確立了 GPU 在 AI 時代的算力核心地位。
成立於 1993 年 4 月,英偉達最初便是靠 GPU 起家,通過不斷的創新和發展,逐漸成為了高性能計算領域的領導者。
根據 Jon Peddie Research 發佈的 GPU 市場數據統計報告,英偉達以 84% 的市場份額排名第一,排名第二的 AMD 為 12%,第三位的英特爾為 4%。
A100 和 H100 都是英偉達專門為 AI 計算設計的頂級數據中心 GPU,在訓練和推理大型神經網絡方面,性能都遠超其他競爭對手,二者也都採用專門的 Tensor Core 和數據流架構,堪稱英偉達手裏的兩張王牌芯片。
今年以來,英偉達主打的就是「你買的越多,省的也越多」,非常熟練且「貼心」地推出各種迭代更新的 GPU。
3 月,英偉達一口氣發佈了 H100 NVL GPU、L4 Tensor Core GPU、L40 GPU 以和 NVIDIA Grace Hopper 四款 AI 推理芯片。
兩個月後,5 月的台北電腦展上,黃仁勳發佈了用 256 個 NVIDIA GH200 Grace Hopper 超級芯片組成的超級計算機 DGX GH200。
就在兩週前,黃仁勳又發佈了搭載 HBM3e 內存新版 GH200 Grace Hopper,這也是世界上首個搭載 HBM3e 內存的 GPU 芯片。
HBM3e 內存是一種新型的高帶寬內存技術,在運算速度上 HBM3e 能比 HBM3 運算速度快 50%,提供最高 5TB/秒的傳輸速率。
訓練和推理是 AI 大模型的非常重要的兩個步驟,而這恰恰是 GH200 所擅長的部分。在黃仁勳看來,未來 GH200 的典型應用場景就是大語言模型,並且「加速運算」、「AI 運算」將逐漸取代傳統 x86 GPU 的「通用計算」。
過往無數的案例證明,優異生態系統一旦構築成護城河,外來者在競爭中便佔了下風。
英偉達過硬的生態系統自然少不了競爭對手的蓋章認證,神經網絡科學家 Naveen Rao 曾在英特爾擔任過副總裁與人工智能平台事業部總經理。
他發現英偉達的最大優勢不僅僅在於芯片本身,而是英偉達擁有一個具有大量優秀人工智能程序員的大型社區和集散地。
CUDA 是英偉達基於其生產的 GPUs 的一個並行計算平台和編程模型,目的是便於更多的技術人員參與開發。
開發人員可以通過 C/C++、Fortan 等高級語言來調用 CUDA 的 API,來進行並行編程,並進行高性能計算,這種生態系統的建立使得許多開發者依賴於 CUDA。
此前,黃仁勳向外界透露,CUDA 在全球已經擁有超過 400 萬開發者和超過 3000 個應用程序,CUDA 下載量累計達到 4000 萬次,全球 有 40000 家大型企業正在使用英偉達的產品進行加速計算,已有 15000 家初創公司建立在英偉達的平台上。
龐大的數字折射出英偉達顯著的先發優勢,倘若其他對手想要推出新的硬件,則還需要考慮追趕這個已經形成的人工智能創新生態系統。
交易的兩端,一端連着賣方,一端連着買方。
4 月份,「雙標」的馬斯克一遍聯名簽署禁止訓練 AI,一邊偷偷掃貨 1 萬張 GPU 來開發大模型,甚至還不忘在 X 上公開吐槽:「似乎每個人、每條狗都在購買 GPU」。
上個月,甲骨文董事長在公開場合表示,甲骨文公司將斥資數十億美元購買英偉達的 GPU,以擴大針對新一波人工智能公司的雲計算服務。
得算力者得天下,在你追我趕的生成式 AI 賽道上,國內也同樣蔓延着求「芯」若渴的焦慮。
據英國《金融時報》報道,中國互聯網巨頭正爭相搶英偉達高性能 AI 芯片,今明兩年的訂單價值高達 50 億美元。
其中百度、騰訊、阿里巴巴以及字節跳動今年向英偉達下達的支付訂單金額合計 10 億美元,總共採購 10 萬張 A800,相當於每張 A800 芯片的價格達到 1 萬美元,明年再交付餘下的 40 億美元。
需要説明的是,A800 本質上是 A100 的「閹割版」。由於去年 8 月份受到政策影響,英偉達只能面向中國大陸市場推出不受限制的替代版本。
不少行業人士認為,GPU 已經成為市場上公認的稀缺貨,一芯難求的局面在未來的一兩年內依舊難以緩解。
因此,在 GPU 供不應求的持續追捧下,英偉達的 GPU 甚至成為一些 AI 初創公司的硬通貨。
作為一家雲計算初創公司,CoreWeave 想要獲得創業貸款並不是一件容易的事情。但「不看僧面看佛面」,得益於英偉達的投資人身份,CoreWeave 甚至可以將 H100 GPU 作為抵押物,輕易獲得了 23 億美元的貸款。
在貸款方看來,這自然不會是一筆虧本的買賣。
一方面,這筆貸款能夠讓 CoreWeave 的計算規模和實力得到快速擴張,增強償還貸款的能力,另一方面,英偉達明年將推出更多迭代的 GPU,憑藉與英偉達密切的合作關係以及這筆高額度貸款,CoreWeave 還可以在搶購 GPU 上奪得先機。
正如前面所提到,既然頭部大廠在市場上都搶不到 GPU,那實力並不雄厚的 AI 初創公司的處境顯然更加堪憂。
於是乎,一些聰明的 AI 初創公司只能選擇另闢蹊徑,抱團取暖,投入英偉達的懷抱。
今年 6 月份,人工智能初創公司 Inflection AI 官宣,完成 13 億美元的新一輪融資,值得注意的是,嶄新的投資名單裏首次出現英偉達的身影。
Inflection AI 表示,將和合作夥伴 CoreWeave 以及英偉達一起,構建世界上最大的 AI 集羣。
看似歡喜的強強聯合更像是一種無奈的抉擇,Inflection AI CEO Mustafa Suleyman 接受《紐約時報》的採訪時表示:「公司沒有義務使用英偉達的產品,但競爭對手沒有提供可行的替代方案。」
事實上,Inflection AI 將全力打造一台先進的超級計算機,其中包括近 700 個 Intel Xeon CPU 的四節點機架服務器,以及配備了 22000 個 H100 GPU。
如此龐大數量的 GPU,讓旁人羨慕之餘,很難不讓人聯想到英偉達 GPU「肥水不流外人田」的優先提供策略。
當然,生成式 AI 的春風拂過,全球 GPU 供不應求,價格水漲船高,英偉達也在這次 AI 浪潮中賺得盆滿缽滿。
去年底,消息人士向投資銀行公司的 Raymond James 透露,H100 GPU 的成本為 3320 美元(當前約 24181 元人民幣),而英偉達選擇以 25000 至 30000 美元(當前約 18.2 萬至 21.9 萬元人民幣)的價格出售這些 GPU。
雖然這一説法可能沒有考慮到運輸物流等其他成本,不過僅從生產成本 / 售價的比例來看,英偉達 H100 GPU 簡直就是一個「超級搖錢樹」。
此外,據外媒 Tomshardware 報道,英偉達今年內計劃出售超過 55 萬塊 H100 GPU。倘若屬實,這意味着英偉達光從 H100 GPU 中獲得的收益就已經是個天文數字。
生成式 AI 給英偉達帶來的驚喜遠不止於此。
今年是英偉達的「而立之年」,在五月的最後一天,英偉達成為全球第一家市值突破 1 萬億美元的芯片公司,這也是歷史上第九家躋身萬億市值俱樂部的科技公司。
2024 財年第一財季財報顯示,英偉達第一財季營收為 71.92 億美元,與上一財季的 60.51 億美元相比增長 19%,淨利潤為 20.43 億美元,每股收益和營收均超過華爾街分析師的預期。
此外,本月 24 日發佈的第二財季財報也預計營收超過 100 億美元,截至發稿前,英偉達的市值已經達到 1.16 萬億美元,市盈率達到 244.09 倍,增長勢頭持續看好。
今年 6 月,身穿畢業服的黃仁勳受邀參加了中國台灣大學的畢業演講,用過往的人生經驗寄語畢業生!
引用無論是什麼,像我們一樣全力以赴地追求它,跑吧!不要慢慢走。
不論是為了食物而奔跑,或不被他人當做食物而奔跑。
你往往無法知道自己正處在哪一種情況,無論如何,都要保持奔跑。
歷史的機遇稍縱即逝,GPU 的賽道註定是贏者通吃的賽道。
一直狂奔的黃仁勳抓住 AI 的機遇,讓誕生於路邊連鎖餐廳的英偉達成功躋身於萬億美元俱樂部,成為了這波 AI 浪潮的最大贏家,也將繼續領跑這個時代。
資料來源:愛範兒(ifanr)