Tesla AI Day 2022:馬斯克造出了那個會跳舞的機器人,還透露了他的下一步計劃
當我得知 Tesla 要在 10 月 1 日舉辦 AI Day 時,我是快樂的,這意味着我能夠在國慶節當天投身工作,與祖國共奮進。
馬斯克同志可能和我一樣愛國——
AI DAY 原定於今早 8 點開始,但最終延至 9:15。我想,應該是老馬昨晚忙着給祖國母親慶生,睡過頭了。嗯,一定不是因為現場的機器人出了問題。
沒錯,這次 AI DAY 的主角是機器人,馬斯克舞台上表達了自己的看法:
我也希望,10 年後的國慶節,坐在工位上碼字的不是我,而是某個生下來就會工作的人型機器人。
去年的擎天柱,現在怎樣了
講真,去年登場的擎天柱(Optimus),比今天的要靈活多了,它甚至會跳舞。
玩笑歸玩笑,去年的擎天柱確實長得更討喜些。
當時的擎天柱還不叫擎天柱,馬斯克簡單將其稱作 Tesla Bot;現在的擎天柱,我也不太願意把它叫做擎天柱,因為它看起來好像不太聰明,我覺得,叫威震天可能會更合適。
▲你不要過來啊
我不禁想起了十幾年前聽過的一首歌,是這樣唱的:
比如澆花:
再比如,在超級工廠裏搬磚:
看起來,這位「威震天」能幹的活還真不少,馬斯克説,成本下降以後,一台「威震天」大概會賣 2 萬美元。所以,要想找個人替我上班,我至少得準備 14 萬元人民幣……
打擾了,我還是自己來吧。
正當我嘗試説服自己接受這個事實時,舞台上突然出現了一位新人,它的顏值要比剛剛那位「威震天」高多了。實際上,「威震天」是今年 2 月造出來的開發平台,下面這位才是擎天柱。
▲從左至右分別是夢中情人版、原相機版、美顏相機版
為這台擎天柱提供能量的不是火種,而一塊容量為 2.3kWh 的電池包,它被充分保護,放置在最核心的身體部位,即為圖中藍色的那一塊。
馬斯克稱,擎天柱「非常適合一整天的工作」,它靜坐時的功耗約為 100w,快走時為 500w。可能有人會問快走是多快,大概 2 米每秒。
為了確保擎天柱的靈活性,Tesla 為其設計了 28 個關節,每一個關節裏都有多套執行器,這些執行器能夠在後台分析執行效率,減少無效工作。
擎天柱最靈活的部位,是它的手。
Tesla 表示,整台擎天柱擁有 200 多個自由度,而它的手佔了其中的 27 個,由促動機(actuator)驅動,通過視覺系統和算法,擎天柱能夠準確識別手與物體的位置,完成上面提到的澆花、取物的任務。
擎天柱重 73kg,全身上下共有 6 種促動機,完全為 Tesla 自研,這些促動機就像是人體的肌肉,驅動相應部位。
需要強調的是,雖然這些促動機看起來十分精緻小巧,這細胳膊細腿的,不像是能幹重活的人,但實際上,一個關節促動機,可以把這麼一個大件給吊起來。
▲這不是我奶奶中午出去買的菜,而是實實在在的一架鋼琴。
擎天柱身上最寶貴的東西,是它的「大腦」——一塊 FSD 芯片。沒錯,和你的 Model 3 裏的是一樣的,只不過你的 Model 3 有兩塊,它只有一塊,因此,擎天柱大約擁有 72TOPS 的算力。
為了保護擎天柱的「大腦」,Tesla 也廢了不少功夫,畢竟這玩意兒和車不一樣,車有四個輪子,它只有兩條腿,而且還不太利索。
在這一方面,Tesla 借鑑了他們的造車經驗,準備了一套模擬跌倒測試的軟件,來幫助他們進行研發。
與汽車上的吸能原理相同,Tesla 也為擎天柱加入了一塊吸能區,在其跌倒時,胸前的吸能區能夠有效控制損傷範圍,防止手臂和頭部受損。
對於容易受損的肩部等位置,Tesla 沒有選用碳纖維、鈦合金這樣的高成本原材料,將這一人形機器人的使用成本降到了最低。
不過,防止它摔壞的最好方法,還是讓他不要摔跤,好好走路。
從邁出第一步到自如地擺出各種姿勢,擎天柱花了 5 個月的時間:
總之,它就像馬斯克的一個孩子,無論是走路還是取物,都需要經過一段非常長的學習時間,好在,馬斯克的育兒經驗應該足夠豐富。
摘掉 beta 帽子的 FSD
説了這麼久的機器人,FSD 怎麼樣了。
其實,上面説的不只是機器人,同時也是 FSD。擎天柱採用了與 Tesla 汽車相同的 FSD(完全自動駕駛)計算平台,它的所有動作,都是通過 AI 模型的學習得來的。
放在車上也一樣。
目前,FSD beta 的用户已經超過了 16 萬人,要知道,這個數字在去年只有 2000。在如此龐大的「測試團隊」的幫助之下,Tesla 目前已經擁有了超過 14.4 億幀視頻數據。
同時,Tesla 對摒棄了去年近千人的標註團隊,對數據標註流程進行了全面優化,訓練速度提高了 30%。
此外,Tesla 介紹了一個名為 Occupancy networks 模型的東西,在這一模型中,我們的世界看起來就和 Minecraft 一樣。在這樣的環境中,即便車輛不能認出障礙物,也會做出避讓動作,安全性得到了提高。
同時,車輛還可以識別出道路的坡度,根據實際的道路情況,提前做出加速或減速的動作,提高了乘坐的舒適性。
對於 FSD 的現有能力,Tesla 舉了一個例子:
在無保護左轉時,為了不讓過馬路的行人受到驚嚇,車輛會找準時機,以較慢,但合適的速度從行人後方通過,同時不會影響從右方駛來的車輛的正常行進。
Tesla 表示,FSD 可以在小於 10 毫秒的時間內,列出超過 7500 萬種影響決策的因素,迅速做出最安全的決策。
用 Tesla 的話來説,這是「屬於車道的語言」。
FSD 的未來,在 Dojo 手中
最後我們來聊聊 Dojo。Tesla 説,Dojo 能將原本數月才能完成的訓練,壓縮至幾周。
這是專門用來進行模型訓練的超級計算機,其內部由一個個「訓練瓦片」(Training Tile),每個「瓦片」內含 25 塊 D1 芯片,這 25 塊芯片最終匯聚成 54P 算力和 13.4TB/S 的對分帶寬。
這還沒完,Tesla 將 6 個「瓦片」和 20 片接口處理器組成一個托盤(Tray),而 Dojo 的一個機櫃又由兩個托盤組成…… 聽起來有點套娃的感覺了是吧。
無論如何,在強大的硬件堆疊之下,一個 Dojo 機櫃就能提供 1.1E 的算力、13TB 的高帶寬內存,以及 1.3TB 的高速內存。最終,4 台 Dojo 就能提供相當於 72 個 GPU 機架的算力。
更不可思議的是,Tesla 説這玩意兒在 2023 年 Q1 就能量產。
至於最受關注的擎天柱的量產時間,Tesla 並沒有明確,馬斯克甚至不知道這一人型機器人最後會變成什麼樣子。
不過,我們雖然不知道擎天柱最後會變成什麼樣子,但馬斯克還是在 Twitter 上公佈了他的下一步:
給擎天柱找一個女朋友。
資料來源:愛範兒(ifanr)
馬斯克同志可能和我一樣愛國——
AI DAY 原定於今早 8 點開始,但最終延至 9:15。我想,應該是老馬昨晚忙着給祖國母親慶生,睡過頭了。嗯,一定不是因為現場的機器人出了問題。
沒錯,這次 AI DAY 的主角是機器人,馬斯克舞台上表達了自己的看法:
引用如果未來機器人無所不在,人類經濟會發展得更好,人們可以去做體力話,但這不是必須的,我們可以更多地選擇腦力勞動。
我也希望,10 年後的國慶節,坐在工位上碼字的不是我,而是某個生下來就會工作的人型機器人。
去年的擎天柱,現在怎樣了
講真,去年登場的擎天柱(Optimus),比今天的要靈活多了,它甚至會跳舞。
玩笑歸玩笑,去年的擎天柱確實長得更討喜些。
當時的擎天柱還不叫擎天柱,馬斯克簡單將其稱作 Tesla Bot;現在的擎天柱,我也不太願意把它叫做擎天柱,因為它看起來好像不太聰明,我覺得,叫威震天可能會更合適。
▲你不要過來啊
我不禁想起了十幾年前聽過的一首歌,是這樣唱的:
引用判若兩人,丟給我去承受雖然長得想象之中不太一樣,但這個「威震天」還是能幹一點活兒的,比如搬東西:
想象中,很不同
想象中一切都和後來不同
比如澆花:
再比如,在超級工廠裏搬磚:
看起來,這位「威震天」能幹的活還真不少,馬斯克説,成本下降以後,一台「威震天」大概會賣 2 萬美元。所以,要想找個人替我上班,我至少得準備 14 萬元人民幣……
打擾了,我還是自己來吧。
正當我嘗試説服自己接受這個事實時,舞台上突然出現了一位新人,它的顏值要比剛剛那位「威震天」高多了。實際上,「威震天」是今年 2 月造出來的開發平台,下面這位才是擎天柱。
▲從左至右分別是夢中情人版、原相機版、美顏相機版
為這台擎天柱提供能量的不是火種,而一塊容量為 2.3kWh 的電池包,它被充分保護,放置在最核心的身體部位,即為圖中藍色的那一塊。
馬斯克稱,擎天柱「非常適合一整天的工作」,它靜坐時的功耗約為 100w,快走時為 500w。可能有人會問快走是多快,大概 2 米每秒。
為了確保擎天柱的靈活性,Tesla 為其設計了 28 個關節,每一個關節裏都有多套執行器,這些執行器能夠在後台分析執行效率,減少無效工作。
擎天柱最靈活的部位,是它的手。
Tesla 表示,整台擎天柱擁有 200 多個自由度,而它的手佔了其中的 27 個,由促動機(actuator)驅動,通過視覺系統和算法,擎天柱能夠準確識別手與物體的位置,完成上面提到的澆花、取物的任務。
擎天柱重 73kg,全身上下共有 6 種促動機,完全為 Tesla 自研,這些促動機就像是人體的肌肉,驅動相應部位。
需要強調的是,雖然這些促動機看起來十分精緻小巧,這細胳膊細腿的,不像是能幹重活的人,但實際上,一個關節促動機,可以把這麼一個大件給吊起來。
▲這不是我奶奶中午出去買的菜,而是實實在在的一架鋼琴。
擎天柱身上最寶貴的東西,是它的「大腦」——一塊 FSD 芯片。沒錯,和你的 Model 3 裏的是一樣的,只不過你的 Model 3 有兩塊,它只有一塊,因此,擎天柱大約擁有 72TOPS 的算力。
為了保護擎天柱的「大腦」,Tesla 也廢了不少功夫,畢竟這玩意兒和車不一樣,車有四個輪子,它只有兩條腿,而且還不太利索。
在這一方面,Tesla 借鑑了他們的造車經驗,準備了一套模擬跌倒測試的軟件,來幫助他們進行研發。
與汽車上的吸能原理相同,Tesla 也為擎天柱加入了一塊吸能區,在其跌倒時,胸前的吸能區能夠有效控制損傷範圍,防止手臂和頭部受損。
對於容易受損的肩部等位置,Tesla 沒有選用碳纖維、鈦合金這樣的高成本原材料,將這一人形機器人的使用成本降到了最低。
不過,防止它摔壞的最好方法,還是讓他不要摔跤,好好走路。
從邁出第一步到自如地擺出各種姿勢,擎天柱花了 5 個月的時間:
總之,它就像馬斯克的一個孩子,無論是走路還是取物,都需要經過一段非常長的學習時間,好在,馬斯克的育兒經驗應該足夠豐富。
摘掉 beta 帽子的 FSD
説了這麼久的機器人,FSD 怎麼樣了。
其實,上面説的不只是機器人,同時也是 FSD。擎天柱採用了與 Tesla 汽車相同的 FSD(完全自動駕駛)計算平台,它的所有動作,都是通過 AI 模型的學習得來的。
放在車上也一樣。
目前,FSD beta 的用户已經超過了 16 萬人,要知道,這個數字在去年只有 2000。在如此龐大的「測試團隊」的幫助之下,Tesla 目前已經擁有了超過 14.4 億幀視頻數據。
同時,Tesla 對摒棄了去年近千人的標註團隊,對數據標註流程進行了全面優化,訓練速度提高了 30%。
此外,Tesla 介紹了一個名為 Occupancy networks 模型的東西,在這一模型中,我們的世界看起來就和 Minecraft 一樣。在這樣的環境中,即便車輛不能認出障礙物,也會做出避讓動作,安全性得到了提高。
同時,車輛還可以識別出道路的坡度,根據實際的道路情況,提前做出加速或減速的動作,提高了乘坐的舒適性。
對於 FSD 的現有能力,Tesla 舉了一個例子:
在無保護左轉時,為了不讓過馬路的行人受到驚嚇,車輛會找準時機,以較慢,但合適的速度從行人後方通過,同時不會影響從右方駛來的車輛的正常行進。
Tesla 表示,FSD 可以在小於 10 毫秒的時間內,列出超過 7500 萬種影響決策的因素,迅速做出最安全的決策。
用 Tesla 的話來説,這是「屬於車道的語言」。
FSD 的未來,在 Dojo 手中
最後我們來聊聊 Dojo。Tesla 説,Dojo 能將原本數月才能完成的訓練,壓縮至幾周。
這是專門用來進行模型訓練的超級計算機,其內部由一個個「訓練瓦片」(Training Tile),每個「瓦片」內含 25 塊 D1 芯片,這 25 塊芯片最終匯聚成 54P 算力和 13.4TB/S 的對分帶寬。
這還沒完,Tesla 將 6 個「瓦片」和 20 片接口處理器組成一個托盤(Tray),而 Dojo 的一個機櫃又由兩個托盤組成…… 聽起來有點套娃的感覺了是吧。
無論如何,在強大的硬件堆疊之下,一個 Dojo 機櫃就能提供 1.1E 的算力、13TB 的高帶寬內存,以及 1.3TB 的高速內存。最終,4 台 Dojo 就能提供相當於 72 個 GPU 機架的算力。
更不可思議的是,Tesla 説這玩意兒在 2023 年 Q1 就能量產。
至於最受關注的擎天柱的量產時間,Tesla 並沒有明確,馬斯克甚至不知道這一人型機器人最後會變成什麼樣子。
引用肯定可以進行對話和交談的,在技術上也會進一步升級,但我們還不知道終極目標會是怎樣的。
不過,我們雖然不知道擎天柱最後會變成什麼樣子,但馬斯克還是在 Twitter 上公佈了他的下一步:
給擎天柱找一個女朋友。
資料來源:愛範兒(ifanr)