人肉足球員比機械人勁揪!?
對機械人而言,「在這種情況下應該做XX」,是什麽意思?
在人機大戰的世代,我們天天都聽說人肉快將被機械(泛指電腦、AI、程式)取代。可是,懂電腦和Al的圖靈獎得主珀爾(Judea Pearl),卻説我們有一個絕招是機械人很難做到的,那就是爬越因果階梯的第三層,做到反事實的想像。
要踏上因果階梯第三層的反面想像,有那麽難嗎?在下根據《超級巨星經濟學》的邏輯推理,認為掌門人的答案是:「對機械人來説很難;對我們卻易如反掌──如果我們想得其法。」上周講述法國新金童麥巴比(Kylian Mbappé)引球出擊時在獨食與小組之間,因選擇前者而失掉皮球。
故事是這樣延續的:失球之後,教練普捷天奴(Mauricio Pochettino)在場邊暴跳如雷,大吼道:「在這種情況下,你本來應該把皮球傳給隊友!」
不是隨心所欲,而要想得其法
這是「反事實」的思維模式,含義其實挺複雜的。首先,「你應該」,即是說小麥你早已學過三角短傳,而這選項現在看來是優於自把自為,所以教練才勞氣地咆吼「你應該……」,即如果你遵從訓練介入(第二層)的原則,你應該會在反面想像(第三層)的世界裏過關。
其次,對機械人而言,「在這種情況下」,是什麽意思?已經發生了的,不可能再發生一次;而過去的練習或比賽的場景,不可能與剛剛發生的失球前的場景一模一樣,不管是位置、動作、環境等都不盡一樣。
那麽,教練說「在這種情況下」,一句對有血有肉的球員很有意義的指引,說給機械人聽,它就無所適從,因為情景太多、參數太複雜,那個代號編碼是怎樣不一樣而又一樣?(珀爾還舉了機械吸塵機死機的例子!)而且教練要求想像出來的結果又是與實際經驗相反的,所謂相反,又不是所有的都是相反的……
最後,教練在指示「應該把皮球傳給隊友」時,即是要前鋒明白自己的行為「必要性」地導致失球(是個因果關係語),那麽下次再有類似的情況,小麥你得好歹給我傳好皮球給隊友,是有自由意志下的選擇偏向。
想那傢伙想像不了的!
這些「反事實」與真事實,均只是在小麥的意識流中發生,現實是皮球已經丟了,機械人按程式電光火石間一早就跑去追皮球,還有空聽教練發囉唆?
人肉球員,不需要是美斯/麥巴比的水平,就算質素是一般的,下次便自自然然會學乖了(麥其實也不獨食)。但機械人卻無從入手,要它們從失敗中自我學習,曉得反省「我應該傳球」,珀爾認為是「強AI」要攻克的一道厚厚的牆。
機械人是程式的結集,縱然有深度學習,然而它沒有人類(那怕是三歲的小孩)所擁有的自由意志(free will),暫時還沒有喜歡冒險、試驗和檢驗一些不可預知的選項的能力。
許多複雜的場景之中,你不需要是金童,就能打敗機械人。
(前鋒的故事參考Judea Pearl (2017) Book of Why;麥巴比等的部分純為杜攢。)
在人機大戰的世代,我們天天都聽說人肉快將被機械(泛指電腦、AI、程式)取代。可是,懂電腦和Al的圖靈獎得主珀爾(Judea Pearl),卻説我們有一個絕招是機械人很難做到的,那就是爬越因果階梯的第三層,做到反事實的想像。
要踏上因果階梯第三層的反面想像,有那麽難嗎?在下根據《超級巨星經濟學》的邏輯推理,認為掌門人的答案是:「對機械人來説很難;對我們卻易如反掌──如果我們想得其法。」上周講述法國新金童麥巴比(Kylian Mbappé)引球出擊時在獨食與小組之間,因選擇前者而失掉皮球。
故事是這樣延續的:失球之後,教練普捷天奴(Mauricio Pochettino)在場邊暴跳如雷,大吼道:「在這種情況下,你本來應該把皮球傳給隊友!」
不是隨心所欲,而要想得其法
這是「反事實」的思維模式,含義其實挺複雜的。首先,「你應該」,即是說小麥你早已學過三角短傳,而這選項現在看來是優於自把自為,所以教練才勞氣地咆吼「你應該……」,即如果你遵從訓練介入(第二層)的原則,你應該會在反面想像(第三層)的世界裏過關。
其次,對機械人而言,「在這種情況下」,是什麽意思?已經發生了的,不可能再發生一次;而過去的練習或比賽的場景,不可能與剛剛發生的失球前的場景一模一樣,不管是位置、動作、環境等都不盡一樣。
那麽,教練說「在這種情況下」,一句對有血有肉的球員很有意義的指引,說給機械人聽,它就無所適從,因為情景太多、參數太複雜,那個代號編碼是怎樣不一樣而又一樣?(珀爾還舉了機械吸塵機死機的例子!)而且教練要求想像出來的結果又是與實際經驗相反的,所謂相反,又不是所有的都是相反的……
最後,教練在指示「應該把皮球傳給隊友」時,即是要前鋒明白自己的行為「必要性」地導致失球(是個因果關係語),那麽下次再有類似的情況,小麥你得好歹給我傳好皮球給隊友,是有自由意志下的選擇偏向。
想那傢伙想像不了的!
這些「反事實」與真事實,均只是在小麥的意識流中發生,現實是皮球已經丟了,機械人按程式電光火石間一早就跑去追皮球,還有空聽教練發囉唆?
人肉球員,不需要是美斯/麥巴比的水平,就算質素是一般的,下次便自自然然會學乖了(麥其實也不獨食)。但機械人卻無從入手,要它們從失敗中自我學習,曉得反省「我應該傳球」,珀爾認為是「強AI」要攻克的一道厚厚的牆。
機械人是程式的結集,縱然有深度學習,然而它沒有人類(那怕是三歲的小孩)所擁有的自由意志(free will),暫時還沒有喜歡冒險、試驗和檢驗一些不可預知的選項的能力。
許多複雜的場景之中,你不需要是金童,就能打敗機械人。
(前鋒的故事參考Judea Pearl (2017) Book of Why;麥巴比等的部分純為杜攢。)