關於人工智能的二十件事


編者按:本文作者ZAVAIN DARLux Capital投資人。
有關人工智能:

1.過去二十年,在大數據集的數字化、建立管理大數據集的基礎框架和大數據計算範式上的進展,是解釋本世紀先後將重點放在數據科學和人工智能上的主要原因。

2.一旦我們數字化了數據,使得他們可以被程序處理,下一步就是撬動自動化和對未來的預測。隨着預測能力的增加,似乎更多“智能”的方面展現了出來。於是我們將“數據科學”這樣的術語改為“人工智能”。事實上這二者之間並沒有什麼明顯的差別,只是感覺上的新奇和困難程度不同而已。新奇度和難度隨着時間是呈正態分佈。今天“人工智能”給人的感覺就和昨天的“數據科學”一樣。


3.從數據中學習的AI叫做機器學習(Machine Learning)。傳統的機器學習從原始數據中提取人們可以識別的特徵,然後通過學習這些特徵產生一個最終的模型。


有關深度學習:

4.過去十年中,神經網絡,一種類似哺乳動物大腦突觸連接關係的機器學習結構,得以復興。神經網絡不需要人為提取特徵。原始數據進入學習算法之後不需要任何的人為工作,我們把它稱之為“深度學習”。

5.儘管深度學習技術和學習模型已經存在了幾十年了,但是我們現在才看到其理論創新和基於經驗的突破,因為基礎架構和數據的實用性才剛剛成熟。2006年,NVIDIA推出基於GPU的CUDA開發平台,成為了深度學習發展歷史上的風水嶺。


6.正是由於深度學習脱離了人為構建特徵使其得以成為一種自然的學習工具。很多技能,早在有能力以複雜的數學方式提取特徵之前,我們就已經學會了。這些技能是我們自然而然學會的,難以用高度的特徵歸納。通過傳統的機器學習手段,是很難憑人類的直覺得出,或是構造出高維的精確特徵的。

7.早在我們有能力構建複雜的語義(semantic)之前,我們就已經在機器視覺和自然語言處理等方面取得了很好的成績。但是學會這些技能不需要我們有數學推理的能力,更不要説人為有意構建的高層語義了。

8.深度學習在廣義的高維機器學習問題上已經展現了突破性的成果。其中覆蓋的領域包括基因組學,油氣,數位病理學甚至是公共市場。

有關強人工智能(Artificial General Intelligence,AGI)

9.近期關於人工智能的不實傳言引發了人們對於AGI的爭論。AGI是人們假設出的擁有像人一樣的智慧的計算機,各方面都能和人類比肩的強人工智能。

10.這很大程度上得益於深度學習在基本的人類技能上取得的重大突破和進展。比如機器視覺和自然語言處理等。

11.在未來一段時間內,這些努力都會被存於各個筒倉之內,也就是説不同小組之間相互獨立地在各自領域內努力着。

12.會使我們開發AGI的速度遭遇瓶頸的,並不是任何一個筒倉,而是讓他們彼此協作的能力,和建立合適的聯繫外界的輸入輸出通道。第一款AGI不會是一個有人類實體的機器人,而會出現在網上,這樣它就可以接收世界上的知識,擁有通過網絡的交流能力。

13.AGI會擁有類似人類的智力,但是卻不會有類似人類的外表,因為我們並不瞭解自己內在的“目標函數”。目前,我們在特定的領域內訓練計算機,使他們犯的錯誤最小化。除非我們知道我們自己的目標函數是如何校準的,否則,即使AGI會很智能甚至有可能會有意識的展現,但也絕對不會完全像人一樣。

14.2025年以後出生的小孩會認為軟件是有自己的意識的。這比大多數人想的都要來的更加突然和迅速。

15.人們會通過輸入輸出的通道來限制和規範AGI的行為。未來會有很多關於AGI善惡的爭論,關於增加其好的能力是否會同時使其產生潛在的惡意行為。無人駕駛汽車是一個早期、但是很有力的例子。

有關人工智能公司:

16.AI創業公司正處在創新和獲得資金增長週期之中。

17.AI學習技術和算法的商品化速度遠比我們想象的快。目前比較成功的創業公司,都獲取到了獨特的數據,並且不斷地利用AI模型從用户和企業之間的交互學習,加強他們的初期優勢。比較著名的例子是Google通過點擊率數據,將其作為一個私有的數據源和一種學習交互方式來幫助他們改進排名。

18.我們仍然在人工智能的春天。大科技公司會付大筆的錢收購那些有新成果的小團隊。這些新的成果,如果最後在外部成熟,對大科技公司來説會產生生存危機,這為我們看到的這些高價收購提供了合理的解釋。
19.提供人工智能工具的公司需要建立更有吸引力的平台來對抗“商品化”,從而獲得值得資本投入的成果。

20.未來五年,矽谷的言論會發生改變,從Marc Andreessen的“軟件在吞噬這個世界”變為“數據科學和人工智能在吞噬這個世界”。

本文編譯自:beardedbrownman.com


資料來源:36Kr

如果喜歡我們的文章,請即分享到︰