騰訊發佈 AI 戰略:圍繞遊戲、社交、內容三大場景,Make AI Everywhere
11 月 8 日,在成都召開的騰訊全球合作伙伴上,騰訊首席運營官任宇昕提出了三個戰略:連接智能化、內容生態化、技術雲化。
在技術雲化部分,他提出了 AI in all 戰略,這與百度 all in AI 戰略相比較,期間的差別或許是換湯不換藥。他表示,AI 無處不在,騰訊會研發所有技術,但並不是服務自己的產品和業務,而是開放出來分享給全行業,與各行各業實體應用相結合,得到實際價值發揮。
騰訊 AI lab 實驗室主任張潼則全面剖析了騰訊 AI 的整體戰略,主要是與企業、社會、學界三個領域之間的關聯。
張潼介紹説,騰訊 AI 要打造自己的世界級研究能力,要做科技創新,就需要特定研究能力。另外,騰訊希望能夠將 AI 技術轉化、應用到騰訊的各個業務場景中去,同時也能與外部共享研究應用成果,這是企業層面。
而在社會層面,他們希望行業共享大生態,將從場景、技術、人才、資本四個方面全面扶植AI創業者。同時,也要賦能中小從業者和傳統產業,幫助行業做深度解決方案,推動 AI 在更多垂直領域台落地。
與學界之間的溝通也是不可或缺的,他們希望能培養產學研結合的人才,將工業界資源、經驗反向輸入到 AI 人才“造血庫”,與學界聯合培養AI領域的人才。
換句話説,就是對內、對外、產學相結合的“三位一體”方案,從這三方面出發,來實現騰訊 AI 的 Make AI everywhere 的目標。
而在應用層,騰訊 AI 主要圍繞騰訊內部的三個應用場景,主要有以下三個方面:
一是遊戲 AI,AI 在遊戲的應用包括製造流程、玩家體驗以及電競等。就在今日上午,騰訊首席運營官任宇昕也提到 AI 在遊戲領域的應用,他表示,AI 賦能遊戲,能讓遊戲世界每個角色自己可以思考,能脱離人的情緒對遊戲的干預,遊戲角色可以自我發展。“未來的遊戲不是設定好的,而是一個不斷升級的角色。”
二是社交 AI,下一代社交是基於人機對話軟硬件一體的,騰訊 AI 將會推出新產品,目前在系統層面也有不錯的進展,並已經在落地當中,明年會將AI能力開放給開發者。
三是內容 AI,AI 可以用於分析內容、理解內容和做內容推薦,騰訊 AI Lab 和不同的業務部門有不同的合作模式,有些是做整體方案,有些是做技術點,然後提供給業務部門。
BAT 三大巨頭裏,騰訊的 AI 能力依然處於追趕者的角色,它先從內部應用場景做起,也是基於自身的戰略佈局考慮,但當 BT 都在瞄準外部更廣闊的 AI 應用場景時,騰訊目前能拿出的好像也只有醫療領域的“騰訊覓影”了。
在張潼將整個騰訊 AI Lab 戰略架構描述一遍之後,基於上述三個應用層方向,包括遊戲 AI、多媒體 AI、機器翻譯的負責人又將各自所屬領域的應用場景和產品做了詳盡介紹。
遊戲 AI
遊戲 AI 是騰訊 AI 應用層的第一大板塊,在人工智能分論壇上,騰訊 AI lab 機器學習中心負責人劉晗以“虛擬世界對物理世界的賦能”為主題,進行了詳細講解,主要分享了騰訊公司對遊戲AI的理解與佈局。劉晗表示,這也是騰訊第一次在公開場合,闡述騰訊公司對遊戲AI的思考。
劉晗希望通過他的分享,對外傳達三個要點:一,什麼是遊戲 AI;二,研究中游戲 AI 應具備哪些核心能力;三,為了得到核心能力,面臨的挑戰是什麼,以及騰訊的解決方案是什麼。
具體來看,針對第一個問題——什麼是遊戲 AI。劉晗認為,遊戲 AI 是人工智能與博弈論形成的一個交叉領域,研究的是人、智能體、環境三者之間的複雜交互關係。對遊戲 AI 的認識,是人類理解通用人工智能的一種渠道。從整體分類上而言,遊戲可以分為兩類:一類叫 PvP,即人類對人類的遊戲;另一類叫 PvE,即玩家對環境的遊戲。
針對第二個問題——遊戲AI的核心能力有什麼?從騰訊的角度而言,主要對遊戲 AI 的三個核心能力感興趣,分別是感知、決策、對話,這三種能力分別對應於人類大腦的三個組成部分(左腦、右腦、後腦)。
其中,感知能力指的是把外在環境轉變為機器能夠理解的內在狀態;決策能力指的是把內在狀態轉變為下一步的動作和行為;對話的能力指的就是使用自然語言溝通的能力。
為了獲得這三個核心能力,遊戲 AI 的研究者需要面對三個核心挑戰,分別是狀態空間過大、多智能體協調、虛擬與現實的打通。面對三大挑戰,騰訊 AI Lab 分別提供了對應的解決方案。
劉晗提到,遊戲 AI 雖然是在虛擬世界裏進行研究,有着識錯成本低、迭代速度快的優勢,但其實最終還是為了應用在現實物理世界。
多媒體 AI
多媒體 AI 的發展源自圖像 AI,後者從特徵提取與分類器訓練的淺層學習模式,進化到了端到端訓練的深度學習模式,它的發展對圖像識別有革命性的意義,大大降低了 ImageNet 千類物體識別的錯誤率。
而隨着深度學習的算法創新,多媒體 AI 也由此形成,它賦予了計算機處理、識別、理解多媒體內容的綜合能力。
據劉威介紹,騰訊 AI 在多媒體 AI 的探索從圖像的圖像編輯,OCR/人臉識別,圖像描述生成,到 AR和3D 視覺,視頻縮略到有所涉及。目前推廣中的應用場景主要包括影視特效、短視頻拍攝、增強現實。
此外,騰訊 AI 還將在移動應用、場景重建、遊戲娛樂、機器人視覺四個應用場景進行推廣。多媒體 AI 技術,包括從視頻製作的產生、處理、識別、理解、內容分發發力,從而覆蓋完整視頻產業鏈。
機器翻譯
基於騰訊 AI 的語音識別、圖像識別、人機交互的機器翻譯技術,相應的機器翻譯場景為同聲傳譯、拍照翻譯、輔助翻譯。
據機器翻譯平台負責人楊月奎介紹,同聲傳譯中的機器翻譯的難點在於譯文忠實度問題、速度解碼問題,以及口語化文本、文本標點、文本錯別字等 Query 容錯問題。
而他們的解決方案是強化注意力模型、重構網絡覆蓋度與長度懲罰;在 GPU 上解碼、支持並行解碼,局部詞表、優先隊列以及基於統計的 Query 改寫,從而實現更快、更準、更通用的同聲傳譯機器翻譯。
在輔助翻譯方面,據雷鋒網(公眾號:雷鋒網)了解,騰訊機器翻譯平台的輔助翻譯平台、嵌入式翻譯系統、交互式翻譯助手分別面向人工翻譯團隊、面向 B 端客户和 C 端客户。
楊月奎也對機器翻譯的未來進行了展望,在他看來,機器翻譯的思路可應用於所有序列到序列的問題,包括 Query 改寫、摘要生成、問答系統、寫詩等等。
AI 產品場景化
騰訊智能平台部總經理陳謙以“智能時代的場景化機遇和挑戰”為題作了演講。
他認為,人工智能結合場景有兩個特點。一是感官能力的多樣化,體現在視覺與聽覺信息的配合;二是計算設備的增強及小型化,比如智能電視這樣單場景單設備的極致閉環。
而 AI 產品的場景化原則,他總結了四點:真正自然而優美的語音交互、視覺與聽覺信息的高效配合,單場景單設備的極致閉環以及跨場景多設備的無縫銜接,並以騰訊叮噹的技術為例進一步做了闡釋。
騰訊 AI 生態計劃,四大核心構建 AI 生態開放
論壇上,騰訊還發布了“AI 生態計劃”,該計劃將通過開放 100 項 AI 技術,孵化 100 個 AI 創業項目,推出 300個“雲+創業百萬扶持計劃”,為 1000 個合作方賦能。
騰訊開放平台副總經理王蘭表示,該計劃的核心關鍵在於開放騰訊在場景、技術、人才和資本方面的資源及優勢。“圍繞場景、技術、人才、資本,騰訊開放平台會打造 AI 能力開放、孵化支持、產業落地和技術提升為核心的生態鏈條,與 AI 技術公司、產業合作方聯合打造行業解決方案。”她説。
據雷鋒網了解,在騰訊 AI 能力對外開放上,騰訊開放平台已先行推出了人工智能站點 AI.QQ.COM 和騰訊 AI 加速器。其中,AI.QQ.COM 開放了數十項 AI 技術能力;騰訊 AI 加速器今年從上千個項目中精選出 25 個 AI 創業項目,此外,還有4個海外AI大賽的優勝者入選。這些項目覆蓋零售、醫療、翻譯和機器人等 15 個垂直領域的 AI 應用探索。
由此看來,騰訊 AI 的戰略意圖非常明顯 ,圍繞企業、行業到學界的 AI 共享共連,然後在騰訊開放戰略之下,騰訊開放平台也將作為騰訊和產業應用的連接器,通過匯聚、開放騰訊核心 AI 能力然後和資源,最終實現 AI 技術規模化、產業化應用和場景落地。
*來自雷鋒網報道
雷鋒網原創文章,未經授權禁止轉載。詳情見轉載須知。
資料來源:雷鋒網