我讓 ChatGPT 幫我買張去東京的機票,結果它把我送到了巴塞羅那……
在前天的文章中,我們介紹了 ChatGPT 開放的全新模式 Web Browsing(網頁瀏覽),啓用後 ChatGPT 就可以開始上網,收集最新的互聯網資料進行作答。
今天我們再來講講 ChatGPT 另一個重要更新:插件集(Plugin)。
ChatGPT 可以利用插件調用最新的或特定的信息,執行一些特殊的操作。例如 OpenAI 曾經演示過讓 ChatGPT 調用 Dall E 插件,實現文生圖功能。
和 Web Browsing 一樣,插件集也是僅面向 ChatGPT Plus 用户開放的 Beta 測試功能,需要在用户界面的左下角點擊設置,然後按照以上步驟啓用。
接着,在聊天界面上就會出現「Plugin Store」的選項,你可以在這裏下載需要使用的插件,然後在聊天時即可調用該插件。
ChatGPT 列出了 8 個最熱門的插件,分別是 AI 外語導師 Speak、分發神器 Zapier、訂票租車 KAYAK、訂餐工具 OpenTable、法規助手 FiscalNote、旅程制定 Expedia、食譜購物 Instacart 以及知識回答 Wolfram。
這 8 個風格工具可以説基本涵蓋了 Plugin Store 的所有類型:教育類、工具類、生活類和檢索類 。
目前在 Plugin Store 共上架了 86 個插件,這些插件怎麼樣呢?
先説結論:功能強大,但不算好用。ChatGPT 插件目前的交互方式並不符合大部分用户的使用習慣。
Plugin Store 並不像 App Store 那樣,有詳細的描述、演示以及用户評價,你能看到的就只是一個名字、圖標以及簡單的一句話描述。
以比較熱門的 WebPilot 插件為例,從字面描述上看它是隻是一個可以讓 ChatGPT 讀取鏈接的插件,但實際上這個插件相當於給 ChatGPT 裝了一個瀏覽器,讓它可以上網衝浪。
你可以問它一些實時的信息,或者用指定網站的信息來解答,例如「蘋果股價是多少?」「用 Wiki 上的信息介紹任天堂」,它就能調用 WebPilot 找到答案。
更重要的是,ChatGPT 可以在一次回答中最多調用 3 個不同的插件,將不同的插件組合在一起就能創造出不一樣的工作流。
例如博主 Derek Cheung 分享了一個工作流,他將 WebPilot 和 DiagramIT 組合在了一起,實現了把網頁總結成知識導圖的功能。
還有用户組合使用 WebPilot 和 Expedia,制定了一趟詳細的旅程安排。
用上插件集後,ChatGPT 的能力確實拓展了不少,但這裏有個前提:
你在使用插件時,要非常明確自己的需求,以及知道哪些插件能夠幫你實現目的。
這就需要你花時間去探索各個插件的用途。對普通用户來説,這就是學習成本。
有個簡單的小技巧可以幫你快速上手:你可以直接問它這個插件應該怎麼用。
以國際象棋遊戲 Chess 插件為例,在我提問後,ChatGPT 耐心了講解了操作規則,以及一些小技巧(例如我可以讓它幫我下棋)。
按照 ChatGPT 給出的規則,你可以用你的自然語言實現很多操作,這是其他應用給不了你的體驗。
但問題又來了,ChatGPT + 插件的體驗,會比我們熟悉的 app 更好嗎?
目前 ChatGPT 有一大部分插件都是買票、訂餐、租房等生活類插件,體驗一圈後我發現,ChatGPT 遠不能取代攜程、美團等生活類應用。
ChatGPT 插件集主要有以下幾個問題:
1. 使用 GPT-4 模型,反應速度很慢,並且還很容易出錯宕機
2. 用上插件後依然會有「幻覺」問題,有一定幾率產生錯誤答案
舉個例子,我讓 ChatGPT 使用最熱門的訂票插件 KAYAK 購買飛往東京的機票,ChatGPT 卻説它找不到飛往東京的航班,並給我羅列了一些像巴塞羅那等與問題毫不相關的地點。
如果我把買票的工作全權交給 AI 的話,那後果不堪想象。
相比之下,在購票軟件上直接買票要就有安全感地多——買到即是想要。
當我要求 ChatGPT 使用多個插件去統計雙色球中獎的概率,它卻表示自己搜索不到數據,即便我把相關的網站鏈接給到它,它也會出錯。
這是 ChatGPT 獨特的工作方式註定的結果:你可以用很輕鬆的方式問它問題,但它不一定能給你準確的結果。反映到插件集上,那就是:能用,但不一定管用。目前 Plugin Store 上的大部分插件體驗基本都是這樣。
有哪些插件是值得推薦呢?以下 5 個插件值得一試。
1. Wolfram
學術百科,可以幫你解答各種問題,繪圖能力也很強大
2. WebPilot
ChatGPT 的瀏覽器
3. AskYourPDF
用 ChatGPT 處理 PDF 文件
4. ScholarAI
搜索最新學術論文
5. Show Me
根據數據製作圖表
那麼 ChatGPT 插件集的開發環境怎麼樣呢?
開發者 Astrian 跟我們演示了他正在開發的一個小插件:
通過調取遊戲《明日方舟》的數據接口,ChatGPT 為你統計遊戲裏的抽卡結果。
如果把這個插件和可以畫圖表的 Show Me 插件結合起來使用,還能用它畫出抽卡概率的餅狀圖。
Astrain 認為,目前開發 ChatGPT 的插件並不算特別方便,但是能夠順手解決一些簡單的任務還是挺有意思的。
他用了一個形象例子來解釋 ChatGPT 插件的工作原理:
開發者先寫一份插件的 API 文檔,讓 ChatGPT 理解,然後它就會調用這個 API 來完成相應的任務。
開發者可以為開發的插件生成一個臨時鏈接,分享給 15 個人(同樣需要開發者賬户)測試使用。按照官方的標準(如使用 OAuth 等)通過審核後,就能把插件上架到 Plugin Store。
在 Astrain 看來,要滿足官方的這些標準的話,對於個人開發者來説還是有一定門檻。
總的來説,ChatGPT 插件集並沒有像人們預期那樣,創造出一個新的「App Store」,用 AI 的力量重塑我們生活的一切。
它更像是一次 OpenAI 大膽的嘗試,給了開發者和用户更大的自由度去調試這個目前最強大的大語言模型,探索其能力邊界。
ChatGPT 就是你的專屬秘書,現在它有了很多的工具,當你給它一個明確的任務安排,並且有一定的結果預期,它可以幫你解決很多問題——儘管它現在還不夠完美。
這讓我想起前些日子微軟研究院在 3 月發佈的《通用人工智能的火花:GPT-4 早期實驗》論文。
研究人員在對未加限制的 GPT-4 模型做了一系列實驗後發現,GPT-4 的能力已經具有一定的普遍性,它的許多能力跨越了廣泛的領域,而且它在廣泛的任務中的表現達到或超過了人類水平,綜合來看,他們認為 GPT-4 可以説是邁向 AGI(通用型人工智能)的重要一步。
如今,開放了插件集能力後的 ChatGPT 可以説也擁有了一定程度的普遍性問題解決能力,這或許是大眾能接觸到的最接近「嬰兒版 AGI」的人工智能模型。
在科幻電影《2001 太空漫遊》裏面,庫布里克用猩猩拿起骨棒作為人類學會使用工具、創造文明的起點。對應到 AGI 的話,開放插件集的 ChatGPT 可能就是第一個拿起骨棒的「猩猩」。
資料來源:愛範兒(ifanr)
今天我們再來講講 ChatGPT 另一個重要更新:插件集(Plugin)。
ChatGPT 可以利用插件調用最新的或特定的信息,執行一些特殊的操作。例如 OpenAI 曾經演示過讓 ChatGPT 調用 Dall E 插件,實現文生圖功能。
和 Web Browsing 一樣,插件集也是僅面向 ChatGPT Plus 用户開放的 Beta 測試功能,需要在用户界面的左下角點擊設置,然後按照以上步驟啓用。
接着,在聊天界面上就會出現「Plugin Store」的選項,你可以在這裏下載需要使用的插件,然後在聊天時即可調用該插件。
ChatGPT 列出了 8 個最熱門的插件,分別是 AI 外語導師 Speak、分發神器 Zapier、訂票租車 KAYAK、訂餐工具 OpenTable、法規助手 FiscalNote、旅程制定 Expedia、食譜購物 Instacart 以及知識回答 Wolfram。
這 8 個風格工具可以説基本涵蓋了 Plugin Store 的所有類型:教育類、工具類、生活類和檢索類 。
目前在 Plugin Store 共上架了 86 個插件,這些插件怎麼樣呢?
先説結論:功能強大,但不算好用。ChatGPT 插件目前的交互方式並不符合大部分用户的使用習慣。
Plugin Store 並不像 App Store 那樣,有詳細的描述、演示以及用户評價,你能看到的就只是一個名字、圖標以及簡單的一句話描述。
以比較熱門的 WebPilot 插件為例,從字面描述上看它是隻是一個可以讓 ChatGPT 讀取鏈接的插件,但實際上這個插件相當於給 ChatGPT 裝了一個瀏覽器,讓它可以上網衝浪。
你可以問它一些實時的信息,或者用指定網站的信息來解答,例如「蘋果股價是多少?」「用 Wiki 上的信息介紹任天堂」,它就能調用 WebPilot 找到答案。
更重要的是,ChatGPT 可以在一次回答中最多調用 3 個不同的插件,將不同的插件組合在一起就能創造出不一樣的工作流。
例如博主 Derek Cheung 分享了一個工作流,他將 WebPilot 和 DiagramIT 組合在了一起,實現了把網頁總結成知識導圖的功能。
還有用户組合使用 WebPilot 和 Expedia,制定了一趟詳細的旅程安排。
用上插件集後,ChatGPT 的能力確實拓展了不少,但這裏有個前提:
你在使用插件時,要非常明確自己的需求,以及知道哪些插件能夠幫你實現目的。
這就需要你花時間去探索各個插件的用途。對普通用户來説,這就是學習成本。
有個簡單的小技巧可以幫你快速上手:你可以直接問它這個插件應該怎麼用。
以國際象棋遊戲 Chess 插件為例,在我提問後,ChatGPT 耐心了講解了操作規則,以及一些小技巧(例如我可以讓它幫我下棋)。
按照 ChatGPT 給出的規則,你可以用你的自然語言實現很多操作,這是其他應用給不了你的體驗。
但問題又來了,ChatGPT + 插件的體驗,會比我們熟悉的 app 更好嗎?
目前 ChatGPT 有一大部分插件都是買票、訂餐、租房等生活類插件,體驗一圈後我發現,ChatGPT 遠不能取代攜程、美團等生活類應用。
ChatGPT 插件集主要有以下幾個問題:
1. 使用 GPT-4 模型,反應速度很慢,並且還很容易出錯宕機
2. 用上插件後依然會有「幻覺」問題,有一定幾率產生錯誤答案
舉個例子,我讓 ChatGPT 使用最熱門的訂票插件 KAYAK 購買飛往東京的機票,ChatGPT 卻説它找不到飛往東京的航班,並給我羅列了一些像巴塞羅那等與問題毫不相關的地點。
如果我把買票的工作全權交給 AI 的話,那後果不堪想象。
相比之下,在購票軟件上直接買票要就有安全感地多——買到即是想要。
當我要求 ChatGPT 使用多個插件去統計雙色球中獎的概率,它卻表示自己搜索不到數據,即便我把相關的網站鏈接給到它,它也會出錯。
這是 ChatGPT 獨特的工作方式註定的結果:你可以用很輕鬆的方式問它問題,但它不一定能給你準確的結果。反映到插件集上,那就是:能用,但不一定管用。目前 Plugin Store 上的大部分插件體驗基本都是這樣。
有哪些插件是值得推薦呢?以下 5 個插件值得一試。
1. Wolfram
學術百科,可以幫你解答各種問題,繪圖能力也很強大
2. WebPilot
ChatGPT 的瀏覽器
3. AskYourPDF
用 ChatGPT 處理 PDF 文件
4. ScholarAI
搜索最新學術論文
5. Show Me
根據數據製作圖表
那麼 ChatGPT 插件集的開發環境怎麼樣呢?
開發者 Astrian 跟我們演示了他正在開發的一個小插件:
通過調取遊戲《明日方舟》的數據接口,ChatGPT 為你統計遊戲裏的抽卡結果。
如果把這個插件和可以畫圖表的 Show Me 插件結合起來使用,還能用它畫出抽卡概率的餅狀圖。
Astrain 認為,目前開發 ChatGPT 的插件並不算特別方便,但是能夠順手解決一些簡單的任務還是挺有意思的。
他用了一個形象例子來解釋 ChatGPT 插件的工作原理:
開發者先寫一份插件的 API 文檔,讓 ChatGPT 理解,然後它就會調用這個 API 來完成相應的任務。
開發者可以為開發的插件生成一個臨時鏈接,分享給 15 個人(同樣需要開發者賬户)測試使用。按照官方的標準(如使用 OAuth 等)通過審核後,就能把插件上架到 Plugin Store。
在 Astrain 看來,要滿足官方的這些標準的話,對於個人開發者來説還是有一定門檻。
總的來説,ChatGPT 插件集並沒有像人們預期那樣,創造出一個新的「App Store」,用 AI 的力量重塑我們生活的一切。
它更像是一次 OpenAI 大膽的嘗試,給了開發者和用户更大的自由度去調試這個目前最強大的大語言模型,探索其能力邊界。
ChatGPT 就是你的專屬秘書,現在它有了很多的工具,當你給它一個明確的任務安排,並且有一定的結果預期,它可以幫你解決很多問題——儘管它現在還不夠完美。
這讓我想起前些日子微軟研究院在 3 月發佈的《通用人工智能的火花:GPT-4 早期實驗》論文。
研究人員在對未加限制的 GPT-4 模型做了一系列實驗後發現,GPT-4 的能力已經具有一定的普遍性,它的許多能力跨越了廣泛的領域,而且它在廣泛的任務中的表現達到或超過了人類水平,綜合來看,他們認為 GPT-4 可以説是邁向 AGI(通用型人工智能)的重要一步。
如今,開放了插件集能力後的 ChatGPT 可以説也擁有了一定程度的普遍性問題解決能力,這或許是大眾能接觸到的最接近「嬰兒版 AGI」的人工智能模型。
在科幻電影《2001 太空漫遊》裏面,庫布里克用猩猩拿起骨棒作為人類學會使用工具、創造文明的起點。對應到 AGI 的話,開放插件集的 ChatGPT 可能就是第一個拿起骨棒的「猩猩」。
資料來源:愛範兒(ifanr)