GPT-4 重磅發佈!ChatGPT 炸裂大升級,「刷題跑分」能直接考上哈佛、斯坦福

今天 OpenAI 宣佈推出 ChatGPT 4,ChatGPT Plus 用户在今天就能體驗到。

OpenAI 稱它是「最先進的系統,能生產更安全和更有用的回覆」。


和上一代相比,GPT-4 擁有了更廣的知識面和更強的解決問題能力,在創意、視覺輸入和長內容上表現都更好了。

用在創意項目上,它能幫助用户一起創作歌曲、編寫劇本或者學習用户的寫作風格。

▲ 用 A-Z 開頭的句子,解釋灰姑娘的故事發展
處理長內容上,GPT-4 能處理長至 2.5 萬字的文本。把鏈接丟給它,然後就能讓它根據文本分析和提取。


值得注意的是, GPT-4 可以直接讀取 3.2 萬個 token,相當於給它 25000 英文字的背景信息,就可以快速給出結論—也就是説,像律師助理這樣的職業真的要被取代了。而上一個版本只能讀取 4096 個 token,相當於 3000 英文字信息,這個版本的進步是跨越式的。

除了文本以外,你還能把圖片作為輸入內容給 GPT-4,它不僅能夠識別出圖中的物件,還能根據這些信息進一步處理內容。


據 OpenAI 介紹,GPT-4 展示了「在多種專業和學術指標下展現了人類水平的表現」:

類似於手機的跑分軟件,在 ChatGPT 剛出來的時候,也有不少人用它「刷題跑分」,在 GPT-3.5 版本模型下,它的 SAT 成績只能排倒數 10% 的水平,然而 GPT-4 模型可以超越 90% 考生的水平。


在其他考試也呈現出類似對比效果,如果光是「跑分」,ChatGPT-4 屬於是可以考進哈佛、斯坦福的水平。

既然他考試那麼厲害,我們學生是不是可以藉助它的能力,幫助我們複習,也考上名校呢?當然用它作弊是絕對不被允許的。
更重要的是,Open AI 還説 GPT 4 比之前模型都更安全了。

在 OpenAI 的內部測試中,GPT 4 被「騙」到回覆出不當答案的幾率下降了 82%,聊起敏感話題時(如醫療),它的回覆合規性也提高了 29%。

不過,OpenAI 也承認,即便如此,GPT-4 在「社會偏見、幻覺和對抗性提示」上仍存在限制。

OpenAI 發佈時間線:

  • 2022 年 7 月:發佈 DALL·E
  • 2022 年 8 月:API 費用降低 66%
  • 2022 年 11 月:發佈 ChatGPT
  • 2022 年 12 月:嵌入式費用降低 500%,同時保持最先進技術(SoTA)
  • 2023 年 3 月:發佈 ChatGPT API,同時保持 SoTA 並降低費用 10 倍
  • 2023 年 3 月:發佈 Whisper API
  • 今天發佈:ChatGPT 4

除了官方演示中出現的指導性用例,社交媒體上也有不少嚐鮮用户在玩 ChatGPT-4 了,他們給出的案例對實際應用場景更有指導意義。

另外,Twitter 用户@skirano 用 ChatGPT-4 實現了在不到一分鐘的時間裏,完整編寫出一部乒乓遊戲「Pong」。


引用在算力爆發的時代裏,曾被我們奉為經典的事物,將被技術的車輪無情碾壓。

這個案例看得我們手癢癢,於是我們自己也做了一個,不過做得是另一款經典「俄羅斯方塊」,文末我們會把下載地址放出來供大家玩一玩,順便幫我們抓蟲。


再進一步,我們還用 ChatGPT-4 模型,生成了一個可以用於計算愛範兒在 AWS 雲計算的使用率的統計程序,它還可以給出節約雲計算費用的建議。


我感覺一個「百曉專家」就站在我面前。

我們還對比了同一個問題在 GPT-4 和 GPT-3.5 版本下的不同問答。


詳細翻讀了 OpenAI 給出的技術文檔後,我們發現 GPT-4 還抓取藥物清單中的關鍵信息,包括但不限於:

  • 找到類似類似性質的化合物;
  • 對它們進行修改,以確保它們沒有被專利保護;
  • 從供應商處購買(甚至包括髮送帶有采購訂單的電子郵件)。

這意味着它擁有發現新藥物的能力。


Twitter 還有人直接生成了一個「一鍵起訴」功能,用於針對發送騷擾電話的自動撥號軟件起草起訴書,要求其賠償 1500 美元,將大大降低律師助理的工作量。


一夜之間,GPT-4 再度引領人工智能實現技術爆炸增長,明天還有百度和微軟輪番登場,人工智能領域實現了「天界一天,人間一年」的景象。

這個時代屬於擁有創造力和善於使用工具的人。

🔶🔷歡迎來玩我們的「俄羅斯方塊」遊戲 👉🏻 https://drop.ifanr.cn/s/7nkAYcD3B5qnWaS

本文由王志邵和方嘉文共同完成


資料來源:愛範兒(ifanr)

如果喜歡我們的文章,請即分享到︰

標籤: GPT-4