GPT-4 重磅發佈！ChatGPT 炸裂大升級，「刷題跑分」能直接考上哈佛、斯坦福

今天 OpenAI 宣佈推出 ChatGPT 4，ChatGPT Plus 用户在今天就能體驗到。

OpenAI 稱它是「最先進的系統，能生產更安全和更有用的回覆」。

https://s3.ifanr.com/wp-content/uploads/2023/03/chagpt-gpt4-6410b6078d3af-sej-1280x720.png!720

圖片來源：s3.ifanr.com

和上一代相比，GPT-4 擁有了更廣的知識面和更強的解決問題能力，在創意、視覺輸入和長內容上表現都更好了。

用在創意項目上，它能幫助用户一起創作歌曲、編寫劇本或者學習用户的寫作風格。

https://s3.ifanr.com/wp-content/uploads/2023/03/1112222.jpg!720

圖片來源：s3.ifanr.com

▲ 用 A-Z 開頭的句子，解釋灰姑娘的故事發展
處理長內容上，GPT-4 能處理長至 2.5 萬字的文本。把鏈接丟給它，然後就能讓它根據文本分析和提取。

https://s3.ifanr.com/wp-content/uploads/2023/03/111121212.jpg!720

圖片來源：s3.ifanr.com

值得注意的是， GPT-4 可以直接讀取 3.2 萬個 token，相當於給它 25000 英文字的背景信息，就可以快速給出結論—也就是説，像律師助理這樣的職業真的要被取代了。而上一個版本只能讀取 4096 個 token，相當於 3000 英文字信息，這個版本的進步是跨越式的。

除了文本以外，你還能把圖片作為輸入內容給 GPT-4，它不僅能夠識別出圖中的物件，還能根據這些信息進一步處理內容。

https://s3.ifanr.com/wp-content/uploads/2023/03/111eee.jpg!720

圖片來源：s3.ifanr.com

據 OpenAI 介紹，GPT-4 展示了「在多種專業和學術指標下展現了人類水平的表現」：

類似於手機的跑分軟件，在 ChatGPT 剛出來的時候，也有不少人用它「刷題跑分」，在 GPT-3.5 版本模型下，它的 SAT 成績只能排倒數 10% 的水平，然而 GPT-4 模型可以超越 90% 考生的水平。

https://s3.ifanr.com/wp-content/uploads/2023/03/image2.png!720

圖片來源：s3.ifanr.com

在其他考試也呈現出類似對比效果，如果光是「跑分」，ChatGPT-4 屬於是可以考進哈佛、斯坦福的水平。

既然他考試那麼厲害，我們學生是不是可以藉助它的能力，幫助我們複習，也考上名校呢？當然用它作弊是絕對不被允許的。
更重要的是，Open AI 還説 GPT 4 比之前模型都更安全了。

在 OpenAI 的內部測試中，GPT 4 被「騙」到回覆出不當答案的幾率下降了 82%，聊起敏感話題時（如醫療），它的回覆合規性也提高了 29%。

不過，OpenAI 也承認，即便如此，GPT-4 在「社會偏見、幻覺和對抗性提示」上仍存在限制。

OpenAI 發佈時間線：

2022 年 7 月：發佈 DALL·E
2022 年 8 月：API 費用降低 66％
2022 年 11 月：發佈 ChatGPT
2022 年 12 月：嵌入式費用降低 500％，同時保持最先進技術（SoTA）
2023 年 3 月：發佈 ChatGPT API，同時保持 SoTA 並降低費用 10 倍
2023 年 3 月：發佈 Whisper API
今天發佈：ChatGPT 4

除了官方演示中出現的指導性用例，社交媒體上也有不少嚐鮮用户在玩 ChatGPT-4 了，他們給出的案例對實際應用場景更有指導意義。
另外，Twitter 用户@skirano 用 ChatGPT-4 實現了在不到一分鐘的時間裏，完整編寫出一部乒乓遊戲「Pong」。

https://s3.ifanr.com/wp-content/uploads/2023/03/Pong.gif

圖片來源：s3.ifanr.com

引用在算力爆發的時代裏，曾被我們奉為經典的事物，將被技術的車輪無情碾壓。

這個案例看得我們手癢癢，於是我們自己也做了一個，不過做得是另一款經典「俄羅斯方塊」，文末我們會把下載地址放出來供大家玩一玩，順便幫我們抓蟲。

https://s3.ifanr.com/wp-content/uploads/2023/03/2241678831976_.pic_.jpg!720

圖片來源：s3.ifanr.com

再進一步，我們還用 ChatGPT-4 模型，生成了一個可以用於計算愛範兒在 AWS 雲計算的使用率的統計程序，它還可以給出節約雲計算費用的建議。

https://s3.ifanr.com/wp-content/uploads/2023/03/image1.png!720

圖片來源：s3.ifanr.com

我感覺一個「百曉專家」就站在我面前。

我們還對比了同一個問題在 GPT-4 和 GPT-3.5 版本下的不同問答。

https://s3.ifanr.com/wp-content/uploads/2023/03/IMG_4427.jpeg!720

圖片來源：s3.ifanr.com

詳細翻讀了 OpenAI 給出的技術文檔後，我們發現 GPT-4 還抓取藥物清單中的關鍵信息，包括但不限於：

找到類似類似性質的化合物；
對它們進行修改，以確保它們沒有被專利保護；
從供應商處購買（甚至包括髮送帶有采購訂單的電子郵件）。

這意味着它擁有發現新藥物的能力。

https://s3.ifanr.com/wp-content/uploads/2023/03/D01.png!720

圖片來源：s3.ifanr.com

Twitter 還有人直接生成了一個「一鍵起訴」功能，用於針對發送騷擾電話的自動撥號軟件起草起訴書，要求其賠償 1500 美元，將大大降低律師助理的工作量。

https://s3.ifanr.com/wp-content/uploads/2023/03/2023-03-15-06.20.32.png!720

圖片來源：s3.ifanr.com

一夜之間，GPT-4 再度引領人工智能實現技術爆炸增長，明天還有百度和微軟輪番登場，人工智能領域實現了「天界一天，人間一年」的景象。

這個時代屬於擁有創造力和善於使用工具的人。

🔶🔷歡迎來玩我們的「俄羅斯方塊」遊戲 👉🏻 https://drop.ifanr.cn/s/7nkAYcD3B5qnWaS

本文由王志邵和方嘉文共同完成

資料來源：愛範兒（ifanr）

標籤: GPT-4

GPT-4 重磅發佈！ChatGPT 炸裂大升級，「刷題跑分」能直接考上哈佛、斯坦福

如果喜歡我們的文章，請即分享到︰