蘋果搭載大模型的 Siri，可能和你想的不太一樣

蘋果的 AI，雖遲但到。

根據華爾街日報消息，蘋果正與百度商討，關於國內市場的 iPhone 以及其他設備中整合生成式 AI 的業務。

儘管目前還沒有得到官方的確認，不過有兩件事至此可以確定：

iPhone 16、iOS 18 和 MacOS 將會搭載 AI 功能
蘋果設備上的大模型，在國內外將由不同的廠商提供

https://s3.ifanr.com/wp-content/uploads/2024/03/siri11.jpg!720

圖片來源：s3.ifanr.com

比起早已搭載 AI 助手的國內品牌，蘋果這回又不出意外地晚了大半年，慢人一步似乎一直都是蘋果的標籤，只是它們總能在穩步前行中帶來一些驚喜。

然而，AI 大模型的進步速度正以周、甚至以天計數，蘋果的遲到，究竟是再一次後發先至，還是在新時代掉隊的開始。
略顯妥協的方案，先上車才是重點

上個月的最後一天，蘋果用 12 分鐘的短會宣佈：放棄造車，All in AI，汽車團隊的眾多成員將被調往 AI 部門。

蟄伏十年的泰坦計劃，倒在了入局新能源汽車的最後一年，對於未來百家爭鳴的汽車市場而言，會有些許遺憾，但從一家科技公司長遠的發展來看，這莫過於是一個長遠且正確的選擇。

https://s3.ifanr.com/wp-content/uploads/2024/03/siri24.jpg!720

圖片來源：s3.ifanr.com

AI 是基礎性的應用，在所有大公司都主動或被動擁抱 AI 的當下，蘋果的「斷舍離」˙順應着時代，而如何擁抱 AI？怎樣的人工智能才能在逐漸被瓜分的市場裏佔得一席之地？是它們最先要解決的難題。
針對國外市場，蘋果正在與 Google 積極談判，以便在 iOS 18 中加入 AI 大模型，實現其他品牌早就有的 AI 功能。

https://s3.ifanr.com/wp-content/uploads/2024/03/siri17.jpg!720

圖片來源：s3.ifanr.com

雖然目前「雙方尚未決定人工智能協議的條款或品牌，也沒有最終確定如何實施」，但在眾多備選合作商（OpenAI 和 Anthropic）中，Google 和 Gemini，應該是最適合蘋果和 iPhone 的那一個。

今年二月發售的三星 Galaxy S24 系列機型以 AI 功能出圈，通話翻譯、創意寫作等功能趕上了國內平均水平，即圈即搜縮短了搜索路徑，也極有可能成為今後 AI 手機的主要發展路線。

https://s3.ifanr.com/wp-content/uploads/2024/03/siri5.jpg!720

圖片來源：s3.ifanr.com

海外版的 S24 系列，就是通過大模型 Gemini 支持，才得以完成上述功能。

從經驗講，Google 已在全球出貨量最高的旗艦機型上，完成了初步嘗試，相比於在 PC 或 Web 端大火的廠商，它們更知道手機大模型的操作習慣、使用場景、適配應用應該怎麼做。

https://s3.ifanr.com/wp-content/uploads/2024/03/siri16.jpg!720

圖片來源：s3.ifanr.com

再者，Google 本身也更渴望得到蘋果的項目。

根據國際數據公司 IDC 的統計，三星在 2023 年全球智能手機市場佔有率達到了 19.4%，蘋果則成功登頂達到了 20.1%。

https://s3.ifanr.com/wp-content/uploads/2024/03/siri10.jpg!720

圖片來源：s3.ifanr.com

若是拿下蘋果，Gemini 在全球範圍內手機終端的搭載率將達到 4 成，這對於一家面臨激烈競爭的 AI 大模型公司，極為利好。

在夢裏笑醒的除了 Google，還有蘋果。

和其他強調「自研」的廠商不同，蘋果在一開始就以合作來達成 AI 上機，也有其自身的考量。

https://s3.ifanr.com/wp-content/uploads/2024/03/siri28.jpg!720

圖片來源：s3.ifanr.com

首先，在本身起步晚進度慢的現狀下，「拿來主義」是快速爭奪市場的妙手，和 Google 的合作，在減小研發成本，收取高額坑位費的同時，還能緩解兩家公司目前所面臨的監管壓力。

其次，AIGC 的技術很好，但在落地時卻因道德、隱私等方面的缺陷被大量詬病，交給成熟的第三方，特別是已經在三星機型上試水成功的 Google，省力省心，且減小了輿論和責任風險。

https://s3.ifanr.com/wp-content/uploads/2024/03/siri27.jpg!720

圖片來源：s3.ifanr.com

這當中的另一道坎，是技術本地化。每個國家和地區對 AI 大模型的監管和相關法規都有着不同的要求，合法合規的落地才是爭奪市場和發展技術的前提，因此才催生出了「國內+國際」雙管齊下的路線。

按照三星與百度初見成效的合作，蘋果才會選擇這條已經被「驗證為真」的路線。

https://s3.ifanr.com/wp-content/uploads/2024/03/siri18.jpg!720

圖片來源：s3.ifanr.com

國行版三星 S24 系列上的 AI 功能，實際上有多個廠家旗下的技術組成：即圈即搜功能由百度和京東提供；智能修圖由美圖秀秀的大模型 MiracleVision 完成；文章摘要、智能寫作則採用了百度的文心一言大模型。

蘋果是否也會與多家廠商合作，還要等待後續的消息，不過和百度的合作，已然板上釘釘。

最後，蘋果要做的並非一個智能語音助手，而是整套 AI 終端。但根據 Macrumor 的爆料，以目前的自研進度和技術成果，蘋果的大模型還遠達不到 Google、OpenAI 等公司水準。

https://s3.ifanr.com/wp-content/uploads/2024/03/siri30.jpg!720

圖片來源：s3.ifanr.com

與其趕鴨子上架一個智能聊天機器人，不如先拿成熟的方案做過渡，為自研大模型爭取更多的研究時間和進步空間。
當下的市場很重要，但未來的核心技術才是根本

合作，是蘋果 AI 全球化的第一步，而最終的目標，是為了擁有全路自研的 AI 大模型。

https://s3.ifanr.com/wp-content/uploads/2024/03/siri29.jpg!720

圖片來源：s3.ifanr.com

這是一項燒錢且耗神的工程，別説退步，稍微進步的慢一點，都有可能在下週被淘汰。一個有競爭力的大模型，往往代表着今後在市場上的主導權與議價權。

庫克認為：

引用生成式 AI 方面開闢新天地，我們相信這項技術可以重新定義未來。

而蘋果對於大模型的探索，其實一直都在日程表上。

本月 15 日，蘋果工程師悄悄發佈的一篇研究論文，當中詳細介紹了一種名為 MM1 的新型生成式 AI 模型的開發過程。

https://s3.ifanr.com/wp-content/uploads/2024/03/siri4.jpg!720

圖片來源：s3.ifanr.com

MM1 是一個具有最高 30B（300 億）參數的多模態 LLM 系列，這是蘋果在多模態大模型的最新研究成果。

總的來説，蘋果的自研模型在測試效果上，與 Gemini 和 GPT4V 還有一定的差距，也沒有在生成結果上表現出如 Sora 一樣驚人的效果，更沒有探索出一條全新的技術路線。

https://s3.ifanr.com/wp-content/uploads/2024/03/siri23.jpg!720

圖片來源：s3.ifanr.com

但是，它能通過控制各種數據變量，在對比中找出影響模型生成效果最關鍵的那幾個因素，簡單來説，它天生不強大，不過善於觀察、實踐和總結，在一次次的嘗試中，也能取得不錯的成績。

MM1 由密集模型和 MoE（混合專家）變體組成，當指令進入 MoE 後，究竟應該去「東市買駿馬」還是「西市買鞍韉」，都會被這個指令中心安排的明明白白的。

問題被細化和分類的同時，也提升了計算效率，節約了運行能耗。

https://s3.ifanr.com/wp-content/uploads/2024/03/siri21.jpg!720

圖片來源：s3.ifanr.com

這篇論文的發佈，代表的是蘋果在 AI 領域探索的階段性成果，雖然 MM1 沒有顛覆行業更沒有驚豔世界，但在晦澀難懂的專業術語裏還是能看出它們的進步：

引用我們的工作模式一直是先做工作，然後再談論工作，而不是在自己面前出言不遜。—— Tim Cook

沒有透露過多技術細節的蘋果，其實還在盤算着另一步棋：端側大模型。

https://s3.ifanr.com/wp-content/uploads/2024/03/siri3.jpg!720

圖片來源：s3.ifanr.com

早在去年底，蘋果在名為《閃存中的大型語言模型：在有限內存下高效的大型語言模型推理》的論文中，就提出了大模型落地 iPhone 等「內存有限」設備的方法。

研究人員稱，他們通過最新的閃存技術，在 iPhone 和其他內存受限的設備上成功部署了 LLM（大語言模型）。

https://s3.ifanr.com/wp-content/uploads/2024/03/siri6.jpg!720

圖片來源：s3.ifanr.com

這個項目被稱為 Apple GPT，最大的作用是將 LLM 數據直接存儲在閃存中，比如整合在 Siri 內部，相較於傳統的運行方法，新技術使 CPU 和 GPU 的推理速度，最大提升了 5 倍和 25 倍。

研究人員稱：「我們開發的這些效率型方法使得人工智能模型能夠在 iPhone 當前內存的兩倍範圍內運行。」

也就是説，側端搭載大模型有了可行性，通過減少閃存傳輸的數據量、提高每次傳輸的吞吐量，讓 LLM 的數據直接儲存在閃存中。

撇開技術，Siri 是我們和 AI 的橋樑

進度緩，消息少，佈局大。這是蘋果探索 AI 的概況。

https://s3.ifanr.com/wp-content/uploads/2024/03/siri33.jpg!720

圖片來源：s3.ifanr.com

每每看到蘋果的某項技術落後於市場和競爭對手，都會給人一種「起步太晚」的錯覺，實際上在翻看相關新聞和專利文件的時候，又會發現它往往是最早佈局的那一批，甚至那一個。

截止到 2023 年，蘋果總共收購了 32 家 AI 公司，位列科技巨頭中收購榜第一。而收購 Siri，應該可以算作蘋果入局 AI 的開端。

https://s3.ifanr.com/wp-content/uploads/2024/03/siri31.jpg!720

圖片來源：s3.ifanr.com

2010 年的喬布斯打給「Siri 之父」Dag Kittlaus 的一通電話，讓 Siri 以超過 2 億美元的身價，加入蘋果，走上 iPhone。

Siri 最初的定位是一個快速準確獲取信息的助手，或是處理複雜任務的助理。

https://s3.ifanr.com/wp-content/uploads/2024/03/siri7.jpg!720

圖片來源：s3.ifanr.com

在最原始的版本里，Siri 可以與 42 個網絡服務相連接——從餐館點評網站 Yelp、售票網站 StubHub，到電影點評網站 Rotten Tomatoes 和數學計算網站 Wolfram Alpha。

根據提示，Siri 會將各種信息整合，並回複用户。無需打開其他的應用軟件，Siri 就可以幫助用户買票、訂餐館或叫出租車。

這些如今被 AI Pin 和其他智慧助手大力宣揚的「AI 功能」，似乎只是十多年前 Siri 的「基礎操作」。
但 Siri 的實際體驗，已經在 AI 大模型爆炸式發展的當下，被拉開了不小差距。

https://s3.ifanr.com/wp-content/uploads/2024/03/siri9.jpg!720

圖片來源：s3.ifanr.com

智能助手，是對人的被動模仿，有問必答，有求必應。

而 AI 終端，則是對人的主動接近。根據用户的個人習慣、喜愛偏好，總結以往、推理以後，在不同的時間地點給予你最合適的建議和答案，並且能夠不斷地學習優化，成為「私人專屬」。

https://s3.ifanr.com/wp-content/uploads/2024/03/siri14.jpg!720

圖片來源：s3.ifanr.com

▲ 圖片來自：x.com

從整體上看，蘋果的遲到只是相對的晚，因為 AI 手機，還處於發展的早期階段。

的確，大部分國產品牌已經在 AI 終端的階段發力，功能大體相同，特長各有側重，但各家大模型的可用性只能算達到及格線，除了像 OPPO 相冊的 AI 消除、三星通話的實時翻譯、小愛同學的 AI 通話等細分功能，大部分的體驗目前還是與獨立的 AI 應用有些差距。

https://s3.ifanr.com/wp-content/uploads/2024/03/siri19.jpg!720

圖片來源：s3.ifanr.com

這當中，除了廠家的技術突破，也和 App 開放的接口有關，比如不支持微信語音通話摘要的模型，在日常生活中，就少了一大塊的應用空間。

因此，大模型和系統、App 的整合，以及對全新交互方式的探索，還有很長的路要走。在此之前，AI 功能還沒能達到影響消費者購機決策的程度。

https://s3.ifanr.com/wp-content/uploads/2024/03/siri8.jpg!720

圖片來源：s3.ifanr.com

在 AI 上機的元年，Siri 的目標是和其他 AI 助手抹平這半年多的差距；而作為蘋果佈局未來的重要部分，我們更期待 6 月份的 Siri，會帶來怎樣的「One more thing」。

資料來源：愛範兒（ifanr）

標籤: 蘋果 Siri AI