蘋果搭載大模型的 Siri,可能和你想的不太一樣
蘋果的 AI,雖遲但到。
根據華爾街日報消息,蘋果正與百度商討,關於國內市場的 iPhone 以及其他設備中整合生成式 AI 的業務。
儘管目前還沒有得到官方的確認,不過有兩件事至此可以確定:
比起早已搭載 AI 助手的國內品牌,蘋果這回又不出意外地晚了大半年,慢人一步似乎一直都是蘋果的標籤,只是它們總能在穩步前行中帶來一些驚喜。
然而,AI 大模型的進步速度正以周、甚至以天計數,蘋果的遲到,究竟是再一次後發先至,還是在新時代掉隊的開始。
略顯妥協的方案,先上車才是重點
上個月的最後一天,蘋果用 12 分鐘的短會宣佈:放棄造車,All in AI,汽車團隊的眾多成員將被調往 AI 部門。
蟄伏十年的泰坦計劃,倒在了入局新能源汽車的最後一年,對於未來百家爭鳴的汽車市場而言,會有些許遺憾,但從一家科技公司長遠的發展來看,這莫過於是一個長遠且正確的選擇。
AI 是基礎性的應用,在所有大公司都主動或被動擁抱 AI 的當下,蘋果的「斷舍離」˙順應着時代,而如何擁抱 AI?怎樣的人工智能才能在逐漸被瓜分的市場裏佔得一席之地?是它們最先要解決的難題。
針對國外市場,蘋果正在與 Google 積極談判,以便在 iOS 18 中加入 AI 大模型,實現其他品牌早就有的 AI 功能。
雖然目前「雙方尚未決定人工智能協議的條款或品牌,也沒有最終確定如何實施」,但在眾多備選合作商(OpenAI 和 Anthropic)中,Google 和 Gemini,應該是最適合蘋果和 iPhone 的那一個。
今年二月發售的三星 Galaxy S24 系列機型以 AI 功能出圈,通話翻譯、創意寫作等功能趕上了國內平均水平,即圈即搜縮短了搜索路徑,也極有可能成為今後 AI 手機的主要發展路線。
海外版的 S24 系列,就是通過大模型 Gemini 支持,才得以完成上述功能。
從經驗講,Google 已在全球出貨量最高的旗艦機型上,完成了初步嘗試,相比於在 PC 或 Web 端大火的廠商,它們更知道手機大模型的操作習慣、使用場景、適配應用應該怎麼做。
再者,Google 本身也更渴望得到蘋果的項目。
根據國際數據公司 IDC 的統計,三星在 2023 年全球智能手機市場佔有率達到了 19.4%,蘋果則成功登頂達到了 20.1%。
若是拿下蘋果,Gemini 在全球範圍內手機終端的搭載率將達到 4 成,這對於一家面臨激烈競爭的 AI 大模型公司,極為利好。
在夢裏笑醒的除了 Google,還有蘋果。
和其他強調「自研」的廠商不同,蘋果在一開始就以合作來達成 AI 上機,也有其自身的考量。
首先,在本身起步晚進度慢的現狀下,「拿來主義」是快速爭奪市場的妙手,和 Google 的合作,在減小研發成本,收取高額坑位費的同時,還能緩解兩家公司目前所面臨的監管壓力。
其次,AIGC 的技術很好,但在落地時卻因道德、隱私等方面的缺陷被大量詬病,交給成熟的第三方,特別是已經在三星機型上試水成功的 Google,省力省心,且減小了輿論和責任風險。
這當中的另一道坎,是技術本地化。每個國家和地區對 AI 大模型的監管和相關法規都有着不同的要求,合法合規的落地才是爭奪市場和發展技術的前提,因此才催生出了「國內+國際」雙管齊下的路線。
按照三星與百度初見成效的合作,蘋果才會選擇這條已經被「驗證為真」的路線。
國行版三星 S24 系列上的 AI 功能,實際上有多個廠家旗下的技術組成:即圈即搜功能由百度和京東提供;智能修圖由美圖秀秀的大模型 MiracleVision 完成;文章摘要、智能寫作則採用了百度的文心一言大模型。
蘋果是否也會與多家廠商合作,還要等待後續的消息,不過和百度的合作,已然板上釘釘。
最後,蘋果要做的並非一個智能語音助手,而是整套 AI 終端。但根據 Macrumor 的爆料,以目前的自研進度和技術成果,蘋果的大模型還遠達不到 Google、OpenAI 等公司水準。
與其趕鴨子上架一個智能聊天機器人,不如先拿成熟的方案做過渡,為自研大模型爭取更多的研究時間和進步空間。
當下的市場很重要,但未來的核心技術才是根本
合作,是蘋果 AI 全球化的第一步,而最終的目標,是為了擁有全路自研的 AI 大模型。
這是一項燒錢且耗神的工程,別説退步,稍微進步的慢一點,都有可能在下週被淘汰。一個有競爭力的大模型,往往代表着今後在市場上的主導權與議價權。
庫克認為:
而蘋果對於大模型的探索,其實一直都在日程表上。
本月 15 日,蘋果工程師悄悄發佈的一篇研究論文,當中詳細介紹了一種名為 MM1 的新型生成式 AI 模型的開發過程。
MM1 是一個具有最高 30B(300 億)參數的多模態 LLM 系列,這是蘋果在多模態大模型的最新研究成果。
總的來説,蘋果的自研模型在測試效果上,與 Gemini 和 GPT4V 還有一定的差距,也沒有在生成結果上表現出如 Sora 一樣驚人的效果,更沒有探索出一條全新的技術路線。
但是,它能通過控制各種數據變量,在對比中找出影響模型生成效果最關鍵的那幾個因素,簡單來説,它天生不強大,不過善於觀察、實踐和總結,在一次次的嘗試中,也能取得不錯的成績。
MM1 由密集模型和 MoE(混合專家)變體組成,當指令進入 MoE 後,究竟應該去「東市買駿馬」還是「西市買鞍韉」,都會被這個指令中心安排的明明白白的。
問題被細化和分類的同時,也提升了計算效率,節約了運行能耗。
這篇論文的發佈,代表的是蘋果在 AI 領域探索的階段性成果,雖然 MM1 沒有顛覆行業更沒有驚豔世界,但在晦澀難懂的專業術語裏還是能看出它們的進步:
沒有透露過多技術細節的蘋果,其實還在盤算着另一步棋:端側大模型。
早在去年底,蘋果在名為《閃存中的大型語言模型:在有限內存下高效的大型語言模型推理》的論文中,就提出了大模型落地 iPhone 等「內存有限」設備的方法。
研究人員稱,他們通過最新的閃存技術,在 iPhone 和其他內存受限的設備上成功部署了 LLM(大語言模型)。
這個項目被稱為 Apple GPT,最大的作用是將 LLM 數據直接存儲在閃存中,比如整合在 Siri 內部,相較於傳統的運行方法,新技術使 CPU 和 GPU 的推理速度,最大提升了 5 倍和 25 倍。
研究人員稱:「我們開發的這些效率型方法使得人工智能模型能夠在 iPhone 當前內存的兩倍範圍內運行。」
也就是説,側端搭載大模型有了可行性,通過減少閃存傳輸的數據量、提高每次傳輸的吞吐量,讓 LLM 的數據直接儲存在閃存中。
撇開技術,Siri 是我們和 AI 的橋樑
進度緩,消息少,佈局大。這是蘋果探索 AI 的概況。
每每看到蘋果的某項技術落後於市場和競爭對手,都會給人一種「起步太晚」的錯覺,實際上在翻看相關新聞和專利文件的時候,又會發現它往往是最早佈局的那一批,甚至那一個。
截止到 2023 年,蘋果總共收購了 32 家 AI 公司,位列科技巨頭中收購榜第一。而收購 Siri,應該可以算作蘋果入局 AI 的開端。
2010 年的喬布斯打給「Siri 之父」Dag Kittlaus 的一通電話,讓 Siri 以超過 2 億美元的身價,加入蘋果,走上 iPhone。
Siri 最初的定位是一個快速準確獲取信息的助手,或是處理複雜任務的助理。
在最原始的版本里,Siri 可以與 42 個網絡服務相連接——從餐館點評網站 Yelp、售票網站 StubHub,到電影點評網站 Rotten Tomatoes 和數學計算網站 Wolfram Alpha。
根據提示,Siri 會將各種信息整合,並回複用户。無需打開其他的應用軟件,Siri 就可以幫助用户買票、訂餐館或叫出租車。
這些如今被 AI Pin 和其他智慧助手大力宣揚的「AI 功能」,似乎只是十多年前 Siri 的「基礎操作」。
但 Siri 的實際體驗,已經在 AI 大模型爆炸式發展的當下,被拉開了不小差距。
智能助手,是對人的被動模仿,有問必答,有求必應。
而 AI 終端,則是對人的主動接近。根據用户的個人習慣、喜愛偏好,總結以往、推理以後,在不同的時間地點給予你最合適的建議和答案,並且能夠不斷地學習優化,成為「私人專屬」。
▲ 圖片來自:x.com
從整體上看,蘋果的遲到只是相對的晚,因為 AI 手機,還處於發展的早期階段。
的確,大部分國產品牌已經在 AI 終端的階段發力,功能大體相同,特長各有側重,但各家大模型的可用性只能算達到及格線,除了像 OPPO 相冊的 AI 消除、三星通話的實時翻譯、小愛同學的 AI 通話等細分功能,大部分的體驗目前還是與獨立的 AI 應用有些差距。
這當中,除了廠家的技術突破,也和 App 開放的接口有關,比如不支持微信語音通話摘要的模型,在日常生活中,就少了一大塊的應用空間。
因此,大模型和系統、App 的整合,以及對全新交互方式的探索,還有很長的路要走。在此之前,AI 功能還沒能達到影響消費者購機決策的程度。
在 AI 上機的元年,Siri 的目標是和其他 AI 助手抹平這半年多的差距;而作為蘋果佈局未來的重要部分,我們更期待 6 月份的 Siri,會帶來怎樣的「One more thing」。
資料來源:愛範兒(ifanr)
根據華爾街日報消息,蘋果正與百度商討,關於國內市場的 iPhone 以及其他設備中整合生成式 AI 的業務。
儘管目前還沒有得到官方的確認,不過有兩件事至此可以確定:
- iPhone 16、iOS 18 和 MacOS 將會搭載 AI 功能
- 蘋果設備上的大模型,在國內外將由不同的廠商提供
比起早已搭載 AI 助手的國內品牌,蘋果這回又不出意外地晚了大半年,慢人一步似乎一直都是蘋果的標籤,只是它們總能在穩步前行中帶來一些驚喜。
然而,AI 大模型的進步速度正以周、甚至以天計數,蘋果的遲到,究竟是再一次後發先至,還是在新時代掉隊的開始。
略顯妥協的方案,先上車才是重點
上個月的最後一天,蘋果用 12 分鐘的短會宣佈:放棄造車,All in AI,汽車團隊的眾多成員將被調往 AI 部門。
蟄伏十年的泰坦計劃,倒在了入局新能源汽車的最後一年,對於未來百家爭鳴的汽車市場而言,會有些許遺憾,但從一家科技公司長遠的發展來看,這莫過於是一個長遠且正確的選擇。
AI 是基礎性的應用,在所有大公司都主動或被動擁抱 AI 的當下,蘋果的「斷舍離」˙順應着時代,而如何擁抱 AI?怎樣的人工智能才能在逐漸被瓜分的市場裏佔得一席之地?是它們最先要解決的難題。
針對國外市場,蘋果正在與 Google 積極談判,以便在 iOS 18 中加入 AI 大模型,實現其他品牌早就有的 AI 功能。
雖然目前「雙方尚未決定人工智能協議的條款或品牌,也沒有最終確定如何實施」,但在眾多備選合作商(OpenAI 和 Anthropic)中,Google 和 Gemini,應該是最適合蘋果和 iPhone 的那一個。
今年二月發售的三星 Galaxy S24 系列機型以 AI 功能出圈,通話翻譯、創意寫作等功能趕上了國內平均水平,即圈即搜縮短了搜索路徑,也極有可能成為今後 AI 手機的主要發展路線。
海外版的 S24 系列,就是通過大模型 Gemini 支持,才得以完成上述功能。
從經驗講,Google 已在全球出貨量最高的旗艦機型上,完成了初步嘗試,相比於在 PC 或 Web 端大火的廠商,它們更知道手機大模型的操作習慣、使用場景、適配應用應該怎麼做。
再者,Google 本身也更渴望得到蘋果的項目。
根據國際數據公司 IDC 的統計,三星在 2023 年全球智能手機市場佔有率達到了 19.4%,蘋果則成功登頂達到了 20.1%。
若是拿下蘋果,Gemini 在全球範圍內手機終端的搭載率將達到 4 成,這對於一家面臨激烈競爭的 AI 大模型公司,極為利好。
在夢裏笑醒的除了 Google,還有蘋果。
和其他強調「自研」的廠商不同,蘋果在一開始就以合作來達成 AI 上機,也有其自身的考量。
首先,在本身起步晚進度慢的現狀下,「拿來主義」是快速爭奪市場的妙手,和 Google 的合作,在減小研發成本,收取高額坑位費的同時,還能緩解兩家公司目前所面臨的監管壓力。
其次,AIGC 的技術很好,但在落地時卻因道德、隱私等方面的缺陷被大量詬病,交給成熟的第三方,特別是已經在三星機型上試水成功的 Google,省力省心,且減小了輿論和責任風險。
這當中的另一道坎,是技術本地化。每個國家和地區對 AI 大模型的監管和相關法規都有着不同的要求,合法合規的落地才是爭奪市場和發展技術的前提,因此才催生出了「國內+國際」雙管齊下的路線。
按照三星與百度初見成效的合作,蘋果才會選擇這條已經被「驗證為真」的路線。
國行版三星 S24 系列上的 AI 功能,實際上有多個廠家旗下的技術組成:即圈即搜功能由百度和京東提供;智能修圖由美圖秀秀的大模型 MiracleVision 完成;文章摘要、智能寫作則採用了百度的文心一言大模型。
蘋果是否也會與多家廠商合作,還要等待後續的消息,不過和百度的合作,已然板上釘釘。
最後,蘋果要做的並非一個智能語音助手,而是整套 AI 終端。但根據 Macrumor 的爆料,以目前的自研進度和技術成果,蘋果的大模型還遠達不到 Google、OpenAI 等公司水準。
與其趕鴨子上架一個智能聊天機器人,不如先拿成熟的方案做過渡,為自研大模型爭取更多的研究時間和進步空間。
當下的市場很重要,但未來的核心技術才是根本
合作,是蘋果 AI 全球化的第一步,而最終的目標,是為了擁有全路自研的 AI 大模型。
這是一項燒錢且耗神的工程,別説退步,稍微進步的慢一點,都有可能在下週被淘汰。一個有競爭力的大模型,往往代表着今後在市場上的主導權與議價權。
庫克認為:
引用生成式 AI 方面開闢新天地,我們相信這項技術可以重新定義未來。
而蘋果對於大模型的探索,其實一直都在日程表上。
本月 15 日,蘋果工程師悄悄發佈的一篇研究論文,當中詳細介紹了一種名為 MM1 的新型生成式 AI 模型的開發過程。
MM1 是一個具有最高 30B(300 億)參數的多模態 LLM 系列,這是蘋果在多模態大模型的最新研究成果。
總的來説,蘋果的自研模型在測試效果上,與 Gemini 和 GPT4V 還有一定的差距,也沒有在生成結果上表現出如 Sora 一樣驚人的效果,更沒有探索出一條全新的技術路線。
但是,它能通過控制各種數據變量,在對比中找出影響模型生成效果最關鍵的那幾個因素,簡單來説,它天生不強大,不過善於觀察、實踐和總結,在一次次的嘗試中,也能取得不錯的成績。
MM1 由密集模型和 MoE(混合專家)變體組成,當指令進入 MoE 後,究竟應該去「東市買駿馬」還是「西市買鞍韉」,都會被這個指令中心安排的明明白白的。
問題被細化和分類的同時,也提升了計算效率,節約了運行能耗。
這篇論文的發佈,代表的是蘋果在 AI 領域探索的階段性成果,雖然 MM1 沒有顛覆行業更沒有驚豔世界,但在晦澀難懂的專業術語裏還是能看出它們的進步:
引用我們的工作模式一直是先做工作,然後再談論工作,而不是在自己面前出言不遜。—— Tim Cook
沒有透露過多技術細節的蘋果,其實還在盤算着另一步棋:端側大模型。
早在去年底,蘋果在名為《閃存中的大型語言模型:在有限內存下高效的大型語言模型推理》的論文中,就提出了大模型落地 iPhone 等「內存有限」設備的方法。
研究人員稱,他們通過最新的閃存技術,在 iPhone 和其他內存受限的設備上成功部署了 LLM(大語言模型)。
這個項目被稱為 Apple GPT,最大的作用是將 LLM 數據直接存儲在閃存中,比如整合在 Siri 內部,相較於傳統的運行方法,新技術使 CPU 和 GPU 的推理速度,最大提升了 5 倍和 25 倍。
研究人員稱:「我們開發的這些效率型方法使得人工智能模型能夠在 iPhone 當前內存的兩倍範圍內運行。」
也就是説,側端搭載大模型有了可行性,通過減少閃存傳輸的數據量、提高每次傳輸的吞吐量,讓 LLM 的數據直接儲存在閃存中。
撇開技術,Siri 是我們和 AI 的橋樑
進度緩,消息少,佈局大。這是蘋果探索 AI 的概況。
每每看到蘋果的某項技術落後於市場和競爭對手,都會給人一種「起步太晚」的錯覺,實際上在翻看相關新聞和專利文件的時候,又會發現它往往是最早佈局的那一批,甚至那一個。
截止到 2023 年,蘋果總共收購了 32 家 AI 公司,位列科技巨頭中收購榜第一。而收購 Siri,應該可以算作蘋果入局 AI 的開端。
2010 年的喬布斯打給「Siri 之父」Dag Kittlaus 的一通電話,讓 Siri 以超過 2 億美元的身價,加入蘋果,走上 iPhone。
Siri 最初的定位是一個快速準確獲取信息的助手,或是處理複雜任務的助理。
在最原始的版本里,Siri 可以與 42 個網絡服務相連接——從餐館點評網站 Yelp、售票網站 StubHub,到電影點評網站 Rotten Tomatoes 和數學計算網站 Wolfram Alpha。
根據提示,Siri 會將各種信息整合,並回複用户。無需打開其他的應用軟件,Siri 就可以幫助用户買票、訂餐館或叫出租車。
這些如今被 AI Pin 和其他智慧助手大力宣揚的「AI 功能」,似乎只是十多年前 Siri 的「基礎操作」。
但 Siri 的實際體驗,已經在 AI 大模型爆炸式發展的當下,被拉開了不小差距。
智能助手,是對人的被動模仿,有問必答,有求必應。
而 AI 終端,則是對人的主動接近。根據用户的個人習慣、喜愛偏好,總結以往、推理以後,在不同的時間地點給予你最合適的建議和答案,並且能夠不斷地學習優化,成為「私人專屬」。
▲ 圖片來自:x.com
從整體上看,蘋果的遲到只是相對的晚,因為 AI 手機,還處於發展的早期階段。
的確,大部分國產品牌已經在 AI 終端的階段發力,功能大體相同,特長各有側重,但各家大模型的可用性只能算達到及格線,除了像 OPPO 相冊的 AI 消除、三星通話的實時翻譯、小愛同學的 AI 通話等細分功能,大部分的體驗目前還是與獨立的 AI 應用有些差距。
這當中,除了廠家的技術突破,也和 App 開放的接口有關,比如不支持微信語音通話摘要的模型,在日常生活中,就少了一大塊的應用空間。
因此,大模型和系統、App 的整合,以及對全新交互方式的探索,還有很長的路要走。在此之前,AI 功能還沒能達到影響消費者購機決策的程度。
在 AI 上機的元年,Siri 的目標是和其他 AI 助手抹平這半年多的差距;而作為蘋果佈局未來的重要部分,我們更期待 6 月份的 Siri,會帶來怎樣的「One more thing」。
資料來源:愛範兒(ifanr)