蘋果搭載大模型的 Siri,可能和你想的不太一樣
在外界看來,蘋果探索 AI 的速度一直較為緩慢,不過最近據(jù)報道,蘋果正與百度商討關(guān)于國內(nèi)市場的 iPhone 以及其他設(shè)備中整合生成式 AI 的業(yè)務(wù),未來的 iOS 18,或許也會搭載 AI 功能了。
蘋果的 AI,雖遲但到。
根據(jù)華爾街日報消息,蘋果正與百度商討,關(guān)于國內(nèi)市場的 iPhone 以及其他設(shè)備中整合生成式 AI 的業(yè)務(wù)。
盡管目前還沒有得到官方的確認(rèn),不過有兩件事至此可以確定:
- iPhone 16、iOS 18 和 MacOS 將會搭載 AI功能
- iPhone 上的大模型,在國內(nèi)外將由不同的廠商提供
比起早已搭載 AI 助手的國內(nèi)品牌,蘋果這回又不出意外地晚了大半年,慢人一步似乎一直都是蘋果的標(biāo)簽,只是它們總能在穩(wěn)步前行中帶來一些驚喜。
然而,AI 大模型的進(jìn)步速度正以周、甚至以天計數(shù),蘋果的遲到,究竟是再一次后發(fā)先至,還是在新時代掉隊的開始。
一、略顯妥協(xié)的方案,先上車才是重點(diǎn)
上個月的最后一天,蘋果用 12 分鐘的短會宣布:放棄造車,All in AI,汽車團(tuán)隊的眾多成員將被調(diào)往 AI 部門。
蟄伏十年的泰坦計劃,倒在了入局新能源汽車的最后一年,對于未來百家爭鳴的汽車市場而言,會有些許遺憾,但從一家科技公司長遠(yuǎn)的發(fā)展來看,這莫過于一個長遠(yuǎn)且正確的選擇。
AI 是基礎(chǔ)性的應(yīng)用,在所有大公司都主動或被動擁抱 AI 的當(dāng)下,蘋果的「斷舍離」順應(yīng)著時代。
而如何擁抱 AI?怎樣的人工智能才能在逐漸被瓜分的市場里占得一席之地?是它們最先要解決的難題。
針對國外市場,蘋果正在與 Google 積極談判,以便在 iOS 18 中加入 AI 大模型,實現(xiàn)其他品牌早就有的 AI 功能。
雖然目前「雙方尚未決定人工智能協(xié)議的條款或品牌,也沒有最終確定如何實施」,但在眾多備選合作商(OpenAI 和 Anthropic)中,Google 和 Gemini,應(yīng)該是最適合蘋果和 iPhone 的那一個。
今年二月發(fā)售的三星 Galaxy S24 系列機(jī)型以 AI 功能出圈,通話翻譯、創(chuàng)意寫作等功能趕上了國內(nèi)平均水平,即圈即搜縮短了搜索路徑,也極有可能成為今后 AI 手機(jī)的主要發(fā)展路線。
海外版的 S24 系列,就是通過大模型 Gemini 支持,才得以完成上述功能。
從經(jīng)驗講,Google 已在全球出貨量最高的旗艦機(jī)型上,完成了初步嘗試,相比于在 PC 或 Web 端大火的廠商,它們更知道手機(jī)大模型的操作習(xí)慣、使用場景、適配應(yīng)用應(yīng)該怎么做。
再者,Google 本身也更渴望得到蘋果的項目。
根據(jù)國際數(shù)據(jù)公司 IDC 的統(tǒng)計,三星在 2023 年全球智能手機(jī)市場占有率達(dá)到了 19.4%,蘋果則成功登頂達(dá)到了 20.1%。
若是拿下蘋果,Gemini 在全球范圍內(nèi)手機(jī)終端的搭載率將達(dá)到 4 成,這對于一家面臨激烈競爭的 AI 大模型公司,極為利好。
在夢里笑醒的除了 Google,還有蘋果。
和其他強(qiáng)調(diào)「自研」的廠商不同,蘋果在一開始就以合作來達(dá)成 AI 上機(jī),也有其自身的考量。
首先,在本身起步晚進(jìn)度慢的現(xiàn)狀下,「拿來主義」是快速爭奪市場的妙手,和 Google 的合作,在減小研發(fā)成本、收取高額坑位費(fèi)的同時,還能緩解兩家公司目前所面臨的監(jiān)管壓力。
其次,AIGC 的技術(shù)很好,但在落地時卻因道德、隱私等方面的缺陷被大量詬病,交給成熟的第三方,特別是已經(jīng)在三星機(jī)型上試水成功的 Google,省力省心,且減小了輿論和責(zé)任風(fēng)險。
這當(dāng)中的另一道坎,是技術(shù)本地化。每個國家和地區(qū)對 AI 大模型的監(jiān)管和相關(guān)法規(guī)都有著不同的要求,合法合規(guī)的落地才是爭奪市場和發(fā)展技術(shù)的前提,因此才催生出了「國內(nèi)+國際」雙管齊下的路線。
按照三星與百度初見成效的合作,蘋果才會選擇這條已經(jīng)被「驗證為真」的路線。
國行版三星 S24 系列上的 AI 功能,實際上有多個廠家旗下的技術(shù)組成:即圈即搜功能由百度和京東提供;智能修圖由美圖秀秀的大模型 MiracleVision 完成;文章摘要、智能寫作則采用了百度的文心一言大模型。
蘋果是否也會與多家廠商合作,還要等待后續(xù)的消息,不過和百度的合作,已然板上釘釘。
最后,蘋果要做的并非一個智能語音助手,而是整套 AI 終端。但根據(jù) Macrumor 的爆料,以目前的自研進(jìn)度和技術(shù)成果,蘋果的大模型還遠(yuǎn)達(dá)不到 Google、OpenAI 等公司水準(zhǔn)。
與其趕鴨子上架一個智能聊天機(jī)器人,不如先拿成熟的方案做過渡,為自研大模型爭取更多的研究時間和進(jìn)步空間。
二、當(dāng)下的市場很重要,但未來的核心技術(shù)才是根本
合作,是蘋果 AI 全球化的第一步,而最終的目標(biāo),是為了擁有全路自研的 AI 大模型。
這是一項燒錢且耗神的工程,別說退步,稍微進(jìn)步的慢一點(diǎn),都有可能在下周被淘汰。一個有競爭力的大模型,往往代表著今后在市場上的主導(dǎo)權(quán)與議價權(quán)。
庫克認(rèn)為:
生成式 AI 方面開辟新天地,我們相信這項技術(shù)可以重新定義未來。
而蘋果對于大模型的探索,其實一直都在日程表上。
本月 15 日,蘋果工程師悄悄發(fā)布的一篇研究論文,當(dāng)中詳細(xì)介紹了一種名為 MM1 的新型生成式 AI 模型的開發(fā)過程。
MM1 是一個具有最高 30B(300 億)參數(shù)的多模態(tài) LLM 系列,這是蘋果在多模態(tài)大模型的最新研究成果。
總的來說,蘋果的自研模型在測試效果上,與 Gemini 和 GPT4V 還有一定的差距,也沒有在生成結(jié)果上表現(xiàn)出如 Sora 一樣驚人的效果,更沒有探索出一條全新的技術(shù)路線。
但是,它能通過控制各種數(shù)據(jù)變量,在對比中找出影響模型生成效果最關(guān)鍵的那幾個因素,簡單來說,它天生不強(qiáng)大,不過善于觀察、實踐和總結(jié),在一次次的嘗試中,也能取得不錯的成績。
MM1 由密集模型和 MoE(混合專家)變體組成,當(dāng)指令進(jìn)入 MoE 后,究竟應(yīng)該去「東市買駿馬」還是「西市買鞍韉」,都會被這個指令中心安排的明明白白的。
問題被細(xì)化和分類的同時,也提升了計算效率,節(jié)約了運(yùn)行能耗。
這篇論文,代表蘋果在 AI 領(lǐng)域探索的階段性成果,雖然 MM1 沒有顛覆行業(yè)更沒有驚艷世界,但在晦澀難懂的專業(yè)術(shù)語里還是能看出它們的進(jìn)步:
我們的工作模式一直是先做工作,然后再談?wù)摴ぷ鳎皇窃谧约好媲俺鲅圆贿d?!?Tim Cook
沒有透露過多技術(shù)細(xì)節(jié)的蘋果,其實還在盤算著另一步棋:端側(cè)大模型。
早在去年底,蘋果在名為《閃存中的大型語言模型:在有限內(nèi)存下高效的大型語言模型推理》的論文中,就提出了大模型落地 iPhone 等「內(nèi)存有限」設(shè)備的方法。
研究人員稱,他們通過最新的閃存技術(shù),在 iPhone 和其他內(nèi)存受限的設(shè)備上成功部署了 LLM(大語言模型)。
這個項目被稱為 Apple GPT,最大的作用是將 LLM 數(shù)據(jù)直接存儲在閃存中,比如整合在 Siri 內(nèi)部,相較于傳統(tǒng)的運(yùn)行方法,新技術(shù)使 CPU 和 GPU 的推理速度,最大提升了 5 倍和 25 倍。
研究人員稱,開發(fā)的這些效率型方法使得 AI 模型能夠在 iPhone 當(dāng)前內(nèi)存的兩倍范圍內(nèi)運(yùn)行。
也就是說,側(cè)端搭載大模型有了可行性,通過減少閃存?zhèn)鬏數(shù)臄?shù)據(jù)量、提高每次傳輸?shù)耐掏铝?,?LLM 的數(shù)據(jù)直接儲存在閃存中。
三、撇開技術(shù),Siri 是我們和 AI 的橋梁
進(jìn)度緩,消息少,布局大。這是蘋果探索 AI 的概況。
每每看到蘋果的某項技術(shù)落后于市場和競爭對手,都會給人一種「起步太晚」的錯覺,實際上在翻看相關(guān)新聞和專利文件的時候,又會發(fā)現(xiàn)它往往是最早布局的那一批,甚至那一個。
截止到 2023 年,蘋果總共收購了 32 家 AI 公司,位列科技巨頭中收購榜第一。
而收購 Siri,應(yīng)該可以算作蘋果入局 AI 的開端。
2010 年的喬布斯打給「Siri 之父」Dag Kittlaus 的一通電話,讓 Siri 以超過 2 億美元的身價,加入蘋果,走上 iPhone。
Siri 最初的定位是一個快速準(zhǔn)確獲取信息的助手,或是處理復(fù)雜任務(wù)的助理。
在最原始的版本里,Siri 可以與 42 個網(wǎng)絡(luò)服務(wù)相連接——從餐館點(diǎn)評網(wǎng)站 Yelp、售票網(wǎng)站 StubHub,到電影點(diǎn)評網(wǎng)站 Rotten Tomatoes 和數(shù)學(xué)計算網(wǎng)站 Wolfram Alpha。
根據(jù)提示,Siri 會將各種信息整合,并回復(fù)用戶。無需打開其他的應(yīng)用軟件,Siri 就可以幫助用戶買票、訂餐館或叫出租車。
這些如今被 AI Pin 和其他智慧助手大力宣揚(yáng)的「AI 功能」,似乎只是十多年前 Siri 的「基礎(chǔ)操作」。
但 Siri 的實際體驗,已經(jīng)在 AI 大模型爆炸式發(fā)展的當(dāng)下,被拉開了不小差距。
智能助手,是對人的被動模仿,有問必答,有求必應(yīng)。
而 AI 終端,則是對人的主動接近。根據(jù)用戶的個人習(xí)慣、喜愛偏好,總結(jié)以往、推理以后,在不同的時間地點(diǎn)給予你最合適的建議和答案,并且能夠不斷地學(xué)習(xí)優(yōu)化,成為「私人專屬」。
從整體上看,蘋果的遲到只是相對的晚,因為 AI 手機(jī),還處于發(fā)展的早期階段。
的確,大部分國產(chǎn)品牌已經(jīng)在 AI 終端的階段發(fā)力,功能大體相同,特長各有側(cè)重。
但各家大模型的可用性只能算達(dá)到及格線,除了像 OPPO 相冊的 AI 消除、三星通話的實時翻譯、小愛同學(xué)的 AI 通話等細(xì)分功能,大部分的體驗?zāi)壳斑€是與獨(dú)立的 AI 應(yīng)用有些差距。
這當(dāng)中,除了廠家的技術(shù)突破,也和 App 開放的接口有關(guān),比如不支持微信語音通話摘要的模型,在日常生活中,就少了一大塊的應(yīng)用空間。
因此,大模型和系統(tǒng)、App 的整合,以及對全新交互方式的探索,還有很長的路要走。在此之前,AI 功能還沒能達(dá)到影響消費(fèi)者購機(jī)決策的程度。
在 AI 上機(jī)的元年,Siri 的目標(biāo)是和其他 AI 助手抹平這半年多的差距;而作為蘋果布局未來的重要部分,我們更期待 6 月份的 Siri,會帶來怎樣的「One more thing」。
作者:肖凡博
來源公眾號:愛范兒(ID:ifanr);連接熱愛,創(chuàng)造不同。
本文由人人都是產(chǎn)品經(jīng)理合作媒體 @愛范兒 授權(quán)發(fā)布,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自 Unsplash,基于CC0協(xié)議。
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。
相信蘋果,雖遲但到。根據(jù)以往的經(jīng)驗,蘋果經(jīng)常是雖然不是第一家出的,但會是最好用的風(fēng)格,期待這一次也不會意外。