拾象 2025 AI Best Ideas:20大關(guān)鍵預(yù)測

1 評論 690 瀏覽 0 收藏 22 分鐘

隨著人工智能領(lǐng)域的快速發(fā)展,預(yù)測未來趨勢對于企業(yè)和投資者來說至關(guān)重要。拾象投研團(tuán)隊(duì)在其「2025 AI Best Ideas」中提出了20大關(guān)鍵預(yù)測,涵蓋了從模型和云格局的改變、Agent的發(fā)展、多模態(tài)智能的突破,到AI在科學(xué)領(lǐng)域的應(yīng)用等多個方面。這些預(yù)測不僅基于對當(dāng)前技術(shù)進(jìn)展的深入分析,還提供了對未來市場動態(tài)的洞察。

預(yù)測新一年趨勢是拾象投研團(tuán)隊(duì)的傳統(tǒng):厘清關(guān)鍵問題、找到研究主線才能在動態(tài)變化的世界里增強(qiáng)確定性。

2024 年, LLM 競賽關(guān)鍵詞是大基建:LLM 競賽格局基本確定,下半年,隨著 Sonnet 3.5 ?驚艷的 coding 能力、 o1 模型以及 RL 新范式的接連出現(xiàn),LLM 不再是單一的基建競賽,Coding 和 Agent 成為最大的主題。

2025 年,LLM 會在哪些方面上獲得突破?從研究和投資配置的角度,最值得 bet 的關(guān)鍵方向有哪些?作為拾象投研團(tuán)隊(duì) 「2025 AI Best Ideas」 特別策劃,我們既預(yù)測趨勢,也提出關(guān)鍵問題與解題思路,希望能為市場和投資者帶來啟發(fā)。

在拾象 2025 AI best ideas 發(fā)布之外,我們還計(jì)劃在下周組織一場 「2025 AI Best Ideas」 線上討論會,圍繞 2025 AI potential winners & losers、最值得關(guān)注的關(guān)鍵 AI 趨勢碰撞思考與靈感。如果您有興趣參與我們的線上閉門討論,請點(diǎn)擊鏈接參與報(bào)名(備注:因活動名額有限,我們會結(jié)合問卷回答進(jìn)行定向邀請參與)

一、微軟轉(zhuǎn)投 Anthropic,模型和云的格局徹底改變

微軟和 OpenAI 的關(guān)系緊張已不是秘密,也許是 OpenAI 的公司架構(gòu),以及和微軟的結(jié)盟方式太不同尋常,讓多方利益制衡而緊繃的弦終會有斷的一天。作為對照,Anthropic 和 Amazon 的關(guān)系就更開放、健康。Anthropic 也已和三大云中的兩朵云(AWS、GCP)都達(dá)成了合作。

2025 年 OpenAI 會變成盈利組織,微軟也很有可能會投資 Anthropic,這將徹底改變模型和云的格局——Anthropic 會與 Azure 合作,OpenAI 也因?yàn)榻K結(jié)了和微軟的獨(dú)家關(guān)系,而與其他云合作。最終所有模型會在所有云上,所有云也會支持和投資所有模型。

當(dāng)然這個格局變化還充滿不確定,但至少,Anthropic 會在這次震蕩中獲益。

二、Google 手握幾張王牌逆轉(zhuǎn)頹勢,成為“最領(lǐng)先的追隨者”

Google 在 LLM 訓(xùn)練進(jìn)展上一直落后于 OpenAI 和 Anthropic,從 transformer 和 RL 的提出者變成了一個 AI 追隨者,但 Google 是“最領(lǐng)先的追隨者”,等待 OAI 和 Anthropic 破風(fēng),再投入資源趕上。目前 Google 在模型、 Agent 進(jìn)展上和前兩名縮短了差距,Q4 發(fā)布的一系列 AI 產(chǎn)品也有很好的口碑。

另外,Google 手上有幾張王牌:

? TPU 代表著無限算力資源,

? Andorid/Chrome 代表著最強(qiáng)的分發(fā)渠道,

? Deepmind 代表全球最高 AI 人才密度,

從現(xiàn)實(shí)進(jìn)展上:

? RL 是 Google 的看家本領(lǐng),并且 Agent 進(jìn)展很快,今年 9 月發(fā)布的 Agent 白皮書里,Google 就提出了由模型(Language Model)、工具(Extensions, Functions, Data Stores)和編排層(Orchestration Layer)組成的 Agent 框架,

? Gemini flash 2.0 已經(jīng)展現(xiàn)出超越 GPT-4o 的能力水平,

? Deep Research、 NotebookLM、Learn About 等一系列 to C AI 產(chǎn)品的發(fā)布,不僅充分展示了 Gemini 多模態(tài)的優(yōu)勢,也借助更多創(chuàng)新交互獲取用戶,

? 硬件平臺儲備:在 Meta 眼鏡之后,Google 也有希望在今年發(fā)布 Google glass 2,成為新一代消費(fèi)級平臺的重要力量。

目前市場主要擔(dān)心的是 Google 最關(guān)鍵的搜索被顛覆,從實(shí)際情況來看,Meta、Amazon、ChatGPT、Perplexity 都在搶 Google 的搜索市場,而 ChatGPT 和 Perpelxity 開始廣告探索后同樣會給 Google 帶來影響。

三、下一代 Mega 7 ?已有雛形,OS 才是最高護(hù)城河,模型公司進(jìn)入 Agent OS之爭,Agent 是 LLM OS 上的 App

Satya 最近在公開采訪中明確表示下一代 Mega 7 雛型已經(jīng)出現(xiàn),會圍繞 OpenAI、Anthropic 等 LLM-players 中間產(chǎn)生。

今天主流模型廠商之間的競爭是 80s Windows/DOS 戰(zhàn)爭的重演,本質(zhì)上是在圍繞開發(fā)者心智份額、生態(tài)系統(tǒng)、專有標(biāo)準(zhǔn)和 API 的之間的競爭。微軟的商業(yè)生態(tài)是在 Windows 根基之上建立的,OS 是微軟安身立命之本,對于今天的模型廠商來說,擁有 OS 才是最高的護(hù)城河。

在所有模型廠商中 Anthropic 構(gòu)建 OS 的決心要更明顯、更強(qiáng),從 computer use 到 MCP,持續(xù)嘗試搭建數(shù)據(jù)和工具的連接層,MCP 就是這個時代的 TCP/IP。我們預(yù)計(jì)在 Agent 大爆發(fā)后,其他 LLM 供應(yīng)商大概率也要推各自的協(xié)議。

四、Agent 是新軟件,是 2025 年投資核心中的核心。Agent 整體會漸進(jìn)式演進(jìn),Coding Agent 最先落地。

Andrej Karpathy 在 2017 年提出的 Software 2.0 設(shè)想就是今天的 Agents。軟件的本質(zhì)是對人類行為、workflow 的數(shù)字化映射和自動化,當(dāng)模型/Agent 有了 tool use 的能力之后就可以實(shí)現(xiàn)從 1.0 rule-based 到動態(tài)編排軟件 2.0。

Perplexity 是模型信息處理能力的集中體現(xiàn),“下一個 Perplexity會”沿著 Agent、模型 tool use 能力這條線誕生,OpenAI 前 CTO Mira 的新公司將會是 2025 年絕對的明星 deal。

和 LLM 一樣,Agents 的實(shí)現(xiàn)本身也是漸進(jìn)式的,2024 年下半年在 AI Coding 的突破是我們從軟件時代走向 agent 時代的關(guān)鍵,AI agent 也會最先在 coding agent 落地,而不是 day 1 就實(shí)現(xiàn) general agent:因?yàn)?coding 環(huán)境足夠清晰,商業(yè)價值和天花板都極高。

五、Task automation 成為關(guān)鍵詞,long horizon task 成功率是衡量 Agent 能力的核心指標(biāo)

今天 Agent 定義尚不明確,但我們認(rèn)為從實(shí)際落地場景出發(fā),應(yīng)該關(guān)注 task automation 的成功率。

目前的 Agent 還只是初級 Agent,通過編排組合把重復(fù)性高,但又需要一定靈活性的任務(wù)自動化,如客服、售前、游戲測試等,這類 Agent 需要深入的業(yè)務(wù)理解和快速迭代的 engineer 能力,發(fā)展迅速。

能力更強(qiáng)的 Agent 一定不再是 LLM calling 的組合,而是更自主、更主動,能完成更多步驟的復(fù)雜任務(wù)。這類 Agent 需要強(qiáng)大的 reasoning 能力,long horizon task 處理能力,還要能深入理解 large context base,也是模型公司投入的重點(diǎn)。

六、Context layer 成為 Agent 的秘密武器:數(shù)據(jù)、推理、行動三元素重新組織的 context 是 Agent 落地基礎(chǔ)設(shè)施。

而為了讓 Agents 更好、更主動得完成多步驟復(fù)雜任務(wù),簡單的 RAG 已經(jīng)無法滿足需求,context 會成為這個場景下優(yōu)先級最高的 infra 能力。如何獲取企業(yè) context,并更好得構(gòu)建 context layer 的能力會成為 AI 應(yīng)用或數(shù)據(jù)公司競爭的關(guān)鍵。

二級市場上, Palantir、Snowflake 都屬于很明確的 context layer 相關(guān)受益者。一級市場上,頭部公司圍繞也已經(jīng)圍繞 context 需求進(jìn)行積極投入,比如 Perplexity 最新收購的 ?Carbon 可以幫助 Perplexity 實(shí)現(xiàn)和 Google Docs、Slack、Notion 等生產(chǎn)力工具的數(shù)據(jù)連接。

Palantir 的 Ontology 層可以被視為一個企業(yè)的“數(shù)字分身(digital twin)”。每一個 ontology 對象都代表了一條明確了輸入和輸出的邏輯

七、訓(xùn)練靠后,推理向前,ASIC 敘事逐漸減弱,NV 的算力份額和領(lǐng)導(dǎo)者地位依然穩(wěn)固,市值將達(dá)到 4 萬億?

以 o1 為起點(diǎn),由于模型推理能力的增強(qiáng),以及軟件公司用 LLM 開發(fā)新產(chǎn)品或進(jìn)行自我改造的積極性提升,推理需求指數(shù)級增長讓今年下半年以來 CSP ASIC 顯著受益,CSP 離下游需要推理的客戶群體更近,Amazon、Google、微軟等大廠都在通過自有芯片研減少對 GPU 的依賴。

2025 年 Inference 作為硬件板塊的核心命題不會改變,考慮到整個算力市場需求比預(yù)期要更大,CSP ASIC 敘事會在明年逐漸走弱,而 NVDA 依靠 GB200 在 TCO/性能仍會在算力市場維持自身的領(lǐng)導(dǎo)者地位,相比之下 AMD 丟失的市場份額可能會更明顯。

八、Pre-training 、Post training、o3 融合一體化,large scale RL成為關(guān)鍵 bet

O 系列開始,inference time compute 的思路讓 post training 的重要性提高了很多,可提升的空間和消耗的算力層面都可能比 pretrain 更重要。

在這個趨勢下,post-training 和 pre-training 的界線會越來越模糊,post-training 會消耗更大的算力、解鎖更多能力,pre-training 會漸進(jìn)式地用 RL 來漸近找到更好的 data recipe。類似從 AlphaGo 到 AlphaZero 那樣,模型能夠逐漸離開一部分人類數(shù)據(jù),用合成數(shù)據(jù)來得到更多數(shù)據(jù)分布外的高質(zhì)量數(shù)據(jù),解鎖更高天花板的智能。

九、合成數(shù)據(jù)實(shí)現(xiàn)技術(shù)突破,規(guī)?;暮铣蓴?shù)據(jù)能減緩數(shù)據(jù)撞墻焦慮

改寫、編排現(xiàn)有的數(shù)據(jù)雖然能提升數(shù)據(jù)質(zhì)量,但不能提供增量數(shù)據(jù)和新知識。如何規(guī)?;孬@取合成數(shù)據(jù)是技術(shù)上重要的難點(diǎn),也是我們期待的突破點(diǎn)。去年這個突破沒有實(shí)現(xiàn),我們預(yù)測今年能夠取得進(jìn)展,因?yàn)?pre train 的數(shù)據(jù)瓶頸今年愈發(fā)緊迫。

十、o3 驗(yàn)證了 reasoning scaling law,但商業(yè)化落地遇到瓶頸

o3 在 ARC-AGI 和 Frontier Math 涌現(xiàn)式的能力突破定義了真正優(yōu)秀的推理能力,這讓我們對 o 系列的成長上限有更強(qiáng)的信心:o3 帶來了 reasoning scaling law,強(qiáng)推理能力正是解鎖 agent 最必要的能力。2025 年,模型每 3 個月就會實(shí)現(xiàn)過去 1 年的能力進(jìn)步。

Source:ARC-AGI

但 o1 的商業(yè)化確定性和前幾代模型相比要更低,因?yàn)閺?qiáng)推理并不是大眾用戶的需求,只有少數(shù)用戶對這樣的高生產(chǎn)力、復(fù)雜推理問題有需求。因此現(xiàn)在 ChatGPT 產(chǎn)品中 o1 的使用率也不到 5%。同時 o1 query 的定價也很貴,所以需要 200 美金甚至 2000 美金/月的價格來支持更大的 inference time compute 需求。

十一、Chatbot 競爭翻篇,開始全新 AI產(chǎn)品形態(tài)競爭?

Chatbot 的競爭在 2024 年結(jié)束了,2025 年 各模型公司要在全新的產(chǎn)品形態(tài)上競賽。Chatbot 仍將是包容性最強(qiáng),用戶受眾最廣的前端交互,但 computer use、coding agent、artifacts 等更復(fù)雜,更跨軟件,更能捕捉用戶行為數(shù)據(jù)的交互會成為新的重點(diǎn)。

十二、Memory 和 Online learning 問題在 25 年得到解決,LLM 更加主動和個性化

和推薦算法比,LLM 的缺陷是不能實(shí)時更新 weights,所以模型無法千人千面。Memory 是 AI labs 和 Agent 公司花了很多精力解決的問題,我們認(rèn)為 Memory 會在 2025 年有不錯的解決方案,onling learning 也能有一定突破,讓 LLM 和 Agent 真的做到更主動,更懂用戶。

十三、多模態(tài)智能得到突破,visual reasoning 涌現(xiàn),用戶和 AI 交互可能性被拓寬,出現(xiàn)AI+IP 爆款

過去兩年多模態(tài)智能能力發(fā)展不如語言,但 2025 年多模態(tài)智能會得到更多投入。視覺推理和 Scaling Law 的涌現(xiàn)現(xiàn)象成為重要研究方向。尤其是 Google、Meta、Tesla 等大企業(yè),有海量視覺數(shù)據(jù),有處理視覺數(shù)據(jù)的完整 infra,也有更明確的多模態(tài)應(yīng)用場景,相比 AI labs 會更重視多模態(tài)的研究發(fā)展。

雖然我們在 2024 年的預(yù)測中提到類 Character.ai 賽道會收斂在今年得到驗(yàn)證,但 Character.ai 代表的底層需求不變。經(jīng)典 IP 長盛不衰、Jellycat 的爆火本質(zhì)上是“陪伴”。AI 時代的 Her 不是 chatbot,更有可能從經(jīng)典 IP 嫁接而生:AI,尤其是多模態(tài)智能會讓人類和已有 IP 的互動變得更真實(shí)、絲滑,例如迪士尼、任天堂等相關(guān)公司也會利用多模態(tài)推動新應(yīng)用和經(jīng)典 IP 喚新。

十四、ChatGPT 和 Perplexity 跑通廣告變現(xiàn)模式,廣告超越訂閱模式成為主流

因?yàn)槊嫦蛏a(chǎn)力場景,LLM startups 一開始通過訂閱模式嘗試商業(yè)化,但訂閱的增長曲線有限:ChatGPT 的 MAU 預(yù)計(jì)已經(jīng)超過 5 億,年收入約 40 億美金,平均一個月活用戶只有~8 美元/年收入,而 Google、Meta 每個月活用戶 ARPU 都價值100美金起。訂閱無法支撐 AI 超級應(yīng)用,廣告還是主流商業(yè)化方向。

從去年下半年開始 perplexity 和 OpenAI 都已經(jīng)透露出試水廣告,通過問答的形式直連商品、服務(wù)搜索,進(jìn)一步有可能重組視頻、電商、工作、酒旅、住房等供應(yīng)鏈。

十五、自動駕駛到達(dá)商業(yè)化拐點(diǎn):Waymo 開始蠶食 Uber 市場份額,Waymo 可能會在 2025 年 IPO ?

Waymo 在 2024 年 8 月占 SF 網(wǎng)約車份額為 5%,到 11 月訂單金額市占率快速上升超過20%,且出現(xiàn)一定網(wǎng)絡(luò)效應(yīng),到 12月初 Waymo 在全美已經(jīng)實(shí)現(xiàn)了17.5 萬次/周的付費(fèi)出行。隨著監(jiān)管放松 Waymo 的規(guī)模效應(yīng)還會加速。

十六、AI 領(lǐng)域 M&A 活躍:AI 應(yīng)用、Coding 領(lǐng)域出現(xiàn)大的收購,中小 GPU 云會被整合

2025 年,AI 領(lǐng)域的投資并購會繼續(xù)活躍,不過主題從大廠收購 foundation model 公司轉(zhuǎn)變?yōu)橹写笮凸臼召?AI native 應(yīng)用,帶來 M&A 的有 4 個角度的因素:

? 硬件領(lǐng)域,2025 年 NV B 系列正式投入使用后,GPU 云領(lǐng)域的成本和價格競爭會進(jìn)一步加劇,很多中小 GPU 云會破產(chǎn),對于頭部公司而言是低價收購資產(chǎn)的好時機(jī);

? SaaS 領(lǐng)域過去圍繞 Vertial SaaS 的 buy-and-run 會在 vertical AI 上重演,尤其 Sales、HR、Legal、Healthcare ?等垂直領(lǐng)域會出現(xiàn) AI start-ups 被大公司收購的情況;

? AI 搜索、AI Coding、視頻生成等領(lǐng)域作為 LLM 領(lǐng)域競爭的主線,大公司尤為重視,與此同時 Starups 估值增長過快,可能會先出現(xiàn)公司業(yè)務(wù)發(fā)展跟不上估值 hype,在這種情況下,big-techs 進(jìn)行收并購可能帶來 win-win ;

? 頭部 Startups 為強(qiáng)化自身競爭力圍繞技術(shù)棧、場景進(jìn)行收購。

十七、電力短缺持續(xù),核電重啟是明確趨勢 ,有機(jī)會出現(xiàn) 10x 股公司

不僅美國本土,超大計(jì)算集群、再工業(yè)化帶來的電力短缺還在持續(xù),全球范圍內(nèi)電力需求到 2050 年會增加 ?1/3 到 3/4。核電的新建或重啟是全球范圍內(nèi)確定性趨勢,但供給端還沒有做好相關(guān)準(zhǔn)備,原料短缺、地緣政治的擾動等因素給整個產(chǎn)業(yè)鏈上的資產(chǎn)帶來價值稀缺性。

十八、AI for science 發(fā)展迅速,各個科學(xué)領(lǐng)域有自己的 foundation model

生命科學(xué)、材料、氣象和工業(yè)仿真等各個科學(xué)領(lǐng)域已經(jīng)涌現(xiàn)出各自的 foundation model。與 LLM 不同,AI4S 領(lǐng)域不存在數(shù)據(jù)墻問題,在實(shí)踐中還可以通過第一性原理模擬生成無限的高質(zhì)量合成數(shù)據(jù),這一特性會讓 AI4S 各個領(lǐng)域的 foundation model 涌現(xiàn),且模型能力迭代速度極快。??????

十九、AI 技術(shù)紅利大部分流入大公司,Mega 9 強(qiáng)者恒強(qiáng)

Mega 9 公司掌握著 AI 的關(guān)鍵資產(chǎn):云、算力、分發(fā)渠道。任何企業(yè)、個人買單 AI 的價值,他們都有機(jī)會“收稅”。隨著 AI 在 2025 年真正走向 massive adoption ,這些公司可以持續(xù)躺在 AI 富礦上賺取收益。

二十、美股 2025 Q1 業(yè)績后因?yàn)?AI 進(jìn)展緩慢大調(diào)整,但又會在年底前破新高

以 Agentforce 為代表的 SaaS 公司 AI 產(chǎn)品的表現(xiàn)推高了美股對于 AI 應(yīng)用層的 hype,雖然企業(yè)側(cè)投入和推廣 AI 產(chǎn)品相較于 1 年前更加激進(jìn),但作為投資者需要對企業(yè) AI 業(yè)務(wù)落地和盈利情況保持理性和警惕,一旦實(shí)際業(yè)績兌現(xiàn)略低于市場對 AI 故事的預(yù)期,就會出現(xiàn)大的回調(diào),我們預(yù)計(jì) 2025 H1 大概率會出現(xiàn)這一情況。到 2025H2,隨著 LLM 能力提升,尤其是 agent 在 tool use 和長距離復(fù)雜任務(wù)上的進(jìn)步,AI 會重新帶來股價新高,重演 2024 H2 的情況。

本文由人人都是產(chǎn)品經(jīng)理作者【海外獨(dú)角獸】,微信公眾號:【海外獨(dú)角獸】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于 CC0 協(xié)議。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. AI發(fā)展真快呀,2025年這么多新趨勢,未來科技生活太期待了!

    來自遼寧 回復(fù)