我在硅谷看AI:Deepseek狂飆背后,2025年15條AI關(guān)鍵投資啟示

0 評論 506 瀏覽 3 收藏 92 分鐘

生成式AI正在重塑全球科技與商業(yè)格局,2025年成為這一變革的關(guān)鍵節(jié)點。從DeepSeek的崛起引發(fā)全球關(guān)注,到AI Agent商業(yè)化元年的開啟,再到基礎(chǔ)設(shè)施投資的爆發(fā)與低成本訓(xùn)練的興起,AI領(lǐng)域正經(jīng)歷著前所未有的快速發(fā)展。

本文將深入剖析2025年AI行業(yè)的15條關(guān)鍵投資啟示,涵蓋技術(shù)趨勢、應(yīng)用場景、商業(yè)模式以及未來發(fā)展的核心方向,為投資者和從業(yè)者提供前沿洞察,揭示AI技術(shù)如何重塑商業(yè)版圖并催生新的市場機(jī)會。

??

#01 開篇

生成式AI,作為當(dāng)今最具顛覆性的技術(shù)之一,正在引領(lǐng)各行業(yè)進(jìn)入全新的發(fā)展階段。

2025年伊始,圍繞生成式人工智能的競賽愈發(fā)激烈。美國總統(tǒng)特朗普上任第二天,白宮宣布啟動名為“星際之門”(Stargate)的人工智能項目,由美國甲骨文公司、OpenAI與日本軟銀集團(tuán)聯(lián)合出資打造。

1月14日,OpenAI推出了名為Tasks的測試版功能,標(biāo)志著ChatGPT正式邁入AI智能體(AI Agent)階段。春節(jié)期間,中國大模型DeepSeek憑借其推理模型DeepSeek-R1引起了廣泛關(guān)注,該模型以O(shè)penAI十分之一的成本達(dá)到了GPT-o1的同級別表現(xiàn)。同時,DeepSeek在1月26日登頂蘋果App Store和谷歌Play Store全球下載榜首,上線18天內(nèi)下載量突破1600萬。

緊接著,OpenAI繼續(xù)推動創(chuàng)新,發(fā)布動作不斷:1月24日發(fā)布了一款代號為“Operator”的全新AI Agent產(chǎn)品;隨后2月1日推出o3-mini,專注于STEM領(lǐng)域,支持函數(shù)調(diào)用、流式傳輸、結(jié)構(gòu)化輸出和搜索結(jié)合等功能;2月3日又推出面向深度研究領(lǐng)域的智能體產(chǎn)品,進(jìn)一步拓展了其在專業(yè)領(lǐng)域的應(yīng)用。谷歌也不甘示弱,在2月6日凌晨發(fā)布了性能更強(qiáng)的Gemini 2.0系列模型,包括Pro、Flash和Flash-Lite三個版本。

如今,生成式AI正迎來類似的歷史時刻,這不僅是科技革命,更是商業(yè)重塑的契機(jī),我們正站在這一變革的起點。每一次平臺級機(jī)會的背后,都會催生出一批市值百億、千億美金的公司。從互聯(lián)網(wǎng)到移動互聯(lián)網(wǎng),再到云計算和區(qū)塊鏈,每一次基礎(chǔ)設(shè)施的創(chuàng)新都激發(fā)了無數(shù)新的應(yīng)用場景,推動科技巨頭的崛起。

回顧這些歷史周期,我們發(fā)現(xiàn),基礎(chǔ)設(shè)施的完善往往會催生應(yīng)用公司的黃金發(fā)展期。生成式AI作為新型基礎(chǔ)設(shè)施,正處于這一發(fā)展軌道的起點。未來,這些公司將通過創(chuàng)新的商業(yè)模式和智能化產(chǎn)品,重新定義我們的工作和生活方式,迎來屬于自己的千億市值時代。展望2025年,大語言模型將會走向何方?在這份報告中,我們將從行業(yè)變化、技術(shù)進(jìn)展和應(yīng)用趨勢三方面,對大模型的未來發(fā)展進(jìn)行深入前瞻。

#02 AI瘋狂吸金,千億獨角獸冉冉升起

2024年,最為人們印象深刻的,便是生成式AI公司——OpenAI高達(dá)65億美元的融資。這筆融資讓這位生成式AI的弄潮兒估值達(dá)到約1500億美元——一只大型千億獨角獸正在硅谷茁壯成長,而這只是2024年中最具代表性的一個。生成式AI所創(chuàng)造出的“造富神話”,多次讓人們情緒高漲,AI就像一個龐大的“吸金獸”,以颶風(fēng)般的速度吸走了大部分的風(fēng)投資金。

涌入AI賽道的大量資金和頂尖創(chuàng)業(yè)者,正在催生出了一批新晉獨角獸公司。根據(jù)硅兔君復(fù)盤,在過去18個月新增的73家獨角獸中,有28家是AI公司,占到了新增獨角獸的大約三分之一。例如特斯拉創(chuàng)始人埃隆·馬斯克在2023年7月創(chuàng)立的xAI,2024年3月發(fā)布了首款A(yù)I聊天機(jī)器人Grok-1,隨后發(fā)布了Grok-1.5V大模型,其在最新一輪融資中,估值達(dá)到240億美元;Xaira Therapeutics,作為AI+生物技術(shù)領(lǐng)域的公司,其聯(lián)合創(chuàng)始人David Baker在“AI+蛋白質(zhì)”領(lǐng)域頗有造詣,其團(tuán)隊研發(fā)出AI大模型RFdiffusion,用擴(kuò)散模型構(gòu)建的創(chuàng)新型生成式AI系統(tǒng),并且可以按需構(gòu)建AI分子,估值為27億美元;Cognition AI是一家由三位華人創(chuàng)業(yè)者創(chuàng)立的公司,2024年3月,其推出了世界上第一位完全自主的AI軟件工程師,在最新一輪融資后估值達(dá)到20億美元。

制圖:硅兔賽跑,數(shù)據(jù)來源pitchbook

制圖:硅兔賽跑,數(shù)據(jù)來源pitchbook 

這些AI獨角獸的成長速度遠(yuǎn)快于非AI獨角獸,前25%的AI公司在不到2.5年內(nèi)就已經(jīng)達(dá)到獨角獸估值。同時,最大規(guī)模的交易也流向了AI的初創(chuàng)企業(yè)。

另一個趨勢是——融資額正在變大,頭部效應(yīng)更加明顯。根據(jù)第三方數(shù)據(jù)分析機(jī)構(gòu)Pitchbook的數(shù)據(jù),2024年,光是北美的風(fēng)險投資總金額達(dá)到了2164億美金,較2023年增長了28%。其中2024年四季度,北美地區(qū)的融資額達(dá)到了771億美金,創(chuàng)下了2年以來的新高,光是人工智能相關(guān)項目的投融資額達(dá)到了991億美金,占到了總額的45.8%,達(dá)到了歷史最高水平。過去美國最大的10筆風(fēng)險投資交易每年通常占總?cè)谫Y額的9%左右,而自2023年以來,這一比例升至20%。

過去一年,我們在硅谷,這個北美將近50%投融資發(fā)生的地區(qū)以及最能夠代表北美創(chuàng)投發(fā)展的地方,捕捉到最新的一些變化并試圖梳理出最前沿的趨勢:

首先,針對人工智能創(chuàng)投領(lǐng)域,有四大行業(yè)趨勢值得關(guān)注:

  1. 如果說2023年的AI Agent,只是停留在諸如斯坦福小鎮(zhèn)這樣的虛擬世界;2024年,AI Agent的商業(yè)化條件逐漸成熟;2025年則是Agent AI商業(yè)化的元年,資本的關(guān)注和注入加速,會加劇各大科技公司和初創(chuàng)企業(yè)在Agent AI 領(lǐng)域的競爭,推動技術(shù)創(chuàng)新和產(chǎn)業(yè)應(yīng)用的落地。
  2. 一方面圍繞生成式AI基礎(chǔ)設(shè)施的投資規(guī)??涨?,帶動了一系列產(chǎn)業(yè)鏈公司;另一方面,業(yè)界正在嘗試一些低成本、性價比高的做法,減少訓(xùn)練的投入?yún)s能達(dá)到與GPT-4/4o等同的效果;
  3. 專有AI模型正在釋放AI潛力,他們正在解決通用大模型不能解決的問題,逐步具備較高的商業(yè)化潛力。
  4. 生成式界面將迎重大發(fā)展,用戶能夠有更好的互動體驗,將帶來新的商業(yè)模式和市場機(jī)會。

其次,在人工智能的技術(shù)方面,我們總結(jié)了八大趨勢:

  1. 2025年,大模型將更加關(guān)注多模態(tài)的融合與交互,其訓(xùn)練方法正在不斷優(yōu)化;
  2. 一直以來,盡管大模型能力在不斷增強(qiáng),但仍無法解決人工智能的“黑箱”問題。2024年,許多公司陸續(xù)推出了更透明的模型架構(gòu)和解釋工具以緩解“黑箱”帶來的麻煩。2025年,可解釋性工具將進(jìn)一步普及;
  3. 2024年,大模型的長期記憶能力迎來了一系列技術(shù)突破。2025年,隨著多模態(tài)技術(shù)的進(jìn)步,跨模態(tài)記憶融合將在視頻、文本、觸覺和嗅覺數(shù)據(jù)的編碼上取得突破,進(jìn)一步提升模型的記憶能力。
  4. 合成數(shù)據(jù)作為加速大模型訓(xùn)練的方法,將在2025年進(jìn)一步發(fā)揮潛能。
  5. 2025年,隨著更強(qiáng)大的計算資源的普及和優(yōu)化,規(guī)模定律將繼續(xù)提升,這使得更多的中小型企業(yè)可以進(jìn)入AI領(lǐng)域,加速了大模型的普及,效率躍遷曲線下,大模型的成本更低了。
  6. 2025年,強(qiáng)化學(xué)習(xí)(RL)與大語言模型的結(jié)合有望進(jìn)一步提升模型的泛化能力,并使得從預(yù)訓(xùn)練到后訓(xùn)練和推理遷移的轉(zhuǎn)變成為可能。
  7. 隨著AI應(yīng)用場景的多樣化,簡化算法架構(gòu)將成為AI發(fā)展的重要方向。2025年,更多優(yōu)化算法將被用于強(qiáng)化學(xué)習(xí)等領(lǐng)域,以減少計算資源的消耗。
  8. 隨著AI蒸餾技術(shù)的普及,相關(guān)的法律和監(jiān)管框架也需要不斷加強(qiáng),以確保在模型開發(fā)和應(yīng)用過程中不會侵犯知識產(chǎn)權(quán)或數(shù)據(jù)隱私。

另外,在人工智能的應(yīng)用方面,2025年也有了一些新的變化:

  1. 2025年,企業(yè)級AI應(yīng)用迎來深入發(fā)展,越來越多企業(yè)將從人工智能中獲利。AI Agent成為行業(yè)顛覆性力量,生成式AI推動傳統(tǒng)行業(yè)進(jìn)入智能化時代。隨著企業(yè)在生成式AI上盈利,商業(yè)模式轉(zhuǎn)變?yōu)榘垂ぷ鞒晒召M(fèi),取代傳統(tǒng)的SaaS席位收費(fèi)。
  2. 2025年對于AI應(yīng)用來說,下一個重大事件將屬于消費(fèi)。我們期待一個“殺手級”AI消費(fèi)應(yīng)用的誕生。
  3. 在AI應(yīng)用端,企業(yè)不再依賴單一模型,而是會根據(jù)不同的應(yīng)用需求和場景,將不同模型模塊進(jìn)行組合,定制出符合自己業(yè)務(wù)需求的模型。

趨勢一 :2025年,AI Agent元年拉開序幕

人工智能未來學(xué)家雷·庫茲韋爾 (Ray Kurzweil)表示,2025年,我們將開始看到從聊天機(jī)器人和圖像生成器向“代理”系統(tǒng)的轉(zhuǎn)變,這些系統(tǒng)可以自主完成任務(wù),而不僅僅是回答問題。人工智能系統(tǒng)正在從單一的交互模式,走向?qū)iT且相互關(guān)聯(lián)的代理。

AI Agent,也稱為人工智能代理,通常是指能夠感知環(huán)境、進(jìn)行自主理解、決策和執(zhí)行動作的智能體。根據(jù)咨詢公司來覓PEVC的統(tǒng)計,自2024年以來,全球AI Agent賽道的融資金額已突破665億元人民幣。從整體來看,這些資金主要流向了在技術(shù)與市場潛力方面處于領(lǐng)先地位的頭部企業(yè)。

科技巨頭紛紛布局AI Agent,以搶占未來智能交互的制高點。

2024年,OpenAI憑借其強(qiáng)大的技術(shù)實力和廣泛的市場應(yīng)用,官宣65億美元新融資,成為萬億獨角獸,也成為全球AI Agent領(lǐng)域的主要資金流之一。

埃隆·馬斯克創(chuàng)立的xAI,希望將AI Agent與人類深度整合,創(chuàng)建全球首個AI Agent與人類共存的社交平臺,xAI在2024年12月完成60億美元融資,估值達(dá)到了近500億美元。

谷歌也全力推廣商用AI Agent,發(fā)布了全球為數(shù)不多的商用AI Agent市場,為企業(yè)提供一站式開發(fā)、部署和應(yīng)用生態(tài)。微軟在2024年11月的Ignite大會上宣布已建立全球規(guī)模最大的企業(yè)級AI Agent生態(tài)系統(tǒng),企業(yè)用戶可通過Azure AI目錄訪問超過1800個AI模型。

此外,微軟的Copilot Studio平臺已支持用戶創(chuàng)建自主Agent,并正式進(jìn)入預(yù)覽階段。蘋果也在開發(fā)者大會上展示了其最新的AI成果Apple Intelligence。

2025年,OpenAI推出的智能體功能(AI Agent)以及一系列基于生成式AI的智能系統(tǒng),它們開始具備真正的自主學(xué)習(xí)和推理能力,從單一任務(wù)的執(zhí)行者,轉(zhuǎn)變?yōu)槟軌蜻M(jìn)行多任務(wù)處理、復(fù)雜決策和交互的智能體——1月24日,OpenAI發(fā)布了一款代號為“Operator”的全新AI Agent產(chǎn)品,與其他各家Agent相比,它會通過自有的CUA(電腦控制Agent)系統(tǒng)進(jìn)行復(fù)雜的思維鏈反思和步驟規(guī)劃,這可以大大提高其完成任務(wù)的精度和復(fù)雜性。Operator的創(chuàng)新之處在于其成功實現(xiàn)了從認(rèn)知到執(zhí)行的完整閉環(huán)。這一能力的拓展不僅是技術(shù)上的突破,更是AI技術(shù)邁向更高層次發(fā)展的關(guān)鍵一步。

AI Agent不再是單一的輔助工具,而是可以獨立進(jìn)行深度學(xué)習(xí)、理解和推理的智能系統(tǒng),賦能企業(yè)和個人高效完成復(fù)雜任務(wù),推動生產(chǎn)力的大幅提升。2025年,AI智能體的全面普及將不僅改變技術(shù)產(chǎn)業(yè)的格局,還將在各個領(lǐng)域深刻影響人類的生活方式,從而使這一年成為AI Agent真正嶄露頭角的元年。

趨勢二:基礎(chǔ)設(shè)施軍備競賽:投資空前,低成本做法漸成趨勢

一年多以前,基礎(chǔ)大模型制造商OpenAI,在芯片制造商英偉達(dá)生產(chǎn)的25000個最新進(jìn)GPU集群上訓(xùn)練了GPT-4。隨后,馬斯克表示他在一個數(shù)據(jù)中心有100000個GPU,并計劃購買200000個。

頭部公司通過大規(guī)模資金投入,搶占人工智能基礎(chǔ)設(shè)施的制高點,而以英偉達(dá)為代表的硬件廠商也在以前所未有的速度上不斷突破技術(shù)極限。例如,英偉達(dá)的頂級芯片性能相當(dāng)于300部高端iPhone的處理能力。

在這場基礎(chǔ)設(shè)施競爭中,埃隆·馬斯克的X平臺部分業(yè)務(wù)——xAI的“Colossus”訓(xùn)練集群,成為世界上最強(qiáng)大的人工智能訓(xùn)練集群之一。這個集群僅用122天便建成,預(yù)算高達(dá)30億至40億美元,成為人工智能基礎(chǔ)設(shè)施建設(shè)的里程碑。目前,xAI計劃將集群容量翻倍,進(jìn)一步增強(qiáng)處理能力。Meta也在大規(guī)模投資硬件,近期公布了其24000個GPU數(shù)據(jù)中心規(guī)模集群的兩個版本,旨在支持其下一代人工智能模型。

雖然目前GPU集群比傳統(tǒng)數(shù)據(jù)中心小,但對人工智能計算不斷增長的需求將需要大規(guī)模的基礎(chǔ)設(shè)施擴(kuò)展。包括Meta、亞馬遜、Alphabet和微軟在內(nèi)的主要科技公司正在推動對人工智能基礎(chǔ)設(shè)施的空前投資。超大規(guī)模數(shù)據(jù)中心運(yùn)營商預(yù)計2024年資本支出(CapEx)將超過 2000 億美元,到2025年這一數(shù)字預(yù)計將接近2500億美元。盡管并非所有支出都直接與人工智能相關(guān),但很大一部分都分配給了人工智能,并且這個份額在不斷增加。微軟和OpenAI已討論推出一個專門用于人工智能工作負(fù)載的5千兆瓦數(shù)據(jù)中心,可能耗資超過1000億美元,甚至可以買得下一艘最新型核動力航空母艦。

在這場人工智能基礎(chǔ)建設(shè)中受益的,是這個產(chǎn)業(yè)鏈中的組成部分。

第一類就是數(shù)據(jù)中心的托管服務(wù)提供商——也就是向大公司提供數(shù)據(jù)中心租賃容量的公司,他們是數(shù)據(jù)中心市場的重要組成部分。這批數(shù)據(jù)中心的托管服務(wù)提供商如今也在拓展其以人工智能為重點的基礎(chǔ)設(shè)施服務(wù)。例如,超大規(guī)模托管領(lǐng)域的領(lǐng)導(dǎo)者 Equinix 已獲得近 150 億美元的資金用于在美國建設(shè)人工智能數(shù)據(jù)中心,主要為客戶提供基礎(chǔ)設(shè)施,以訓(xùn)練和部署大規(guī)模私有人工智能模型,這些客戶往往是科技行業(yè)以外的財富 500 強(qiáng)公司。

另一類受益者則是人工智能數(shù)據(jù)中心建設(shè)中的輔助產(chǎn)品,例如低功耗CPU、內(nèi)存、存儲系統(tǒng)、網(wǎng)絡(luò)組件以及冷卻和電源管理設(shè)備。冷卻產(chǎn)品供應(yīng)商 Vertiv在2024年7月至9月的三個月內(nèi)實現(xiàn)了19%的同比收入增長,并提高了未來12個月的業(yè)績指引。

第三類則是圍繞數(shù)據(jù)中心能源生產(chǎn)、熱管理和電源管理解決方案的公司。Alphabet董事長在2023年2月表示,與LLM互動可能比標(biāo)準(zhǔn)關(guān)鍵字搜索的花費(fèi)高出10倍。另外,根據(jù)谷歌研究員Urs H?lzle的文章提及,標(biāo)準(zhǔn)Google搜索使用的電力為0.3Wh,這意味著每次LLM互動的耗電量約為3Wh。這個數(shù)字與SemiAnalysis在2023年初對ChatGPT運(yùn)營成本的評估一致,該評估估計ChatGPT每次請求耗電量為2.9Wh,如果每天響應(yīng)1.95億個請求,估計平均每天耗電量為564MWh。

《紐約客》報道稱,ChatGPT每天用電量相當(dāng)于1.7萬個美國家庭的用電量。如果基于當(dāng)前模型和技術(shù),讓每個標(biāo)準(zhǔn)Google搜索都變成 LLM 交互,對 Google總用電量的潛在影響巨大。第三方分析機(jī)構(gòu)SemiAnalysis估計,帶有大模型交互功能的谷歌搜索單次請求的用電量達(dá)到將近9Wh,谷歌每天搜索大約需要90億次,則需要81000MWh。

這一趨勢促使人們對位于數(shù)據(jù)中心設(shè)施附近的核能和能源生產(chǎn)等技術(shù)以及熱管理和電源管理解決方案進(jìn)行投資。

不過,如今科學(xué)家和業(yè)界正在尋找更聰明并且資源密集度更低的方法來解決訓(xùn)練人工智能模型所需要的算力和能源問題。例如通過蒸餾技術(shù),這項技術(shù)的踐行者——DeepSeek,這家國產(chǎn)大模型也給美國硅谷提供了更多低成本的訓(xùn)練參考。

DeepSeek大模型性能在多個方面比肩OpenAI,其中DeepSeek V3,整個訓(xùn)練過程僅用了約2000張二流芯片進(jìn)行訓(xùn)練,官方稱成本僅占用約550萬美元,而Meta的模型則使用了16000個性能最強(qiáng)的一流芯片。并且,DeepSeek-R1通過重新設(shè)計訓(xùn)練流程、以“少量SFT數(shù)據(jù)+多輪強(qiáng)化學(xué)習(xí)”的辦法,在提高了模型準(zhǔn)確性的同時,也顯著降低內(nèi)存占用和計算開銷,每百萬輸出tokens16元,大約是OpenAI o1運(yùn)行成本的三十分之一。

在這樣的競爭壓力下,0penAI推出了其成本更低的o3-mini,比o1-mini便宜63%,比完整的o1模型便宜93%,每百萬tokens的進(jìn)出費(fèi)用分別為1.10美元/4.40美元(享有50%的緩存折扣)。谷歌發(fā)布的Gemini 2.0 Flash-Lite是Gemini 2.0系列的新變體,每百萬tokens0.3美元,是谷歌目前最便宜的模型。

可以窺見,在AI產(chǎn)業(yè)的競爭中,降低訓(xùn)練成本、提高計算效率和優(yōu)化模型性能已成為企業(yè)的主要競爭策略。尤其是訓(xùn)練流程的優(yōu)化,成為了公司在大模型市場中占據(jù)競爭優(yōu)勢的關(guān)鍵能力之一。2025年,低成本做法也將成為行業(yè)的主流趨勢。

此外,一些大公司也在開發(fā)專用人工智能芯片,例如谷歌、蘋果、微軟和OpenAI,這些專業(yè)芯片可以比英偉達(dá)這樣通用處理器運(yùn)行更高效;或是采用一些方法提高芯片的使用效率,例如用多種模型,每種模型針對不同問題,以此來縮短芯片的處理時間等。

AI推理芯片制造商Groq2024年估值達(dá)到28億美元,在Blackrock領(lǐng)投的新一輪中融資6.4億美元,其專為AI推理任務(wù)設(shè)計的芯片“語言計算單元”(LPU, language processing unit)能以現(xiàn)有解決方案1/10的價格、10倍的速度運(yùn)行與ChatGPT、GPT-4o相似的模型。目前,在Groq開發(fā)的、對標(biāo)英偉達(dá)CUDA的軟件開發(fā)平臺GroqCloud平臺上,約有40萬開發(fā)者。

趨勢三:專有模型有望釋放AI的應(yīng)用潛力

大模型就像個通才,然而,在一些專業(yè)領(lǐng)域,大模型往往缺乏針對性和操作性。為了突破這一瓶頸,越來越多的公司開始專注于開發(fā)專有模型,通過在特定領(lǐng)域數(shù)據(jù)上微調(diào)模型,實現(xiàn)更高效的工作流程自動化,提供更具操作性和任務(wù)導(dǎo)向的工具。這一趨勢正在逐步升溫,并在多個行業(yè)展現(xiàn)出巨大的應(yīng)用潛力。以下為一些具體的案例:

金融服務(wù)領(lǐng)域,提升決策效率與洞察力:摩根大通和彭博社等機(jī)構(gòu)正在利用其龐大的內(nèi)部數(shù)據(jù)集開發(fā)大語言模型,以提升運(yùn)營效率和決策能力。這些模型能夠提供獨特的市場洞察、風(fēng)險分析和報告生成。例如,彭博社于2023年開發(fā)了BloombergGPT,專注于金融領(lǐng)域的數(shù)據(jù)分析和預(yù)測,通過微調(diào)金融數(shù)據(jù),能夠更高效地處理復(fù)雜的金融任務(wù),如市場趨勢分析和投資策略制定。

網(wǎng)絡(luò)安全領(lǐng)域,精準(zhǔn)檢測與應(yīng)對威脅:美國網(wǎng)絡(luò)安全解決方案提供商Palo Alto Networks正在訓(xùn)練自有的大語言模型,這些模型能夠幫助安全專家更好地檢測和應(yīng)對網(wǎng)絡(luò)威脅。該公司在2024財年四季度披露了超過2億美元的AI相關(guān)經(jīng)常性收入,同比增幅近四倍。AI大模型通過模擬復(fù)雜攻擊場景,幫助安全團(tuán)隊快速發(fā)現(xiàn)系統(tǒng)漏洞并提供修復(fù)建議,顯著提升了網(wǎng)絡(luò)安全的實時預(yù)警和用戶行為分析能力。

國防領(lǐng)域,用于軍事與情報分析:美國數(shù)據(jù)分析和軟件公司Palantir近期獲得了一系列合同,用于支持AI的服務(wù),包括加速部署適用于國防和軍事領(lǐng)域的AI模型。這些模型能夠提升情報分析、目標(biāo)識別和決策支持能力。例如,AI訓(xùn)練平臺可以創(chuàng)建逼真的戰(zhàn)斗場景,幫助士兵在安全環(huán)境下進(jìn)行戰(zhàn)術(shù)訓(xùn)練。此外,AI技術(shù)在軍事領(lǐng)域的應(yīng)用還包括無人化作戰(zhàn)系統(tǒng)和沉浸式訓(xùn)練模擬。

生命科學(xué)領(lǐng)域:2024年,科研人員使用AI的比例快速增加,AI對科學(xué)研究方法和流程的變革效應(yīng)也開始顯現(xiàn)。比如,AlphaFold 3.0在2024年發(fā)布,不僅提高了蛋白質(zhì)結(jié)構(gòu)預(yù)測的準(zhǔn)確率,還擴(kuò)展到了DNA和RNA等生物分子的研究,這項技術(shù)幫助科學(xué)家快速預(yù)測藥物分子與目標(biāo)蛋白質(zhì)的結(jié)合情況,大大提高了藥物研發(fā)的效率。2025年,多模態(tài)大模型將進(jìn)一步融入科學(xué)研究,賦能多維數(shù)據(jù)的復(fù)雜結(jié)構(gòu)挖掘,輔助科研問題的綜合理解與全局分析,為生物醫(yī)學(xué)、氣象、材料發(fā)現(xiàn)、生命模擬、能源等基礎(chǔ)與應(yīng)用科學(xué)的研究開辟新方向。

除了上述領(lǐng)域,專有模型還在其他行業(yè)展現(xiàn)出廣泛的應(yīng)用前景。例如,Two Sigma在量化投資中使用AI Agent進(jìn)行選股策略,通過分析財務(wù)數(shù)據(jù)和宏觀經(jīng)濟(jì)指標(biāo),識別潛在的投資機(jī)會。Shopify Sidekick則利用LLama 2生成產(chǎn)品描述、回應(yīng)客戶查詢和創(chuàng)建營銷內(nèi)容,幫助小企業(yè)主提升運(yùn)營效率。

專有模型通過在特定領(lǐng)域的數(shù)據(jù)上進(jìn)行微調(diào),能夠提供更具針對性和操作性的解決方案。這種趨勢不僅提升了各行業(yè)的自動化水平,還為企業(yè)帶來了顯著的運(yùn)營效率提升和成本降低。隨著AI技術(shù)的不斷發(fā)展,未來專有模型將在更多領(lǐng)域得到廣泛應(yīng)用,成為推動行業(yè)創(chuàng)新的重要力量。

趨勢四:推動動態(tài)自適應(yīng)界面,實現(xiàn)高度個性化的交互體驗

生成式界面(Generative Interface)是指利用生成式模型,如生成對抗網(wǎng)絡(luò)(GANs)或變分自編碼器(VAEs),自動創(chuàng)建用戶界面元素或交互流程。這種界面不是通過傳統(tǒng)設(shè)計方法人工制作,而是通過機(jī)器學(xué)習(xí)算法根據(jù)輸入的數(shù)據(jù)、需求或上下文生成。

在2024年,生成式用戶界面(Generative UI)在動態(tài)和自適應(yīng)界面、AI與算法融合、個性化體驗等方面取得了顯著進(jìn)展。大規(guī)模生成式預(yù)訓(xùn)練模型(如GPT系列、DALL·E等)已被廣泛應(yīng)用于自動化界面設(shè)計。開發(fā)者借助這些模型,可以快速生成和調(diào)整界面元素,如按鈕、布局、色彩搭配等,甚至可以根據(jù)用戶反饋實時調(diào)整界面的外觀和功能。

此外,生成式界面逐步在增強(qiáng)現(xiàn)實(AR)和虛擬現(xiàn)實(VR)環(huán)境中得到應(yīng)用,尤其是在需要復(fù)雜交互的沉浸式體驗中,AI幫助生成自適應(yīng)、動態(tài)變化的虛擬界面。例如,英偉達(dá)在2024年SIGGRAPH大會上展示了利用實時生成式AI創(chuàng)建沉浸式沙漠世界的研究成果。此外,英偉達(dá)還通過Holoscan技術(shù)賦能手術(shù)機(jī)器人,加速AI技術(shù)在醫(yī)療實踐中的應(yīng)用。這些應(yīng)用展示了生成式AI在動態(tài)生成虛擬界面方面的潛力,尤其是在需要高度沉浸感的場景中。

可以說,隨著用戶需求變得更加多樣化和復(fù)雜,傳統(tǒng)的固定界面無法滿足個性化的交互需求。動態(tài)自適應(yīng)界面能夠根據(jù)用戶的行為、偏好和環(huán)境變化實時調(diào)整顯示內(nèi)容和功能,提供更加定制化的體驗。

展望2025年,生成式界面將迎來重大發(fā)展,成為推動用戶體驗變革的關(guān)鍵力量。越來越多的應(yīng)用將采用基于用戶交互和邏輯工作流程自適應(yīng)的動態(tài)用戶界面。生成式UI將使應(yīng)用能夠自動生成表單、儀表板或可視化等界面元素,這些元素將根據(jù)用戶的具體需求和操作量身定制。例如,Web開發(fā)平臺Vercel和Bolt.new等公司正在開發(fā)能夠創(chuàng)建高度適應(yīng)性和個性化用戶體驗的平臺,提供實時演進(jìn)的界面,以滿足不斷變化的需求,從而簡化工作流程。

#03 八大技術(shù)趨勢,推動AI泛化能力

趨勢一:多模態(tài)能力的增強(qiáng)和集成

2024年,多模態(tài)AI取得了顯著進(jìn)展。OpenAI、Google DeepMind等機(jī)構(gòu)推出了更強(qiáng)大的多模態(tài)模型,如視頻生成模型Sora的誕生、OpenAI多模態(tài)AI大模型GPT-4o的到來、CLIP模型通過跨模態(tài)表示實現(xiàn)圖文搜索,用戶可以通過輸入文本搜索相關(guān)圖像或視頻。此外,文本到圖像生成(如DALL·E、Stable Diffusion)和視頻生成模型也取得了顯著進(jìn)展,進(jìn)一步拓展了AI的交互體驗。

大模型逐步增加了能夠處理圖像、音頻或視頻等多種輸入形式。這些模型不僅提升了AI對復(fù)雜信息的處理能力,還拓展了其應(yīng)用領(lǐng)域。在谷歌云發(fā)布的《2025年AI商業(yè)趨勢》報告中,多模態(tài)AI被放在首位。谷歌云預(yù)測,2025年將成為企業(yè)采用AI技術(shù)的關(guān)鍵一年,這一趨勢主要由多模態(tài)學(xué)習(xí)及其實現(xiàn)的情境感知所驅(qū)動的,并預(yù)計2025年全球多模態(tài)AI市場規(guī)模將達(dá)到24億美元。

2025年,大模型將更加關(guān)注多模態(tài)融合與交互。AI不僅能夠生成文本,還能理解圖像、視頻中的上下文,甚至在多模態(tài)環(huán)境中進(jìn)行決策。比如,結(jié)合視覺與語音的能力,模型能夠更好地理解復(fù)雜的場景,并做出合適的反應(yīng)。

此外,多模態(tài)模型的訓(xùn)練方法也在不斷優(yōu)化,例如采用分階段訓(xùn)練策略,先固定大語言模型的權(quán)重參數(shù),對圖像編碼器和橋接組件進(jìn)行初步訓(xùn)練,再進(jìn)行整體訓(xùn)練,從而提升模型性能。

趨勢二:大模型的可解釋性表現(xiàn)更強(qiáng)

可解釋人工智能 (xAI) 是人工智能領(lǐng)域的一個新興領(lǐng)域,致力于使人工智能系統(tǒng)對人類更加透明、可解釋和可理解。xAI的興起源于人們對人工智能決策過程透明度和問責(zé)制的需求日益增長,尤其是隨著人工智能系統(tǒng)變得越來越復(fù)雜并部署在金融、法律或醫(yī)療保健等高風(fēng)險領(lǐng)域。例如,考慮醫(yī)院用于篩查患者X光片的腫瘤檢測 CNN(卷積神經(jīng)網(wǎng)絡(luò)) 模型的情況。但是,當(dāng)技術(shù)人員或患者不知道其工作原理時,他們?nèi)绾文芟嘈牌浣Y(jié)果?這正是我們需要方法來了解影響任何深度學(xué)習(xí)模型決策的因素的原因。

另外,AI的安全性問題是一個不可忽視的關(guān)鍵挑戰(zhàn)。尤其是大模型在做出決策時的“思考過程”對于用戶和開發(fā)者來說變得不透明,就像一個“黑箱”,其決策過程難以解釋和追蹤。若這些模型未經(jīng)過嚴(yán)格的審查和驗證,它們可能會做出無法被察覺的有害決策,甚至加劇社會偏見和不公。因此,加強(qiáng)對大模型的監(jiān)控、審查和可解釋性要求是提升AI系統(tǒng)安全性的重要一步。

2024年,大模型的可解釋性取得了重要進(jìn)展。OpenAI、Google DeepMind等機(jī)構(gòu)推出了更透明的模型架構(gòu)和解釋工具,如GPT-4的可解釋性增強(qiáng)版本和Gemini的跨模態(tài)解釋功能。LIME、SHAP等后驗解釋方法被廣泛應(yīng)用于醫(yī)療、金融等領(lǐng)域,幫助用戶理解模型決策依據(jù)。同時,自監(jiān)督學(xué)習(xí)和符號AI的結(jié)合提升了模型的內(nèi)在可解釋性,減少了“黑箱”問題。行業(yè)也開始重視可解釋性的標(biāo)準(zhǔn)化,例如歐盟《人工智能法案》要求高風(fēng)險AI系統(tǒng)提供清晰的決策解釋。

2025年,可解釋性工具將進(jìn)一步普及,將模型將內(nèi)置更強(qiáng)大的解釋能力,實時生成決策依據(jù),并支持多模態(tài)數(shù)據(jù)的跨模態(tài)解釋,幫助用戶理解復(fù)雜AI模型的決策過程。通過一些自主進(jìn)化模式或可解釋性工具,將模型將內(nèi)置更強(qiáng)大的解釋能力,實時生成決策依據(jù),并支持多模態(tài)數(shù)據(jù)的跨模態(tài)解釋??山忉屝耘c性能的平衡將得到優(yōu)化,知識蒸餾和模型壓縮技術(shù)將幫助簡化復(fù)雜模型的同時保持高精度。行業(yè)專用可解釋性工具將普及,滿足醫(yī)療、金融等領(lǐng)域的合規(guī)需求。

以DeepSeek為例,通過純算法自主進(jìn)化的Zero模式與僅需數(shù)千條人工標(biāo)注數(shù)據(jù)的R1模式組合,既保留模型自主進(jìn)化能力又保障人類可解釋性————Zero模式使得模型能夠自我進(jìn)化和發(fā)現(xiàn)數(shù)據(jù)中的規(guī)律,而R1模式通過引入人工標(biāo)注數(shù)據(jù)為模型提供了一個監(jiān)督和解釋的框架。這種結(jié)合確保了模型在保持自主學(xué)習(xí)能力的同時,也能夠被人類理解和控制,從而提升了可解釋性。

此外,倫理和隱私保護(hù)將深度融入可解釋性設(shè)計,確保AI系統(tǒng)既透明又安全,推動大模型在高風(fēng)險場景中的廣泛應(yīng)用。以下是一些提升的方向和工具:

○ 自監(jiān)督學(xué)習(xí)與模型可解釋性:通過自監(jiān)督學(xué)習(xí),AI系統(tǒng)可以在缺乏大量標(biāo)注數(shù)據(jù)的情況下,通過理解數(shù)據(jù)的內(nèi)在結(jié)構(gòu)來進(jìn)行學(xué)習(xí),這種方法有助于提升模型的透明度,使得我們能夠更好地理解其學(xué)習(xí)過程。

○ 生成對抗網(wǎng)絡(luò)(GANs)和模型蒸餾:通過生成對抗網(wǎng)絡(luò)和蒸餾技術(shù),開發(fā)者能夠簡化復(fù)雜模型,同時保持高效性和準(zhǔn)確性,這種方法使得大規(guī)模深度學(xué)習(xí)模型更加易于解釋。

○ 增強(qiáng)推理框架和可視化工具:新一代的AI推理框架將更注重可視化,幫助用戶以更直觀的方式理解模型決策的依據(jù)。例如,基于圖像或文本的AI系統(tǒng),新的可視化工具可以清晰展示模型如何關(guān)注不同的輸入特征,從而提升其可解釋性。

需要一提的是,未來AI的安全不光需要提升可解釋性,還需要著重于法律合規(guī)性、安全審計和濫用防范等方面,推動AI技術(shù)的負(fù)責(zé)任應(yīng)用。隨著技術(shù)的不斷發(fā)展,AI如何在不斷的創(chuàng)新中確保安全,將成為AI領(lǐng)域面臨的重大挑戰(zhàn)之一。

趨勢三:大模型長期記憶能力迎來深層次變革

目前的許多大模型(如基于Transformer架構(gòu)的模型)在處理長文本或復(fù)雜上下文時,常常會面臨信息丟失等問題。傳統(tǒng)模型一般有固定的“記憶窗口”,當(dāng)文本或輸入信息過長時,模型往往會忘記最初的信息,或者在處理過程中只關(guān)注較近的上下文。長期記憶的核心需求是讓模型能跨越多個時刻、任務(wù)和場景記住信息,并能在合適的時機(jī)提取和利用這些信息。

大模型的長期記憶能力迎來了一系列技術(shù)突破。首先,在上下文窗口的擴(kuò)展上,比如2024年,Google Gemini 1.5 Pro突破性地實現(xiàn)了最高可達(dá)1000萬token的處理能力。到2025年2月發(fā)布的Gemini 2.0全家桶,最強(qiáng)Pro版本可支持到2M上下文。

其次,外部記憶系統(tǒng)的引入推動了大模型記憶能力的發(fā)展。如IBM WatsonX的實時知識圖譜更新功能使得在醫(yī)學(xué)診斷等特定領(lǐng)域的記憶準(zhǔn)確率提高了35%。持續(xù)學(xué)習(xí)機(jī)制方面,Meta的LoRA-X架構(gòu)通過參數(shù)隔離技術(shù)降低了多任務(wù)干擾,OpenAI則部署了分布式記憶訓(xùn)練系統(tǒng),使百萬設(shè)備協(xié)同進(jìn)化,提升了記憶系統(tǒng)表現(xiàn)。在記憶檢索方面,Anthropic的ContextRouter模塊和微軟的MAVEx系統(tǒng)分別通過動態(tài)記憶權(quán)重分配和跨模態(tài)聯(lián)合檢索,優(yōu)化了記憶檢索的準(zhǔn)確性與效率。

第三,隱私與安全問題也得到了關(guān)注,Google推出的Memory Provenance框架增強(qiáng)了記憶的透明度和可控性,而HuggingFace的SafeMemory工具包通過差分隱私技術(shù)將隱私泄露的風(fēng)險大幅度降低。這些技術(shù)突破使大模型的長期記憶能力得到了顯著提升,推動了多個領(lǐng)域的應(yīng)用發(fā)展。

2025年,大模型的長期記憶技術(shù)將迎來新的發(fā)展趨勢。如混合窗口架構(gòu)或?qū)⒊蔀樯舷挛奶幚淼男路妒?,能夠根?jù)任務(wù)需求動態(tài)調(diào)整局部和全局注意力的范圍,大幅度提升處理效率。隨著多模態(tài)技術(shù)的進(jìn)步,跨模態(tài)記憶融合將在視頻、文本、觸覺和嗅覺數(shù)據(jù)的編碼上取得突破,進(jìn)一步提升模型的記憶能力。記憶權(quán)限管理和記憶遺忘機(jī)制將更加成熟,為隱私和安全提供更強(qiáng)保障。

此外,隨著用戶對個性化和定制化的需求不斷提升。個性化記憶系統(tǒng)能夠根據(jù)用戶的特定需求、偏好和行為習(xí)慣構(gòu)建專屬的記憶圖譜。例如,AI助手可以記住用戶的興趣、常用的命令、偏好的回答風(fēng)格等,從而提供更加精準(zhǔn)和符合需求的回復(fù)。2025年,個性化記憶系統(tǒng)也將成為大模型發(fā)展的重點方向,大模型能夠根據(jù)用戶需求構(gòu)建專屬記憶圖譜,提高個性化回復(fù)的準(zhǔn)確性,并通過跨設(shè)備記憶同步實現(xiàn)實時更新。

不過,盡管大模型在長期記憶方面取得顯著進(jìn)展,但仍面臨技術(shù)挑戰(zhàn),包括記憶沖突解決、多來源記憶的置信度評估體系、能耗瓶頸和認(rèn)知偏差防控問題。商業(yè)應(yīng)用方面,醫(yī)療、教育和金融等行業(yè)將受益于大模型長期記憶能力的提升,預(yù)計能夠降低誤診率、提升知識留存率并加速風(fēng)控響應(yīng)速度。

趨勢四:合成數(shù)據(jù)或加速大模型訓(xùn)練

隨著人工智能技術(shù)的飛速發(fā)展,數(shù)據(jù)成為推動AI進(jìn)步的核心資源。2025年,合成數(shù)據(jù)作為加速大模型訓(xùn)練的一種重要方法,正在成為AI發(fā)展的關(guān)鍵趨勢。馬斯克在2025年CES(消費(fèi)電子展會)的訪談中提到,隨著人類累積的知識幾乎被AI訓(xùn)練完畢,未來的AI系統(tǒng)將不得不依賴合成數(shù)據(jù)進(jìn)行自我生成和學(xué)習(xí)。這一觀點突顯了合成數(shù)據(jù)在未來AI技術(shù)發(fā)展中的潛力。

目前,多個科技巨頭已經(jīng)開始在AI模型訓(xùn)練中廣泛應(yīng)用合成數(shù)據(jù)。微軟、Meta、OpenAI和Anthropic等公司紛紛將合成數(shù)據(jù)作為增強(qiáng)模型訓(xùn)練效率和拓寬訓(xùn)練數(shù)據(jù)源的有效手段。例如,2024年下半年發(fā)布的Llama 3.1、o1、DeepSeekV3和Phi-4等模型均報告了使用合成數(shù)據(jù)進(jìn)行訓(xùn)練。根據(jù)科技市場研究機(jī)構(gòu)Gartner的預(yù)測,到2024年,AI及分析項目中使用的數(shù)據(jù)中,60%以上將來自合成數(shù)據(jù)。合成數(shù)據(jù)能夠幫助AI系統(tǒng)在真實數(shù)據(jù)難以獲得或標(biāo)注成本過高的情況下,生成具有代表性且符合特定任務(wù)需求的數(shù)據(jù),大幅降低了對實際數(shù)據(jù)的依賴。

然而,合成數(shù)據(jù)的使用仍然面臨諸多挑戰(zhàn)與爭議。2024年7月,《Nature》期刊刊登的論文指出,LLM生成的合成數(shù)據(jù)可能會污染下一代模型的訓(xùn)練集,導(dǎo)致模型性能下降,甚至發(fā)生“崩潰”。這一風(fēng)險類似于“數(shù)據(jù)中毒”問題,嚴(yán)重時可能讓模型無法做出有效的推理和判斷。英偉達(dá)也發(fā)布了其Nemotron-4 340B開源模型,聲稱使用了98%的合成數(shù)據(jù),但同時也強(qiáng)調(diào)需要加強(qiáng)合成數(shù)據(jù)的質(zhì)量控制,以避免潛在的負(fù)面影響。

盡管面臨風(fēng)險,但合成數(shù)據(jù)在加速大模型訓(xùn)練方面的潛力仍然巨大。尤其在高性能計算和多模態(tài)數(shù)據(jù)融合等領(lǐng)域,合成數(shù)據(jù)可以快速擴(kuò)展訓(xùn)練集的規(guī)模,并提供更多樣化的訓(xùn)練情境。為了應(yīng)對合成數(shù)據(jù)帶來的挑戰(zhàn),AI研究者正在不斷優(yōu)化生成數(shù)據(jù)的質(zhì)量和多樣性,例如通過強(qiáng)化學(xué)習(xí)算法對合成數(shù)據(jù)進(jìn)行校正,或者結(jié)合人類監(jiān)督和自動化評估機(jī)制來減少“數(shù)據(jù)污染”風(fēng)險。

展望未來,隨著技術(shù)的不斷進(jìn)步,合成數(shù)據(jù)有望成為AI訓(xùn)練中的重要組成部分。它不僅能加速模型的訓(xùn)練過程,還能在數(shù)據(jù)匱乏或難以獲取的領(lǐng)域,為AI發(fā)展提供新的動力。

趨勢五:大模型普及加速,效率躍遷曲線下成本更低了

在2025年1月,Anthropic的CEO-Dario Amodei 發(fā)表了一篇長達(dá)萬字的深度分析報告??隙薉eepSeek的技術(shù)突破:其最新模型在特定基準(zhǔn)測試中已逼近美國頂尖水平,并嘗試從三個維度將中國的AI進(jìn)步納入全球技術(shù)演進(jìn)坐標(biāo)系進(jìn)行定位:算力規(guī)模定律、效率躍遷曲線、范式革新動能。

這些維度的選擇反映了他對國產(chǎn)AI評估方面的理解:關(guān)注硬件和計算能力的提升(算力規(guī)模定律),技術(shù)的效率提升(效率躍遷曲線),以及新技術(shù)范式的創(chuàng)新和推動力(范式革新動能)。這種全方位的定位方式,能夠精準(zhǔn)捕捉到AI大模型在全球技術(shù)演進(jìn)中的角色及潛力。具體我們解釋下這三方面的重要性和趨勢:

首先,規(guī)模定律是推動大模型發(fā)展的基礎(chǔ)。隨著硬件技術(shù)不斷進(jìn)步(如更強(qiáng)大的GPU、TPU和專用AI芯片),訓(xùn)練超大規(guī)模模型已變得越來越可行,同時也驅(qū)動了云計算和分布式計算的發(fā)展,進(jìn)一步降低了成本。隨著更強(qiáng)大的計算資源的普及和優(yōu)化,規(guī)模定律將繼續(xù)提升,這是2025年AI大模型的關(guān)鍵能力趨勢之一。

其次,關(guān)于效率躍遷曲線,曲線偏移指的是技術(shù)創(chuàng)新帶來成本曲線的變化,使得原本高昂的訓(xùn)練成本能夠通過硬件優(yōu)化、模型架構(gòu)改進(jìn)等手段大幅降低。這不僅能夠降低AI研發(fā)的門檻,還能加速技術(shù)迭代。比如2024年,硬件創(chuàng)新如量子計算、專用AI加速芯片推動AI訓(xùn)練成本的快速降低。同時,AI框架的優(yōu)化(如更高效的深度學(xué)習(xí)框架)和算法改進(jìn)幫助實現(xiàn)了更少計算資源的更高效訓(xùn)練。

在前文中我們也提到了,目前對于AI基礎(chǔ)設(shè)施方面軍備競賽激烈,低成本做法漸成趨勢,尤其是DeepSeek通過采用OpenAI等先進(jìn)模型,利用蒸餾技術(shù)將其知識轉(zhuǎn)移。這一過程使得DeepSeek能夠在保持較高性能的同時,顯著減少訓(xùn)練所需的計算資源和時間。通過模仿OpenAI模型的輸出,“學(xué)生模型”能夠快速學(xué)習(xí)復(fù)雜的模式和推理能力,加速模型的優(yōu)化過程。2025年,隨著硬件和算法的進(jìn)一步突破,AI開發(fā)成本將大幅下降,這也使得更多的中小型企業(yè)可以進(jìn)入AI領(lǐng)域。

此外,新的訓(xùn)練范式(如強(qiáng)化學(xué)習(xí)、無監(jiān)督學(xué)習(xí)等)正在改變AI的學(xué)習(xí)方式。2020到2023年,AI主要依賴預(yù)訓(xùn)練模型,使用大量互聯(lián)網(wǎng)文本進(jìn)行訓(xùn)練,并通過少量額外訓(xùn)練進(jìn)行微調(diào)。然而,到了2024年,強(qiáng)化學(xué)習(xí)(RL)成為新的重點,通過強(qiáng)化學(xué)習(xí)生成思維鏈,AI在數(shù)學(xué)、編程和推理等任務(wù)上的表現(xiàn)顯著提升。初期階段投入較少,但效果顯著。

強(qiáng)化學(xué)習(xí)和自監(jiān)督學(xué)習(xí)等新興范式逐漸在機(jī)器人、自動化和多模態(tài)學(xué)習(xí)領(lǐng)域得到應(yīng)用,尤其提升了機(jī)器人在動態(tài)環(huán)境中的自主學(xué)習(xí)和決策能力。到2025年,這些新訓(xùn)練范式預(yù)計將成為AI發(fā)展的主流,尤其在復(fù)雜任務(wù)處理上(接下來趨勢六我們會進(jìn)一步解釋)。

趨勢六:預(yù)訓(xùn)練到后期訓(xùn)練和推理遷移轉(zhuǎn)變

2024年是AI技術(shù)飛速發(fā)展的一年,尤其是在大語言模型(LLM)和多模態(tài)技術(shù)方面取得了顯著突破。這一年,AI從單一模態(tài)向多模態(tài)融合邁進(jìn),大語言模型通過擴(kuò)展上下文窗口和采用混合專家架構(gòu)(MoE)等技術(shù),顯著提升了推理和生成能力。同時,強(qiáng)化學(xué)習(xí)(RL)開始與大語言模型結(jié)合,為模型的泛化能力提升提供了新的方向。此外,AI在醫(yī)療、金融、自動駕駛等領(lǐng)域的應(yīng)用不斷深化,推動了行業(yè)變革。然而,隨著模型規(guī)模的擴(kuò)大,預(yù)訓(xùn)練階段的性能提升逐漸放緩,行業(yè)開始探索后訓(xùn)練和推理遷移的新模式。

2025年,AI技術(shù)將進(jìn)入一個新的發(fā)展階段,Scaling Law的擴(kuò)展將成為關(guān)鍵趨勢之一。強(qiáng)化學(xué)習(xí)與大語言模型的結(jié)合(RL+LLMs)將進(jìn)一步推動模型泛化能力,從預(yù)訓(xùn)練向后訓(xùn)練和推理遷移轉(zhuǎn)變。

這種模式將使AI在特定場景下的表現(xiàn)得到顯著提升,同時降低訓(xùn)練成本,提高模型的適應(yīng)性和靈活性。此外,AI將在更多領(lǐng)域?qū)崿F(xiàn)落地應(yīng)用,如智能駕駛、具身智能等,這些領(lǐng)域?qū)⒂瓉砑夹g(shù)突破和商業(yè)化的加速,但也與此同時會帶來更多的安全和風(fēng)險管理挑戰(zhàn)。因此,AI安全和治理將成為行業(yè)關(guān)注的重點。

需要強(qiáng)調(diào)的是,大規(guī)模語言模型(LLM)的預(yù)訓(xùn)練階段已經(jīng)接近瓶頸,主要受到數(shù)據(jù)、計算資源和模型規(guī)模增長的限制,且在通用性提升上邊際效益遞減。部分研究人員和行業(yè)專家擔(dān)心,對于大規(guī)模語言模型而言,傳統(tǒng)擴(kuò)展方式已接近極限。生成式AI已遇瓶頸。據(jù)外媒報道,像OpenAI這樣的公司在擴(kuò)大技術(shù)應(yīng)用時也發(fā)現(xiàn)困難重重,其他前沿實驗室也面臨更嚴(yán)重的挑戰(zhàn)。知名數(shù)據(jù)科學(xué)家Yam Peleg透露,一些實驗室試圖通過延長訓(xùn)練時間和增加數(shù)據(jù)量來提升模型表現(xiàn),但結(jié)果卻遭遇了“收益遞減墻”,且情況比公開報道的更為嚴(yán)重。

不過,盡管如此,預(yù)訓(xùn)練依然為模型奠定了基礎(chǔ),后續(xù)的優(yōu)化潛力巨大。因此,在后訓(xùn)練階段(如微調(diào)、強(qiáng)化學(xué)習(xí)、多模態(tài)對齊等)依然存在許多優(yōu)化機(jī)會。通過領(lǐng)域特化、任務(wù)指令優(yōu)化、模型壓縮等技術(shù),可以提升模型在特定任務(wù)上的表現(xiàn),同時提高其在資源受限環(huán)境中的部署效率和安全性。

趨勢七:更多優(yōu)化算法將被用于強(qiáng)化學(xué)習(xí)等領(lǐng)域

目前,深度強(qiáng)化學(xué)習(xí)(DRL)的優(yōu)化算法在多個行業(yè)取得了應(yīng)用突破。為了解決傳統(tǒng)強(qiáng)化學(xué)習(xí)在高維度問題上訓(xùn)練困難的問題,研究者采用了更加高效的算法,如模仿學(xué)習(xí)和分層強(qiáng)化學(xué)習(xí),顯著提升了模型的學(xué)習(xí)效率和訓(xùn)練速度。比如Google DeepMind 推出的AlphaDev系統(tǒng)由兩個核心組成部分構(gòu)成:學(xué)習(xí)算法和表示函數(shù)。學(xué)習(xí)算法是在先進(jìn)的 AlphaZero 算法基礎(chǔ)上進(jìn)行擴(kuò)展,結(jié)合了深度強(qiáng)化學(xué)習(xí) (DRL) 和隨機(jī)搜索優(yōu)化算法,以執(zhí)行大規(guī)模的指令搜索任務(wù)。

此外,RLHF(強(qiáng)化學(xué)習(xí)與人類反饋結(jié)合)的應(yīng)用開始更加深入和精細(xì)。AI大模型開始通過更精確的人類反饋進(jìn)行訓(xùn)練,從而能夠更好地理解復(fù)雜任務(wù),并且在人機(jī)交互中表現(xiàn)出更高的自適應(yīng)能力。例如,OpenAI的ChatGPT通過用戶的實時反饋不斷優(yōu)化對話能力,以提供個性化和上下文相關(guān)的回答。由于RLHF能顯著減少對大規(guī)模標(biāo)注數(shù)據(jù)的依賴,更多AI系統(tǒng)開始通過少量高質(zhì)量的人工反饋來進(jìn)行高效訓(xùn)練,從而降低了模型開發(fā)和訓(xùn)練的成本。

還有近期處于話題焦點的DeepSeek,R1模型通過強(qiáng)化學(xué)習(xí)(RL)和基于人類反饋的強(qiáng)化學(xué)習(xí)(RLHF)進(jìn)行訓(xùn)練,并針對核心算法模塊做了大量的優(yōu)化處理:比如改造 Attention 模塊,通過低秩壓縮,讓KV Cache的效率達(dá)到最優(yōu)。以及通過訓(xùn)練架構(gòu)瘦身—例如GRPO算法通過省去傳統(tǒng)強(qiáng)化學(xué)習(xí)中必須的Critic模型(即”雙引擎”設(shè)計),將復(fù)雜算法簡化為可落地執(zhí)行的工程方案。一般傳統(tǒng)的強(qiáng)化學(xué)習(xí)模型通常采用這雙引擎”設(shè)計——Actor和Critic,Actor負(fù)責(zé)執(zhí)行決策,Critic評估Actor的決策效果,二者需要同時進(jìn)行訓(xùn)練,這增加了計算量和訓(xùn)練復(fù)雜度。通過去除Critic模型,GRPO算法能夠簡化模型結(jié)構(gòu),降低計算資源的消耗。

隨著AI應(yīng)用場景的多樣化,簡化算法架構(gòu)將成為AI發(fā)展的重要方向。2025年,更多優(yōu)化算法(如GRPO等)將被用于強(qiáng)化學(xué)習(xí)等領(lǐng)域,以減少計算資源的消耗,同時提高模型的執(zhí)行效率和實時響應(yīng)能力。

隨著硬件資源的不斷提升和算法的進(jìn)一步優(yōu)化,像GRPO這樣的輕量級強(qiáng)化學(xué)習(xí)算法將被廣泛應(yīng)用于邊緣計算和低資源設(shè)備上。例如,智能設(shè)備、物聯(lián)網(wǎng)設(shè)備和機(jī)器人等領(lǐng)域,都會受益于這種簡化的算法,實現(xiàn)在硬件條件有限的環(huán)境中高效運(yùn)行。

趨勢八:低成本訓(xùn)練與AI倫理,知識產(chǎn)權(quán)成為核心議題

春節(jié)期間,DeepSeek的DeepSeek-R1震撼了全球科技圈和資本市場,其基于知識蒸餾技術(shù),成功將大型復(fù)雜模型的知識遷移到較小模型,實現(xiàn)高效部署。2月6日,斯坦福大學(xué)李飛飛團(tuán)隊和華盛頓大學(xué)研究人員以不到50美元云計算費(fèi)用,成功蒸餾出一個名為s1的新推理模型,表現(xiàn)與OpenAI的o1和DeepSeek的R1相似,展示了蒸餾技術(shù)的強(qiáng)大潛力?;诟偁帀毫?,2月7日,OpenAI公開了o3-mini的推理思維鏈,但該推理思維鏈并非原始數(shù)據(jù),OpenAI產(chǎn)品官Kevin Weil表示會找到平衡方式以避免被競爭對手蒸餾。

Kevin Weil的考慮出發(fā)點在于,蒸餾通常依賴于將一個較大模型的知識提取出來,并將其遷移到一個更小的模型。如果目標(biāo)模型能夠有效地從源模型中獲取有用的知識,且沒有太大的性能損失,那么理論上,很多模型都可以通過蒸餾技術(shù)進(jìn)行簡化和優(yōu)化。因此,隨著AI蒸餾技術(shù)的普及,相關(guān)的法律和監(jiān)管框架也需要不斷加強(qiáng),以確保在模型開發(fā)和應(yīng)用過程中不會侵犯知識產(chǎn)權(quán)或數(shù)據(jù)隱私。

這種低成本訓(xùn)練的模式也引發(fā)了業(yè)界關(guān)于AI模型知識產(chǎn)權(quán)和倫理問題的討論。隨著越來越多的研究依賴于現(xiàn)有基座模型進(jìn)行微調(diào),是否應(yīng)當(dāng)給予這些基座模型開發(fā)者相應(yīng)的回報成為一個重要議題。同時,如何確保AI技術(shù)的公平使用和共享,也亟待業(yè)界深入探討和解決。

#04 下一個殺手級應(yīng)用,可能在消費(fèi)領(lǐng)域

趨勢一:越來越多企業(yè)從人工智能上掙到錢

過去的2024年,是生成式AI的落地之年。而2025年,則是這些企業(yè)級AI應(yīng)用在已有的落地場景中深入發(fā)展的一年。

美國風(fēng)險投資機(jī)構(gòu)Menlo Ventures在統(tǒng)計了600家美國企業(yè)的IT支出(包括模型支出、訓(xùn)練&部署支出、AI應(yīng)用支出,不包括芯片、云計算等支出)情況后發(fā)現(xiàn),2024年企業(yè)的AI相關(guān)支出達(dá)到了138億美元,相比2023年的23億美元增長了超過6倍。在這其中,應(yīng)用支出的增速最快,6億美元增長到了2024年的46億美元。

數(shù)據(jù)來源:Menlo Ventures

企業(yè)AI相關(guān)支出的提高,讓不同的行業(yè)間接獲益。第一個受益的是咨詢公司。2024年,埃森哲和IBM等咨詢公司正在實現(xiàn)大幅的收入增長,其中,與人工智能相關(guān)的服務(wù)對其營收增長貢獻(xiàn)顯著,客戶希望通過咨詢,了解實施人工智能能夠獲得的競爭優(yōu)勢。根據(jù)埃森哲披露,截至 2024 年 9 月,其生成式人工智能咨詢預(yù)訂額近 30 億美元。

第二個從人工智能中獲益的行業(yè)是云計算和軟件公司。軟件公司ServiceNow自推出 “Now Assist” 以來,報告了強(qiáng)勁的生成式人工智能預(yù)訂量,其首席財務(wù)官表示,在新產(chǎn)品系列中,最大新增年度合同價值貢獻(xiàn),來自于人工智能的采用。另外,軟件巨頭甲骨文的基礎(chǔ)設(shè)施即服務(wù)(IaaS)部門實現(xiàn)了強(qiáng)勁增長,這在很大程度上歸因于人工智能工作負(fù)載的增加。數(shù)據(jù)中心的領(lǐng)導(dǎo)者Equinix也因為人工智能基礎(chǔ)設(shè)施需求獲得了大量新合同。

另外,廣告行業(yè)也從人工智能使用中獲益。根據(jù)Meta Platforms最近報告,在人工智能的加持下,其廣告展示量增長了7% ,每廣告的平均價格增長了 11%,季度收入同比增張了19%。

亞馬遜集成了基于生成式人工智能的產(chǎn)品圖像生成工具,導(dǎo)致某些廣告活動的廣告展示量顯著增加。我們預(yù)計,隨著人工智能服務(wù)需求的擴(kuò)大,具有獨特市場定位、強(qiáng)大分銷渠道和特權(quán)數(shù)據(jù)訪問權(quán)限的云計算、軟件應(yīng)用和基礎(chǔ)設(shè)施公司將成為主要受益者。隨著人工智能市場的成熟,這些科技巨頭可能在 2025 年實現(xiàn)加速增長。

我們嘗試總結(jié)了生成式AI滲透率最高的幾個應(yīng)用場景:AI代碼、AI客服支持和企業(yè)級搜索。

● 最高的是AI代碼應(yīng)用,企業(yè)對AI代碼應(yīng)用的采用率達(dá)到了51%,比如,頭部產(chǎn)品 Github Copilot 的ARR(年度經(jīng)常性收入,是指企業(yè)每年從客戶那里獲得的或期望從客戶那里獲得的服務(wù)或產(chǎn)品回報的收入計算)達(dá)到了3億美金也真實的反應(yīng)了用戶的需求。Cursor、Cognition 等新興工具在迎來用戶快速增長的同時,也獲得了資本市場的火熱追捧。

● 其次是AI客戶支持,其采用率達(dá)到了31%,產(chǎn)品為內(nèi)部員工或外部用戶提供基于產(chǎn)品知識的客戶支持。Sierra、Decagon 等初創(chuàng)借力生成式AI的智能,為用戶提供符合品牌調(diào)性和消費(fèi)者畫像的定制化客服體驗,挑戰(zhàn)低效、無趣的傳統(tǒng)客服。

● 第三是AI數(shù)據(jù)檢索,其采用率達(dá)到了28%,這類應(yīng)用幫助企業(yè)解鎖和利用分散在各組織中的數(shù)據(jù),將數(shù)據(jù)孤島中的寶貴知識管理利用。例如一家初創(chuàng)企業(yè)Glean,其業(yè)務(wù)是企業(yè)級搜索,旨在為企業(yè)打造內(nèi)部的Google,核心產(chǎn)品 Glean Assistant 的用戶每天平均查詢 14 次,遠(yuǎn)超Google的日均查詢次數(shù)。在過去一年ARR(年經(jīng)常性收入,Annual Recurring Revenue)達(dá)到了5500萬美金。

數(shù)據(jù)來源:Menlo Ventures

2024年,企業(yè)60%的AI應(yīng)用支出來自企業(yè)創(chuàng)新業(yè)務(wù)的預(yù)算,說明企業(yè)使用這些應(yīng)用的態(tài)度以嘗試和探索為主,生成式AI在企業(yè)應(yīng)用場景中的落地尚處于早期階段。接下來,隨著企業(yè)未來各個部門對于生成式AI應(yīng)用的預(yù)算持續(xù)增長,哪些生成式AI應(yīng)用能為企業(yè)帶來實實在在的回報率,哪些或?qū)⒎值贸掷m(xù)性更長、規(guī)模更大的預(yù)算,從而支持生成式AI應(yīng)用生根發(fā)芽、斬獲1億美金甚至更多ARR。

① AI Agent正在給企業(yè)帶來效益

2025年,生成式AI應(yīng)用正在生根、發(fā)芽,給企業(yè)帶來實實在在的現(xiàn)金回報,基于這樣的趨勢,AI Agent將是這個商業(yè)環(huán)節(jié)閉環(huán)的關(guān)鍵。

AI Agent從學(xué)術(shù)走向商業(yè)落地,僅花了三年時間。

AI Agent的第一波高潮來自2023年年初,AutoGPT的火爆,所謂AutoGPT,其實是把學(xué)術(shù)圈很多的Agent idea簡單呈現(xiàn)出來,盡管其讓開發(fā)者感受到大模型的強(qiáng)大,但很快大家便發(fā)現(xiàn),AutoGPT的實驗性強(qiáng)于實用性,難以解決大部分的實際問題。第二波高潮來自2023年9月,AgentGen,通過構(gòu)建不同職能的Agent,分工協(xié)作。

到了2024年,AI Agent開始從實驗走向現(xiàn)實。

2024年末,OpenAI首席執(zhí)行官Sam Altman提出了AGI(通用人工智能)的五層框架:

  • Lv1 – Chatbot,具備基礎(chǔ)的對話能力,能夠理解和回應(yīng)簡單的文本輸入
  • Lv2 – Reasoner,具備基本的邏輯推理能力,能夠分析復(fù)雜信息并進(jìn)行推斷
  • Lv3 – Agent,具備理解復(fù)雜指令的能力
  • Lv4 – Innovator,具備創(chuàng)新和創(chuàng)造的能力
  • Lv5 – Organizer,具備協(xié)調(diào)和管理龐大系統(tǒng)、資源和團(tuán)隊的能力

他提出,如今我們正處于第二個階段并非常接近第三個階段的狀態(tài)。

Lv3的Agent智能體能夠自主與環(huán)境交互、收集信息,具備持續(xù)規(guī)劃并執(zhí)行多步驟、長時間任務(wù)的能力。要達(dá)成這個階段,需要一個推理能力、邏輯能力更強(qiáng)的模型(可能是o1的下一個版本、也可能是對標(biāo)o1的開源模型)。同時,服務(wù)AI Agent應(yīng)用的基礎(chǔ)設(shè)施也必不可少。

當(dāng)下,企業(yè)出于安全性、準(zhǔn)確性、穩(wěn)定性等因素的考量,更傾向于使用 AI Copilot (人在回路中參與)增加人在工作流中的效率,而不是直接采用端到端自動化 AI Agent。隨著底層模型能力和Agent框架開發(fā)的持續(xù)升級,Agent應(yīng)用將為企業(yè)提供更智能高效的數(shù)字員工。人與AI的協(xié)作關(guān)系將從AI賦能人工作,逐漸轉(zhuǎn)變到人監(jiān)督指導(dǎo)AI完成工作,最終達(dá)到AI自主完成工作。這個轉(zhuǎn)變會在未來幾年迅速發(fā)生。

至于適合AI Agent最先產(chǎn)生價值的應(yīng)用場景,2025年大概將延續(xù)現(xiàn)階段生成式AI滲透率高的場景,例如代碼編程、客服、銷售、營銷等。

根據(jù)第三方機(jī)構(gòu)Menlo Ventures的調(diào)查數(shù)據(jù)顯示,企業(yè)內(nèi)各部門的生成式AI預(yù)算劃分中,IT部分獨占鰲頭(22%)、產(chǎn)品和工程開發(fā)次之(19%),客服(9%)、銷售(8%)和營銷(7%)緊隨其后。

數(shù)據(jù)來源:Menlo Ventures, UpHonest Capital

根據(jù)硅兔賽跑的觀察,一些企業(yè)的確正在從這幾個場景中賺錢:

IT部門選擇之一的初創(chuàng)公司Glean,在2024年9月份完成新一輪融資,估值達(dá)到46億美元,其旨在優(yōu)化企業(yè)內(nèi)部數(shù)據(jù)檢索和問題答復(fù)。

在產(chǎn)品和工程開發(fā)部門依賴的AI編程應(yīng)用中,初創(chuàng)公司Cognition在2024年3月推出了首個AI程序員Devin,成立僅6個月就達(dá)到了20億美金估值。同年12月其Agent產(chǎn)品Devin正式上線,區(qū)別于普通的代碼補(bǔ)全應(yīng)用,Devin能夠無需人類參與進(jìn)行自主編碼,完成需要人類工程師參與的項目開發(fā)。目前 Devin擁有諸多頭部客戶:例如Ramp 使用Devin 編寫測試代碼并清理死亡代碼,MongoDB使用 Devin 更新過時的代碼架構(gòu)。

硅谷投資機(jī)構(gòu)UpHonest Capital早期投資的Cosine,正在打造全自動的AI軟件開發(fā)助理Genie,曾在SWE-Bench測試中獲得全球最高分?jǐn)?shù)。Cosine 研發(fā)了獨有的數(shù)據(jù)管道,能夠生成具有人類工程師開發(fā)邏輯、增量知識、支持搜索的高質(zhì)量數(shù)據(jù)集。同時,Cosine是OpenAI最大的模型微調(diào)合作伙伴,擁有其前沿模型的早期使用權(quán)限。結(jié)合數(shù)據(jù)和模型優(yōu)勢,Cosine已經(jīng)與多家世界500強(qiáng)公司和明星初創(chuàng)公司達(dá)成合作。

客服作為人力密集型工作,也將成為AI Agent最先顛覆的環(huán)節(jié)。比如UpHonest Capital早期投資的Proactive AI 正在為零售品牌打造具有高情感智能語言能力的客服助理,主要幫助企業(yè)向其用戶提供契合品牌調(diào)性和個性化需求的客服服務(wù),目前已與餐飲、健身、沙龍等行業(yè)多家頭部企業(yè)達(dá)成深度合作。

銷售和營銷作為企業(yè)開源的重要入口,企業(yè)利用最新技術(shù)提高獲客效率的意愿也非常高。美國的人工智能初創(chuàng)公司11x,打造AI驅(qū)動的“數(shù)字工作者”以取代傳統(tǒng)的銷售團(tuán)隊,其Agent能夠自主執(zhí)行GTM工作流程。11x不通過軟件幫助企業(yè)降本增效,而是直接提供實在的工作成果,數(shù)字員工能夠自主實現(xiàn)完成的收入閉環(huán)。11x成立6個月就達(dá)到了200萬美金的ARR,目前ARR已經(jīng)達(dá)到了1,000萬美金。FlashIntel正在打造AI驅(qū)動的GTM平臺并向企業(yè)提供AI驅(qū)動的銷售助理(SDR)。FlashIntel在G2 2024冬季報告中總計獲得了189枚徽章,其中FlashRev被評為最佳銷售產(chǎn)品,最佳營銷和數(shù)字廣告產(chǎn)品,以及最高滿意度產(chǎn)品。

② 在數(shù)字化滲透率低的傳統(tǒng)行業(yè)有隱藏的“金礦”

曾經(jīng),傳統(tǒng)行業(yè)的玩家對AI嗤之以鼻,過高的投入成本和微不足道的效果,讓他們難以對AI押注過多。

不過這一次,傳統(tǒng)行業(yè)的生成式AI之路,有可能跳過軟件階段,直接進(jìn)入AI階段,類似新興市場從使用現(xiàn)金直接轉(zhuǎn)向移動支付。

這些行業(yè)本身對于科技的采用速度較慢,生成式AI的出現(xiàn)帶來了直接交付結(jié)果而非交付軟件的模式,減少了前期投入成本、肉眼可見的提升了投資回報率,使得恐懼新技術(shù)的決策者更容易被說服。比如醫(yī)療領(lǐng)域的病例記錄、法律領(lǐng)域的案件報告生成、金融行業(yè)的合規(guī)風(fēng)險篩查等等。

2024年12月,美國家政垂直軟件巨頭ServiceTitan上市,上市當(dāng)天股價漲幅超過40%,在2024年上市公司中,該漲幅僅次于社交平臺Reddit和芯片公司Astera Labs兩家。

要知道,ServiceTitan 2012年成立,歷經(jīng)12年發(fā)展,在僅拿下家政行業(yè)1%市場份額的情況下,其市值一度達(dá)到90億美元。由此可見,美國垂直行業(yè),數(shù)字化滲透速率之低,垂直行業(yè)AI化的價值之高。ServiceTitan之成功,自然使我們關(guān)注到美國傳統(tǒng)行業(yè)的機(jī)會,數(shù)字化滲透率低的傳統(tǒng)行業(yè)。

美國初創(chuàng)公司Sameday為美國家庭服務(wù)行業(yè)(除蟲、HVAC、家庭維修等)提供AI銷售代理,通過自動化的語音客服接聽來電并安排服務(wù)預(yù)約,提高電話接聽率,從而提高轉(zhuǎn)換率,現(xiàn)在已經(jīng)與ServiceTitan集成。Sameday的創(chuàng)始人曾在美國增長最快的家庭服務(wù)行頭部公司擔(dān)任CMO,擁有極深的行業(yè)認(rèn)知和豐富的行業(yè)資源。2024年,Sameday的ARR預(yù)計將增長5倍以上,月度客戶留存率達(dá)98.5%。

建筑行業(yè)的AI解決方案提供商Pantheon,能夠生成高精度且可編輯的 3D 建筑模型,通過AI實現(xiàn)更快的設(shè)計迭代周期可以顯著降低項目成本。Pantheon AI不向建筑師出售軟件許可證,而是直接向房地產(chǎn)開發(fā)商和業(yè)主出售其設(shè)計服務(wù)。2024年10月,Pantheon AI完成了由a16z領(lǐng)投的2500萬美金種子輪融資。

傳統(tǒng)行業(yè)以外,法律、金融、醫(yī)療行業(yè)積累了大量數(shù)據(jù),為行業(yè)垂直基石模型訓(xùn)練提供了豐富的燃料,且法律、金融、醫(yī)療行業(yè)價值高,但普遍在傳統(tǒng)軟件巨頭的壟斷下變化緩慢。即便垂直SaaS一定程度上取代了過時繁瑣的老系統(tǒng),但總體的滲透率依然有限。以醫(yī)療行業(yè)為例,其行業(yè)規(guī)模高達(dá)4.3萬億美元,貢獻(xiàn)了約1/5的美國GDP。但在美國市值前100的上市軟件公司中,只有一家是服務(wù)醫(yī)療行業(yè)的軟件公司。

2024年,Evenup ARR預(yù)計將達(dá)到5000萬美金,最新一輪的投后估值達(dá)到了10億美金。Evenup 利用生成式AI幫助律師進(jìn)行人身損害賠償(Personal Injury Claims)案件的索賠工作。雖然目前只服務(wù)于人身損害賠償這一個領(lǐng)域,但這已經(jīng)是一個非常大的市場了。美國每年約有30萬參與處理人身損害賠償?shù)穆蓭煟磕曛Ц督o受害者的索賠金額高達(dá)1000億美金。

有備而來者,率先享受紅利,那些垂直行業(yè)專家、對行業(yè)的工作流有深入認(rèn)知的創(chuàng)業(yè)者,結(jié)合不斷進(jìn)化的生成式AI基礎(chǔ)設(shè)施,有機(jī)會迅速搶占用戶,構(gòu)建自身的行業(yè)數(shù)據(jù)壁壘。

③ AI不再按席位收費(fèi) :“Sell work, not software”

Menlo Ventures的調(diào)查數(shù)據(jù)顯示,企業(yè)在進(jìn)行生成式AI產(chǎn)品采購決策時,第一考慮要素是產(chǎn)品是否具有簡單可測量的投資回報率,其次是產(chǎn)品是否根據(jù)實際應(yīng)用場景定制。

值得注意的是,現(xiàn)階段,產(chǎn)品價格反而是最不重要的影響因素,僅1%的企業(yè)決策者聲稱產(chǎn)品價格影響采購決策。

數(shù)據(jù)來源:Menlo Ventures

結(jié)果正在變得更為重要。隨著AI的獨立工作能力提升,其工作結(jié)果、創(chuàng)造的價值會更容易被量化,企業(yè)對AI產(chǎn)品的價值評估,也會根據(jù)其工作成果界定,美國投資機(jī)構(gòu)a16z提出。因此,商業(yè)模式變得更加重要。

SaaS時代,SaaS公司創(chuàng)新了按席位收費(fèi)的商業(yè)模式,即按照使用SaaS產(chǎn)品的員工賬號數(shù)量按月或按年收取訂閱費(fèi)用,這種定價方式背后的邏輯是,使用SaaS產(chǎn)品的每位員工,效率會有不同程度的提升、處理更多工作,許多SaaS定價的策略在于評估使用者效率提升創(chuàng)造的收益。

但到了生成式AI時代,這個SaaS時代一直以來賴以生存的邏輯正在被顛覆。隨著Copilot產(chǎn)品向Agent產(chǎn)品的升級,未來的Agentic AI系統(tǒng)將在不同AI agents的相互配合下,自動完成任務(wù),取代越來越多的工作者,顯然,如果繼續(xù)按照席位收費(fèi),開發(fā)者的收入則會逐漸減少。

Benchmark合伙人最先建議生成式AI公司“Sell work, not software”,即按照工作成果收費(fèi),打破按席位收費(fèi)的模式。

基于此,目前原生AI公司普遍采取的商業(yè)模式分為兩類,一類是基于用量的定價模式,Salesforce發(fā)布的Agent force智能體系統(tǒng),提供客服、銷售、員工服務(wù)等AI agent智能體,按照用戶與agent實際交互的用量收費(fèi),每次”對話“收費(fèi)2美元,如果發(fā)生以下三種情況之一,即視為一次”對話“結(jié)束—— AI agent無法滿足用戶需求,需要人工介入;用戶主動結(jié)束與AI agent對話;用戶超過24小時沒有再主動與AI agent對話。

另一類是基于工作結(jié)果的定價模式,前Salesforce聯(lián)席CEO Bret Taylor創(chuàng)立的AI客服公司Sierra,為客戶提供基于工作結(jié)果收費(fèi)的客服AI agent,從消費(fèi)者滿意度、問題解決程度、以及每次的交互成本三方面來評估工作結(jié)果,決定企業(yè)付費(fèi)規(guī)模。采用按照工作結(jié)果定價的模式,實現(xiàn)了AI agent企業(yè)客戶與開發(fā)公司的利益一致性,雙方將共同得益于agent獨立任務(wù)完成能力的提升。

趨勢二:等待一個“殺手級”AI消費(fèi)級應(yīng)用

“2025年(AI應(yīng)用)下一個大事件屬于消費(fèi)。”美國紅杉資本合伙人Jess Lee表示,AI聊天、圖片、視頻已驗證了其消費(fèi)市場潛力,接下來將看到全新的AI消費(fèi)社交APP、新形式的互動媒體、基于聊天的游戲、新的搜索和信息整合工具、基于互動式UI的聊天工具等?!?/p>

消費(fèi)賽道,一直是歷次技術(shù)創(chuàng)新浪潮下創(chuàng)業(yè)者和投資人高度關(guān)注的方向,如果回顧之前的技術(shù)周期會發(fā)現(xiàn),全球市值Top15的科技公司中,有9家是從To C消費(fèi)產(chǎn)品起家的。To C的公司上市時,估值超過100億美元的比例,比To B公司高10%左右。

但在這一波生成式AI創(chuàng)業(yè)浪潮中,消費(fèi)AI應(yīng)用似乎在被創(chuàng)業(yè)者和資本遺忘。2024年,90%以上的A輪融資流向AI企業(yè)應(yīng)用。

不過,自2024年下半年以來,這個現(xiàn)象正在發(fā)生改變。

2024下半年以來,資本市場對消費(fèi)級AI應(yīng)用的關(guān)注度上升,以硅谷孵化器Y Combinator 為例,其下半年孵化的消費(fèi)級AI產(chǎn)品數(shù)量比上半年翻番。

數(shù)據(jù)來源:Y Combinator, UpHonest Capital整理

2025年,消費(fèi)級AI應(yīng)用的“土地”正在被開墾,行業(yè)在等待一個“殺手級”AI消費(fèi)的應(yīng)用。風(fēng)險投資機(jī)構(gòu)也對消費(fèi)級AI應(yīng)用的機(jī)會產(chǎn)生共識。YC Partner Michael Seibel表示,目前太多創(chuàng)始人尋找B2B的AI機(jī)會,太少人探索消費(fèi)側(cè)的機(jī)會,消費(fèi)創(chuàng)業(yè)者的機(jī)會來了;a16z提出“生成式AI或?qū)⒅厮軓穆糜?、心理治療到網(wǎng)購等一切(消費(fèi)行為)。“前Index Ventures合伙人Rex Woodbury,稱現(xiàn)在是“消費(fèi)復(fù)興”的機(jī)會。

生成式AI對消費(fèi)端改變,體現(xiàn)在三個層面:首先,AI會逐漸改變?nèi)伺c人、人與信息交互的方式,形成新的流量入口;其次,AI搜索正在改變信息的分發(fā)方式,會創(chuàng)造新的商業(yè)機(jī)會;第三,AI釋放PGC、UGC內(nèi)容創(chuàng)作潛力,使內(nèi)容消費(fèi)更加豐富多元。

以AI搜索為例,作為線上流量的第一入口,已經(jīng)久無戰(zhàn)事,生成式AI引入了新變量。2020年創(chuàng)立的生成式AI搜索初創(chuàng)You.com,近期完成5000萬美元融資,價值7億美元了。OpenAI在7月發(fā)布AI搜索工具SearchGPT,其付費(fèi)用戶均可使用。

Perplexity是一家成立于2022年8月的美國AI創(chuàng)業(yè)公司,公司由前OpenAI研究科學(xué)家Aravind Srinivas和前Meta研究科學(xué)家Denis Yarats等聯(lián)合創(chuàng)立,專注于開發(fā)基于人工智能的對話式搜索引擎,旨在通過大型語言模型(如GPT-4和LLama2)為用戶提供精準(zhǔn)的搜索結(jié)果。Perplexity的界面更像是聊天屏幕,用戶可以通過自然語言提問,Perplexity會提供直接的答案,并附上詳細(xì)的引用來源,Perplexity 的用戶增長非常迅速。2023年2月,Perplexity的月訪問量達(dá)到1000萬,獨立訪客達(dá)到200萬人。截至2024年4月,Perplexity 的月活躍用戶數(shù)便突破了1500萬。Perplexity在短時間內(nèi)完成了多輪融資。截至2024年11月,Perplexity在新一輪融資中籌集了5億美元,使公司估值達(dá)到90億美元。投資方包括軟銀、亞馬遜創(chuàng)始人貝索斯和英偉達(dá)等多家知名企業(yè)和AI領(lǐng)域知名人士。

除了通用搜索引擎,生成式AI使垂直領(lǐng)域的搜索引擎更普遍,瓜分通用搜索引擎的注意力。例如,垂直于企業(yè)知識數(shù)據(jù)庫的搜索——Glean在9月份完成新一輪融資,估值達(dá)到46億美元,旨在優(yōu)化企業(yè)內(nèi)部數(shù)據(jù)檢索和問題答復(fù),在近兩年中ARR翻倍增長;亞馬遜、沃爾瑪都在加強(qiáng)電商搜索引擎建設(shè),今年先發(fā)搜索助手,再發(fā)Agent。初創(chuàng)企業(yè)DayDream種子輪拿到了5000萬美元投資,F(xiàn)orerunner、Index聯(lián)合領(lǐng)投。DayDream鏈接了超過2000+品牌,支持自然語言檢索,根據(jù)用戶提供的時間、地點、場合等信息給予相關(guān)產(chǎn)品推薦。Encore,YC24新一期孵化項目,是一個LLM驅(qū)動的針對二手商品購物的搜索引擎,鏈接美國多個二手商品網(wǎng)站,支持自然語言搜索以及按照主題的搜索;垂直于科研場景的搜索:初創(chuàng)企業(yè)Consensus與Perplexity有共同的投資人Nat Friedman和Daniel Gross,專注打造服務(wù)科研的搜索引擎,改變?nèi)藗儷@取和使用學(xué)術(shù)文獻(xiàn)的方式。2024年收入增長了600%,月活40萬用戶,ARR近200萬美元。

也許明年會出現(xiàn)更多令人眼前一亮的垂直領(lǐng)域的AI搜索創(chuàng)新。

這一點,美國紅杉在2025年的AI趨勢預(yù)測中也分享了一些思考,紅杉提出AI搜索或?qū)⒊蔀?025年的”殺手級“應(yīng)用,他們提出了兩點預(yù)測:目前一個整體的搜索市場可能會碎片化,未來每個人可能會有專業(yè)AI搜索引擎——例如,Perplexity可能會成為投資人和分析師的第一搜索工具選擇,律師選擇Harvey,醫(yī)生選擇OpenEvidence……全新的生成式AI搜索引擎將緊密契合目標(biāo)用戶的“心智模式”,投資人、律師、醫(yī)生的思維模式各不相同,信息獲取模式、目的和決策思維各有差異,這些不同和差異就是生成式AI搜索引擎創(chuàng)新的機(jī)會;消費(fèi)級和企業(yè)級應(yīng)用場景分化,每位知識工作者每天至少會使用兩款A(yù)I搜索引擎 —— 一款用于工作,另一款用于其他所有事務(wù)。

除了AI搜索,落到電商、音樂、社交、游戲、旅行和教育等直接To C的領(lǐng)域中,也各有生成式AI原生應(yīng)用的創(chuàng)新機(jī)會。

以旅行為例,Wanderboat是面向消費(fèi)者的AI旅行規(guī)劃工具,也是旅游內(nèi)容分享社區(qū)。它構(gòu)建了一個chatbot,可以根據(jù)用戶需求推薦、定制目的地及各類娛樂體驗活動,還可以主動學(xué)習(xí)用戶的興趣,定制專屬行程?;趧?chuàng)始人此前在微軟的經(jīng)驗,構(gòu)建了一些很有趣的小工具,比如用戶在查看地圖時也可以與AI互動,實時獲取一些信息和建議。在零付費(fèi)推廣的情況下,月活用戶數(shù)量達(dá)到了6位數(shù)。

一是多模態(tài)AI營銷,從文字延展到音頻、視頻。形式從單點的chatbot延展到具有操作執(zhí)行能力的agent,并且準(zhǔn)確率和對于邊緣案例的覆蓋力隨著基石模型推理能力的提升增強(qiáng)。此外,如果生成式AI運(yùn)用得當(dāng),銷售、營銷、客服對消費(fèi)者的洞察進(jìn)一步提高,可以創(chuàng)造更加個性化的服務(wù)、定制化體驗。

GigaML是YC孵化的一家AI客服初創(chuàng),雖然這個方向競爭激勵,但實際GenAI應(yīng)用的滲透率還比較低,因為客服在實際工作中有許多邊緣案例,現(xiàn)在大部分的GenAI應(yīng)用解決邊緣案例的表現(xiàn)一般,原有的自動化客服足以解決基礎(chǔ)問題,所以企業(yè)升級的動力不足。GigaML發(fā)現(xiàn)將基石模型切換至o1-preview,加上大量的評估、調(diào)優(yōu)之后,錯誤率大幅下降,從70%降至5%,并能夠解決8成的邊緣案例。在OpenAI最新推理模型加持下,客服用例值得期待。

Para和HeyGen分別是聲音和視頻營銷的典型案例,Para利用AI生成個性化定制的聲音營銷電話,幫助品牌激活用戶,幫助球隊活躍粉絲;HeyGen的AI視頻營銷收入快速增長,據(jù)悉今年的年化ARR超過2000萬美元,估值已達(dá)到5億美元。

AdsGency則是一個利用AI用戶數(shù)據(jù)洞察,實現(xiàn)精準(zhǔn)廣告營銷的公司,創(chuàng)始人此前曾在滴滴、亞馬遜從事廣告、營銷相關(guān)的產(chǎn)品工作。它的業(yè)務(wù)核心是廣告和用戶數(shù)據(jù),為客戶提供了一個全棧AI營銷工具,覆蓋內(nèi)容創(chuàng)意、創(chuàng)作、投放、歸因等流程。AdsGency也代表了現(xiàn)在AI營銷的一個發(fā)展趨勢—— 從Point Solution,到整個GTM的全流程自動化解決方案。

趨勢三:企業(yè)應(yīng)用大模型朝模塊化方向發(fā)展

2024年,人工智能領(lǐng)域的一個顯著趨勢是模型的可組合性和模塊化發(fā)展,這種模塊化實現(xiàn)了從概念到規(guī)?;芈涞亍F髽I(yè)不再僅依賴于單一的“大模型”解決方案,而是可以根據(jù)具體需求,將不同的模塊進(jìn)行組合,定制出符合自己業(yè)務(wù)需求的能力。這種靈活性不僅能夠提升效率,還能降低成本,并且更好地滿足各行業(yè)對AI應(yīng)用的多樣化需求。

在技術(shù)架構(gòu)層面,傳統(tǒng)“大一統(tǒng)”的大模型被逐步拆解為功能與場景模塊,例如Amazon Bedrock提供了一系列生成AI的模塊化服務(wù),涵蓋文本生成、圖像生成、語音合成等功能,這些模塊化的服務(wù)可以幫助企業(yè)根據(jù)自己的需求進(jìn)行定制,支持跨行業(yè)的AI應(yīng)用,如生成個性化的營銷文案、產(chǎn)品推薦和自動化客服對話等服務(wù)。微軟推出了更加精細(xì)化的模塊化API,支持更加多樣化的場景,例如多語言客服、智能會議助手和自動化客戶反饋系統(tǒng)。Transformer論文八位作者之一Aidan Gomez也瞄準(zhǔn)這一方向,估值55億美元的Cohere提供專為企業(yè)用例優(yōu)化的系列AI模型,在語言生成、多語言處理、多模態(tài)、語義檢索等方面各有所長,企業(yè)按需選擇、組合。

2025年,模塊化和抽象化設(shè)計將在多個領(lǐng)域得到廣泛應(yīng)用,特別是在人工智能和機(jī)器學(xué)習(xí)領(lǐng)域。這種設(shè)計方式將推動AI系統(tǒng)的高效演化和自適應(yīng)能力,為AI技術(shù)的廣泛應(yīng)用提供更強(qiáng)大的支持。根據(jù)Gartner預(yù)測,到2028年,至少15%的日常工作決策將通過代理AI自主做出。

這種趨勢表明,模塊化和抽象化設(shè)計將為AI系統(tǒng)的自主決策提供更強(qiáng)大的支持,推動AI技術(shù)的廣泛應(yīng)用。并且,更多的技術(shù)企業(yè)將推出專為行業(yè)需求定制的AI模塊。例如,針對智能制造、智慧醫(yī)療、自動駕駛等領(lǐng)域的具體需求,可能會出現(xiàn)更加精細(xì)化的模塊組合,企業(yè)可根據(jù)自己的數(shù)據(jù)和業(yè)務(wù)需求靈活選擇。而且隨著硬件能力的提升,這些模塊可能會更加高效,甚至實現(xiàn)更高的跨領(lǐng)域協(xié)同能力。總之,這種模塊化大模型的發(fā)展將向縱深推進(jìn),技術(shù)、商業(yè)與社會的多重博弈將重塑行業(yè)格局。

#05 總結(jié)

這場科技商業(yè)史上最大“賭局”,讓身處其中的投資者越來越感受到了曾經(jīng)硅谷早期的投資氛圍——押注一個未知的全新技術(shù)、等待一個超長回報周期,而不是基于互聯(lián)網(wǎng)成熟技術(shù)的模式創(chuàng)新上迅速迭代和回血。

自從ChatGPT發(fā)布之后,硅谷正在吸引全球的目光。關(guān)注硅谷發(fā)生的故事,正在成為眾多的中國投資者甚至中國企業(yè)員工、公關(guān)必做的事,大家試圖從這些持續(xù)關(guān)注中獲得最前沿的信息和生成式AI最前線所發(fā)生的故事,從而試圖判斷新的商業(yè)方向。

誰也不知道這場生成式AI的變革會將商業(yè)引向何方,也同樣預(yù)測不到新技術(shù)的迭代如此之快。

在過去的幾年里,聽到最多的便是企業(yè)對生成式AI的抱怨“我們知道它重要,但我們?nèi)匀徊恢廊绾斡迷谧约旱膱鼍爸小?,這種抱怨帶著一些敬畏——“不上大模型一定會被淘汰”。投資者在不斷推高的估值和融資中,快要喪失信心。動輒幾十億美金的融資,再加上Scaling Law之下,不斷增加的數(shù)據(jù)中心的投資,讓他們望而卻步。這也表明,2025年將是生成式AI讓人們看到賺錢希望的一年,投資者和創(chuàng)業(yè)者同樣需要信心。

AI Agent元年,這個發(fā)端于學(xué)術(shù)界的概念將會落到實際,并產(chǎn)生價值,企業(yè)將會使得生成式AI變得更加好用,并切實轉(zhuǎn)化為價值。與此同時,消費(fèi)級的AI應(yīng)用將會讓人們切實感受到生成式AI帶來的生活的變化。

垂直領(lǐng)域的模型正在成為通用大模型的補(bǔ)充,讓更多企業(yè)釋放AI的價值。垂直行業(yè)中,將會出現(xiàn)越來越多的AI搜索應(yīng)用,滿足人們不同領(lǐng)域的需求。

2025年,從生成式AI來說,一些泡沫會破滅,一些企業(yè)能夠從中賺到錢。技術(shù)新陳代謝快速而殘酷,這場競爭中沒有老手,都是新人,昔日的領(lǐng)軍者亦有可能跌落神壇,最先關(guān)注到技術(shù)和商業(yè)的變化,并做出行動的企業(yè),才能在這場競爭中生存下來。

*【免責(zé)聲明】本篇內(nèi)容并非投資意見,為便于理解,該報告匯總了相關(guān)領(lǐng)域的典型企業(yè)案例作為參考,但所含相關(guān)公司資料不構(gòu)成任何投資產(chǎn)品之要約或者建議,只作為一般參考資料用途。

作者:王子、顧程來、Evan、李海丹 編輯:李海丹

本文由人人都是產(chǎn)品經(jīng)理作者【硅兔賽跑】,微信公眾號:【硅兔賽跑】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于 CC0 協(xié)議。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!