搶人、搶數(shù)據(jù),AI原生應(yīng)用“難產(chǎn)”困局

0 評論 2800 瀏覽 2 收藏 13 分鐘

國內(nèi)已經(jīng)涌現(xiàn)出了數(shù)量相對龐大的大模型,而與之相對的,基于大模型的應(yīng)用產(chǎn)品數(shù)量卻仍然較少。這也牽扯出一個(gè)問題,即AI原生應(yīng)用的發(fā)展,究竟面臨著哪些困局?一起來看看這篇文章的解讀與分析。

自ChatGPT發(fā)布以來,大模型風(fēng)潮在國內(nèi)外如雨后春筍般涌現(xiàn)。

從百模大戰(zhàn)的火熱到如今對原生應(yīng)用的推崇,短短一年間,大模型經(jīng)歷了千山萬水的“奇妙征程”。

2023年3月16日,百度率先發(fā)布首個(gè)和ChatGPT競爭的大模型“文心一言”,截至10月,國內(nèi)已經(jīng)涌現(xiàn)出了238個(gè)大模型,幾乎每一天都有新的大模型問世。2023年第一季度,超過17萬家中國AI企業(yè)如涌泉般冒了出來。

然而,與競爭激烈的賽道形成鮮明對比的是,基于大模型的應(yīng)用產(chǎn)品卻寥寥無幾。

過去幾個(gè)月,無數(shù)互聯(lián)網(wǎng)巨頭反復(fù)強(qiáng)調(diào)AI原生應(yīng)用的重要性。百川智能創(chuàng)始人、CEO 王小川認(rèn)為,大模型的創(chuàng)業(yè)核心,是好技術(shù)如何匹配產(chǎn)品;360集團(tuán)創(chuàng)始人周鴻祎表示,360的人工智能戰(zhàn)略用四個(gè)字形容就是“兩翼齊飛”,先占據(jù)應(yīng)用場景,同步全力發(fā)展核心算法技術(shù);李彥宏更是直言不諱:“中國的大模型很多,但是基于大模型開發(fā)出來的AI原生應(yīng)用卻非常少?!?/p>

其實(shí)大廠們也并非“光說不練”,今年下半年,百度一口氣發(fā)布超過20款A(yù)I原生應(yīng)用;騰訊云推出高性能應(yīng)用服務(wù) HAI,號稱10分鐘開發(fā)專屬AI應(yīng)用;字節(jié)跳動(dòng)成立新部門Flow發(fā)力AI應(yīng)用層……但事實(shí)是,截至目前,相比國外動(dòng)輒千百個(gè)大熱的AI原生應(yīng)用,國內(nèi)真正稱得上火熱的應(yīng)用仍然“難產(chǎn)”。

如此現(xiàn)狀不得不讓人追問,AI原生應(yīng)用,究竟還要跨過幾道坎?

一、變現(xiàn)之難:賺取真金白銀的門檻提高

如何賺錢,是每一家人工智能公司無法回避的問題。

身處大模型賽道,即使是“家大業(yè)大”的大廠,也面臨著“大象難以轉(zhuǎn)身”的問題。零一萬物CEO李開復(fù)曾表示,大廠的優(yōu)勢是資源多、GPU多、人多、錢多、數(shù)據(jù)多,但大廠們有一個(gè)挑戰(zhàn):很難放棄已有的商業(yè)模式。

“開發(fā)一個(gè)新應(yīng)用需要克服兩個(gè)主要問題:一是要超越已有的大型應(yīng)用,這非常困難;二是要開發(fā)新的應(yīng)用取代舊的應(yīng)用,就像一家公司很難在擁有QQ的同時(shí)再開發(fā)一個(gè)微信一樣,因?yàn)橐延械钠脚_價(jià)值巨大,不愿意放棄。在這種情況下,創(chuàng)業(yè)公司雖然沒有豐富的資源,但他們的優(yōu)勢在于沒有歷史包袱。

然而,創(chuàng)業(yè)者們的處境同樣艱難,事實(shí)證明,像OpenAI那樣直接面向C端用戶的模式,在國內(nèi)市場面臨著巨大的挑戰(zhàn),因?yàn)閲鴥?nèi)C端用戶的付費(fèi)意愿相對較弱。因此,更多的大模型創(chuàng)業(yè)公司選擇為特定垂直行業(yè),如醫(yī)療、金融、法律等開發(fā)專門的解決方案,為不同行業(yè)提供定制化的大模型服務(wù),為B端客戶提供服務(wù)并收取費(fèi)用。

這些公司需要面對To B型產(chǎn)品的固有問題,包括依賴高續(xù)約率、回款周期長等,對于“燒錢如燒紙”的大模型賽道,無疑提高了門檻。

北京開放傳神科技有限公司創(chuàng)始人、CEO陳冉在接受媒體采訪時(shí)表示,國內(nèi)應(yīng)用都在試圖產(chǎn)生價(jià)值,但很少實(shí)現(xiàn)盈利,做數(shù)字人的“小作坊”倒是真掙錢了。

更雪上加霜的是,隨著企業(yè)在大模型領(lǐng)域布局的時(shí)間越長,需要的資本就越多,融資輪次越多,投資人對于企業(yè)在技術(shù)實(shí)力和盈利轉(zhuǎn)化能力方面的要求就越嚴(yán)苛。

多位接受《IT時(shí)報(bào)》采訪的業(yè)內(nèi)人士表示,當(dāng)前投資人對于大模型賽道初創(chuàng)公司的熱情正在“降溫”。與過去“井噴期”投資者慷慨解囊不同,現(xiàn)在投資者在考慮投資大模型項(xiàng)目時(shí),會對市場需求、技術(shù)實(shí)力、商業(yè)模式以及團(tuán)隊(duì)能力等方面進(jìn)行更為全面的評估,他們對于“投概念”和“產(chǎn)生收入”的容忍期正在縮短。

量子位智庫發(fā)布的《2023十大AI商業(yè)落地趨勢》顯示,今年上半年,國內(nèi)約有二十家大模型公司獲得超過60億元的融資,全球金額占比僅為6%,國內(nèi)實(shí)際交易金額較少。

“目前的環(huán)境是雷聲大雨點(diǎn)小,公司多收入少。”北京醫(yī)者信息科技有限公司CEO劉呈輝此前在接受《IT時(shí)報(bào)》記者采訪時(shí)表示,國內(nèi)應(yīng)用層能產(chǎn)生實(shí)際應(yīng)用和實(shí)際收入的場景和公司還非常少,相比之下,有自己的垂直模型、場景能掙到錢的公司,才能真正獲得投資者青睞。

二、數(shù)據(jù)之爭:高質(zhì)量數(shù)據(jù)成本高、獲取難

近日,谷歌發(fā)布的Gemini新模型陷入數(shù)據(jù)使用爭議,據(jù)稱其中文部分使用了文心一言進(jìn)行訓(xùn)練,這一事件引發(fā)了全球關(guān)于大模型數(shù)據(jù)短缺問題的廣泛討論。

圖源:谷歌

無論是原生應(yīng)用還是其底層基礎(chǔ)大模型,數(shù)據(jù)至關(guān)重要。然而,高質(zhì)量的語料匱乏已成為限制這一領(lǐng)域發(fā)展的關(guān)鍵瓶頸之一。

業(yè)內(nèi)人士指出,盡管公有數(shù)據(jù)如互聯(lián)網(wǎng)上的信息易于獲取,但質(zhì)量和針對性往往難以滿足專業(yè)模型的需求。

相比之下,私有數(shù)據(jù)具有高度的專業(yè)性和針對性,對于訓(xùn)練精準(zhǔn)的垂直類模型具有極高的價(jià)值。

以醫(yī)療數(shù)據(jù)為例,獲取高質(zhì)量的數(shù)據(jù)集至關(guān)重要,但由于醫(yī)療數(shù)據(jù)的獲取和標(biāo)注需要大量的人力、物力和時(shí)間,因此其成本相對較高,獲取的渠道也十分有限。這類數(shù)據(jù)不僅難以在互聯(lián)網(wǎng)上找到,而且由于涉及個(gè)人隱私,獲取和使用也需遵守嚴(yán)格的法規(guī)和倫理標(biāo)準(zhǔn)。

浦因科技(上海)有限公司首席科學(xué)家秦興虎告訴《IT時(shí)報(bào)》記者,在其所負(fù)責(zé)的醫(yī)學(xué)大模型項(xiàng)目中,團(tuán)隊(duì)初期購買了英國生物銀行的公共數(shù)據(jù)進(jìn)行大模型訓(xùn)練,這些數(shù)據(jù)主要來自歐洲人群。為確保模型在國內(nèi)的普適性,他們還需要使用中國人群的數(shù)據(jù)來更新和訓(xùn)練模型,這在無形中增加了項(xiàng)目成本。

對于國內(nèi)企業(yè)而言,他們還面臨著即使有錢也難以購買到合適數(shù)據(jù)的困境。中文語料庫的內(nèi)容相對匱乏,進(jìn)一步加劇了數(shù)據(jù)獲取的挑戰(zhàn)。

因此,對于企業(yè)來說,如何合法、有效地獲取和使用高質(zhì)量數(shù)據(jù),將其轉(zhuǎn)化為模型訓(xùn)練、開發(fā)AI原生應(yīng)用的寶貴資源,確實(shí)是一個(gè)重要的戰(zhàn)略問題。

五、人才之困:5個(gè)崗位爭奪2個(gè)人才

AI原生應(yīng)用作為大模型產(chǎn)業(yè)的核心產(chǎn)品,在研發(fā)和落地試錯(cuò)過程中面臨諸多不確定性。人才成為決定成功與否的關(guān)鍵因素,也成了現(xiàn)階段大模型競爭中的重要砝碼。

關(guān)于國內(nèi)人工智能人才的儲備,回顧中國的大模型產(chǎn)業(yè)發(fā)展史,可以發(fā)現(xiàn)“清華系”的身影無處不在。

當(dāng)國內(nèi)對人工智能的研究還是一片空白的時(shí)期,清華大學(xué)最早開出的人工智能課程,也孕育出了目前國內(nèi)人工智能領(lǐng)域的熠熠群星。無論是王小川還是智浦AI聯(lián)合創(chuàng)始人唐杰,抑或欲打造“中國版OpenAI”光年之外的原美團(tuán)聯(lián)合創(chuàng)始人王慧文,都來自這里。

在此輪大模型創(chuàng)業(yè)背后的投資方中,“清華系”的創(chuàng)投者們也頗為矚目,包括圖靈創(chuàng)投、卓源資本、清華控股、水木清華校友種子基金、無限基金SEE Fund等清華系創(chuàng)投機(jī)構(gòu)也頻頻出手。

盡管如此,必須看到的是,由于大模型技術(shù)門檻較高,國內(nèi)大模型人才主要分布在少數(shù)頂尖高校和科研機(jī)構(gòu),人才短缺問題日益嚴(yán)重,許多創(chuàng)業(yè)公司甚至面臨著招聘困難。

“現(xiàn)在國內(nèi)做基座類模型的人才90%都出自清華,國內(nèi)真正會調(diào)模型、訓(xùn)練模型的甚至不超過200個(gè)人。”劉呈輝表示,由于行業(yè)本身的人才儲備有限,加上大模型的突然“火爆”,人才短缺問題顯得尤為突出,如果不在高校具備一定的人才資源,創(chuàng)業(yè)公司連招人都會變得很困難。

知名咨詢公司麥肯錫一份關(guān)于人工智能的報(bào)告顯示,預(yù)計(jì)2030年中國對AI專業(yè)人員的需求將增至2022年的6倍,人才缺口將達(dá)到400萬人。

據(jù)脈脈高聘11月發(fā)布的《2023人工智能人才洞察》報(bào)告顯示,2023年1—8月,人工智能新發(fā)崗位量已與2022年全年持平。2022年人工智能行業(yè)人才供需比為0.63,而2023年1—8月下探至0.39,相當(dāng)于5個(gè)崗位要爭奪2個(gè)人才。

圖源:脈脈高聘

可以看到,AI原生應(yīng)用“難產(chǎn)”的背后,面臨著變現(xiàn)之難、數(shù)據(jù)之爭和人才之困等多重挑戰(zhàn)。Gartner發(fā)布的《2023年中國數(shù)據(jù)分析和人工智能技術(shù)成熟度曲線》指出,當(dāng)前國內(nèi)生成式AI技術(shù)仍處于“期望膨脹期”。只有當(dāng)整個(gè)AI行業(yè)在“期望膨脹期”中保持謹(jǐn)慎,才能意識到將大模型的潛能轉(zhuǎn)化為創(chuàng)新應(yīng)用尚需克服不小的挑戰(zhàn)。

作者:賈天榮,編輯:潘少穎,孫妍

來源公眾號:IT時(shí)報(bào)(ID:vittimes),做報(bào)紙,也懂互聯(lián)網(wǎng)。

本文由人人都是產(chǎn)品經(jīng)理合作媒體 @IT時(shí)報(bào) 授權(quán)發(fā)布,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于 CC0 協(xié)議

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!