光速美國(guó):AI基礎(chǔ)設(shè)施層的未來在哪

0 評(píng)論 2205 瀏覽 4 收藏 11 分鐘

自 OpenAI 今年四月份推出 GPT-4 以來,越來越多的模型開源,AI 信徒們的關(guān)注點(diǎn)也正在從模型轉(zhuǎn)移到應(yīng)用。Lightspeed 最新文章對(duì) AI 模型的發(fā)展趨勢(shì)進(jìn)行了推演,提出未來的大模型將分為三類模型,并結(jié)構(gòu)化給出模型層面的可能機(jī)會(huì)梳理。本期內(nèi)容帶給大家模型基礎(chǔ)設(shè)施層包括 AI Ops 中間層的發(fā)展趨勢(shì)與機(jī)會(huì)思考。

在過去的十年里,美國(guó)老牌基金 Lightspeed 一直在 AI/ML 領(lǐng)域與杰出的公司、他們建立的平臺(tái)以及他們服務(wù)的客戶合作,以更好地了解企業(yè)是如何思考 Gen-AI 的。具體來說, Lightspeed 研究了基礎(chǔ)模型生態(tài)系統(tǒng),并提出了如“最好的模型會(huì)有贏者通吃的動(dòng)態(tài)嗎?”和“企業(yè)的使用案例都默認(rèn)調(diào)用 OpenAI 的 API,還是實(shí)際使用會(huì)更多樣化?”等問題。這些答案將決定這個(gè)生態(tài)系統(tǒng)的未來增長(zhǎng)方向,以及能源、人才和資金的流動(dòng)方向。

一、模型生態(tài)系統(tǒng)分類

根據(jù)我們的學(xué)習(xí),我們相信 AI 中即將出現(xiàn)一場(chǎng)模型的寒武紀(jì)大爆發(fā)。開發(fā)者和企業(yè)會(huì)選擇最適合“要完成的任務(wù)”的模型,盡管在探索階段的使用可能看起來更為集中。企業(yè)采納的可能路徑是使用大型模型進(jìn)行探索,隨著他們對(duì)使用案例的了解逐漸增加,逐漸轉(zhuǎn)移到生產(chǎn)時(shí)使用的較小的專用(調(diào)整+提煉)模型。下圖概述了我們?nèi)绾慰创A(chǔ)模型生態(tài)系統(tǒng)的演變。

AI 模型版圖可分為 3 個(gè)主要、可能會(huì)有重疊的類別:

類別一:“大腦”模型

這些是最好的模型,代表著模型的最前沿。這是那些令人興奮的神奇演示的來源。開發(fā)者在嘗試探索 AI 為他們的應(yīng)用程序所能做到的極限時(shí),通常首先考慮的是這些模型。這些模型的訓(xùn)練成本高,維護(hù)和擴(kuò)展復(fù)雜。但是同一個(gè)模型可以參加 LSAT、MCAT、為您寫高中論文,并作為聊天機(jī)器人與您互動(dòng)。開發(fā)者目前正在這些模型上進(jìn)行實(shí)驗(yàn),并評(píng)估 AI 在企業(yè)應(yīng)用程序中的使用。

但是,通用模型使用起來昂貴、且推理延遲高,并且對(duì)于定義明確的有約束的使用案例可能是過度的。第二個(gè)問題是這些模型是通才,可能在專業(yè)任務(wù)上不太準(zhǔn)確。(可參考這篇 Cornell 的論文) 最后,在幾乎所有情況下,它們也是黑盒子,對(duì)于正努力利用這些模型而不放棄其數(shù)據(jù)資產(chǎn)的企業(yè)來說,這可能會(huì)帶來隱私和安全挑戰(zhàn)。OpenAI、Anthropic、Cohere 是一些公司實(shí)例。

類別二:“挑戰(zhàn)者”模型

這些也是高能力的模型,其技能和能力僅次于前面的通用大模型。Llama 2 和 Falcon 是這一類別中的最佳代表。它們通常與從訓(xùn)練通用模型的公司出來的 Gen“N-1” 或 “N-2” 模型一樣好。例如,根據(jù)某些基準(zhǔn),Llama2 與 GPT-3.5-turbo 一樣好。在企業(yè)數(shù)據(jù)上調(diào)整這些模型可以使它們?cè)谔囟ㄈ蝿?wù)上與第一類通用大模型一樣好。

其中許多模型是開源的(或接近),一旦發(fā)布,便立即帶來了開源社區(qū)的改進(jìn)和優(yōu)化。

類別三:“長(zhǎng)尾”模型

這些是“專家”模型。它們被建造用來為一個(gè)具體的目的服務(wù),比如分類文檔、識(shí)別圖像或視頻中的特定屬性、識(shí)別業(yè)務(wù)數(shù)據(jù)中的模式等。這些模型靈活,訓(xùn)練和使用成本低,可以在數(shù)據(jù)中心或邊緣運(yùn)行。

簡(jiǎn)單瀏覽 Hugging Face 就足以了解這個(gè)生態(tài)系統(tǒng)現(xiàn)在和未來的龐大規(guī)模,因?yàn)樗?wù)的使用案例范圍非常廣泛。

二、基礎(chǔ)適配與實(shí)用案例

盡管仍然處于早期階段,但我們已經(jīng)看到一些領(lǐng)先的開發(fā)團(tuán)隊(duì)和企業(yè)已經(jīng)以這種細(xì)致的方式思考生態(tài)系統(tǒng)。人們希望將使用與最佳可能的模型相匹配。甚至使用多個(gè)模型來服務(wù)一個(gè)更復(fù)雜的使用案例。

評(píng)估哪個(gè)模型/模型用于使用的因素通常包括以下內(nèi)容:

  • 數(shù)據(jù)隱私和合規(guī)性要求:這影響了模型是否需要在企業(yè)基礎(chǔ)設(shè)施中運(yùn)行,或者數(shù)據(jù)是否可以發(fā)送到外部托管的推理端點(diǎn)
  • 模型是否允許微調(diào)
  • 所需的推理“性能”級(jí)別(延遲、精度、費(fèi)用等)

然而,實(shí)際上要考慮的因素往往比上面列出的要長(zhǎng)得多,反映了開發(fā)者希望用 AI 實(shí)現(xiàn)的使用案例的巨大多樣性。

三、機(jī)會(huì)在哪里?

1. 模型評(píng)估框架:企業(yè)將需要獲得工具和專業(yè)知識(shí),以幫助評(píng)估針對(duì)哪種用例使用哪種模型。開發(fā)人員需要決定如何以最佳方式評(píng)估特定模型是否適合 “待完成的工作”。評(píng)估需要考慮多個(gè)因素,不僅包括模型的性能,還包括成本、可實(shí)施的控制水平等。

2. 運(yùn)行和維護(hù)模型:幫助企業(yè)訓(xùn)練、微調(diào)和運(yùn)行模型(尤其是第三類長(zhǎng)尾模型)的平臺(tái)將會(huì)出現(xiàn)。傳統(tǒng)上,這些平臺(tái)被廣泛稱為 ML Ops 平臺(tái),我們預(yù)計(jì)這一定義也將擴(kuò)展到生成式人工智能。諸如 Databricks、Weights and Biases、Tecton 等平臺(tái)都在迅速朝這個(gè)方向發(fā)展。

3. 增強(qiáng)系統(tǒng):模型,尤其是托管的 LLM,需要檢索增強(qiáng)生成以提供理想的結(jié)果。這就需要做出一系列輔助決策,包括

  • 數(shù)據(jù)和元數(shù)據(jù)提取:如何連接到結(jié)構(gòu)化和非結(jié)構(gòu)化的企業(yè)數(shù)據(jù)源,然后提取數(shù)據(jù)以及訪問策略等元數(shù)據(jù)。
  • 數(shù)據(jù)生成和存儲(chǔ)嵌入:使用哪種模型為數(shù)據(jù)生成嵌入。然后如何存儲(chǔ)它們:使用哪種矢量數(shù)據(jù)庫(kù),特別是基于所需的性能、規(guī)模和功能?

現(xiàn)在有機(jī)會(huì)建立企業(yè)級(jí) RAG 平臺(tái),從而消除選擇和拼接這些平臺(tái)的復(fù)雜性:

1. 操作工具: 企業(yè) IT 將需要為工程團(tuán)隊(duì)建立防護(hù)欄、管理成本等;他們現(xiàn)在處理的所有軟件開發(fā)任務(wù)現(xiàn)在都需要擴(kuò)展到人工智能的使用。IT 部門感興趣的方面包括

  • 可觀察性:模型在生產(chǎn)中的表現(xiàn)如何?它們的性能是否隨著時(shí)間的推移而提高/降低?是否存在可能影響未來版本應(yīng)用程序模型選擇的使用模式?
  • 安全性:如何保證人工智能本地應(yīng)用程序的安全。這些應(yīng)用程序是否容易受到需要新平臺(tái)的新型攻擊載體的攻擊?
  • 合規(guī)性:我們預(yù)計(jì)人工智能原生應(yīng)用和 LLM 的使用將需要符合相關(guān)管理機(jī)構(gòu)已經(jīng)開始制定的框架。這是對(duì)現(xiàn)有的隱私、安全、消費(fèi)者保護(hù)、公平等合規(guī)制度的補(bǔ)充。企業(yè)將需要能夠幫助他們保持合規(guī)、進(jìn)行審計(jì)、生成合規(guī)證明及相關(guān)任務(wù)的平臺(tái)。

2. 數(shù)據(jù): 幫助了解企業(yè)擁有的數(shù)據(jù)資產(chǎn)以及如何利用這些資產(chǎn)從新的人工智能模型中獲取最大價(jià)值的平臺(tái)將得到迅速采用。全球最大的軟件公司之一曾對(duì)我們說過:”我們的數(shù)據(jù)是我們的護(hù)城河,是我們的核心知識(shí)產(chǎn)權(quán),是我們的競(jìng)爭(zhēng)優(yōu)勢(shì)。利用人工智能將這些數(shù)據(jù)貨幣化,并以一種 “在不削弱可防御性的情況下促進(jìn)差異化 “的方式,將是關(guān)鍵所在。Snorkel 等平臺(tái)在這方面發(fā)揮著至關(guān)重要的作用。

現(xiàn)在是構(gòu)建人工智能基礎(chǔ)設(shè)施平臺(tái)的極好時(shí)機(jī)。人工智能的應(yīng)用將繼續(xù)改變整個(gè)行業(yè),但它需要配套的基礎(chǔ)設(shè)施、中間件、安全性、可觀察性和操作平臺(tái),才能讓地球上的每個(gè)企業(yè)都能采用這項(xiàng)強(qiáng)大的技術(shù)。

參考材料

https://lsvp.com/will-enterprise-ai-models-be-winner-take-all/

作者:Vela,Yihao,Leo,編輯與排版:Zoey,Vela

來源公眾號(hào):深思SenseAI(ID:gh_a54fc6d3826c);關(guān)注全球 AI 前沿,走進(jìn)科技創(chuàng)業(yè)公司,提供產(chǎn)業(yè)多維深思。

本文由人人都是產(chǎn)品經(jīng)理合作媒體 @深思SenseAI 授權(quán)發(fā)布,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自 Unsplash,基于CC0協(xié)議

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒評(píng)論,等你發(fā)揮!