2萬(wàn)字大模型調(diào)研:橫向?qū)Ρ任男囊谎浴俅?、Minimax、通義千問(wèn)、訊飛星火、ChatGPT

5 評(píng)論 57986 瀏覽 185 收藏 55 分鐘

2萬(wàn)字、47張圖表、對(duì)6大模型進(jìn)行了測(cè)評(píng)和體驗(yàn)。本文注重產(chǎn)品使用感受、實(shí)際應(yīng)用場(chǎng)景與效果測(cè)評(píng),讓你輕松掌握各大模型的優(yōu)劣與特色,助你全面理解各大模型的真實(shí)表現(xiàn),快來(lái)看看吧。

一、引言

1. 調(diào)研目的與意義

2023年之后,國(guó)內(nèi)外多個(gè)大模型的相繼發(fā)布和升級(jí),進(jìn)一步推動(dòng)了全球AI競(jìng)賽的白熱化,并對(duì)社會(huì)各行業(yè)產(chǎn)生深遠(yuǎn)影響。

中國(guó)的大模型包括百度的文心一言(ERNIE系列)、阿里云的通義千問(wèn)、Minimax系列模型、科大訊飛的訊飛星火以及美國(guó)OpenAI研發(fā)的ChatGPT等。這些模型憑借其強(qiáng)大的語(yǔ)言理解和生成能力,在文本創(chuàng)作、智能問(wèn)答、知識(shí)檢索、商業(yè)文案生成等諸多場(chǎng)景中展現(xiàn)出了巨大潛力。

本次調(diào)研旨在為企業(yè)選擇一款合適的大模型產(chǎn)品,其目的和意義如下:

了解市場(chǎng)上的大模型產(chǎn)品及其供應(yīng)商,分析各家產(chǎn)品的優(yōu)缺點(diǎn)和適用場(chǎng)景。評(píng)估各家大模型產(chǎn)品的性能指標(biāo),為企業(yè)提供參考依據(jù)。了解大模型產(chǎn)品的部署、接入成本和定制化開(kāi)發(fā)等技術(shù)支持和服務(wù),確保企業(yè)能夠順利實(shí)施和應(yīng)用。

通過(guò)調(diào)研,為公司推薦適合的大模型產(chǎn)品,提高AI產(chǎn)品穩(wěn)定性和效果表現(xiàn)。

2. 調(diào)研背景與現(xiàn)狀

目前我們正在合作的AI,以及我們正在使用的的大模型產(chǎn)品。從實(shí)踐的角度來(lái)看,都存在產(chǎn)品穩(wěn)定性不夠、產(chǎn)品效果不佳,以及供應(yīng)商服務(wù)響應(yīng)不太及時(shí)的問(wèn)題。

經(jīng)過(guò)團(tuán)隊(duì)的溝通,現(xiàn)需要調(diào)研新的大模型產(chǎn)品,以尋找現(xiàn)有的產(chǎn)品的替換品或補(bǔ)充品,已保證的穩(wěn)定運(yùn)行,及高質(zhì)量的輸出表現(xiàn)。

AI的服務(wù)問(wèn)題示例:

3. 調(diào)研范圍與限制

1)調(diào)研范圍

主要集中在國(guó)內(nèi)的大模型廠商,以及openAI的接口測(cè)試能力。因?yàn)檎咴?,?duì)其他更多的外國(guó)廠商不進(jìn)行調(diào)研和測(cè)試。

調(diào)研的版本,僅限于當(dāng)前廠商能提供的對(duì)外開(kāi)放的版本,大概率是最新版。

調(diào)研的維度:主要選取和對(duì)比各家大模型的優(yōu)劣勢(shì)、產(chǎn)品性能、擅長(zhǎng)領(lǐng)域、接入方式、使用成本、是否支持微調(diào)等。

2)調(diào)研限制

因?yàn)槠蛡€(gè)人能力有限,對(duì)大模型的技術(shù)原理、訓(xùn)練方法、模型架構(gòu)不做深入的研究和分析,感興趣的伙伴,可以尋找其他更加專(zhuān)業(yè)的作者的文章閱讀。

調(diào)研主要是通過(guò)產(chǎn)品和用戶(hù)視角進(jìn)行,比較注重上層表現(xiàn)效果,調(diào)研內(nèi)容僅供參考。

調(diào)研的主要方式是通過(guò)官網(wǎng)產(chǎn)品的C端體驗(yàn)進(jìn)行,形式非權(quán)威且不正式,調(diào)研思路僅提供一種可能性啟發(fā),結(jié)果僅供參考。

二、企業(yè)需求分析

1. 接入大模型的主要原因分析

1)提高生產(chǎn)效率:通過(guò)大模型技術(shù),企業(yè)可以自動(dòng)化處理大量數(shù)據(jù),提高生產(chǎn)效率,降低成本。例如:

  1. 輿情項(xiàng)目的文章分析和分類(lèi)處理;
  2. 智能寫(xiě)作;
  3. 自動(dòng)撰寫(xiě)新聞稿。

2)提升客戶(hù)體驗(yàn):大模型技術(shù)可以幫助企業(yè)更好地理解客戶(hù)需求,提供更加個(gè)性化的服務(wù)和產(chǎn)品,提升客戶(hù)體驗(yàn)。例如:

  1. 文章閱讀和AI解讀;
  2. 產(chǎn)業(yè)的數(shù)據(jù)分析;
  3. *網(wǎng)的資訊自動(dòng)化、機(jī)器人化等。

3)創(chuàng)新業(yè)務(wù)模式:大模型技術(shù)可以推動(dòng)企業(yè)創(chuàng)新業(yè)務(wù)模式,為企業(yè)創(chuàng)造新的增長(zhǎng)點(diǎn)。例如:

  1. 針對(duì)*產(chǎn)業(yè)的相關(guān)資訊的智能化咨詢(xún);
  2. 相關(guān)資訊智能推薦;
  3. *產(chǎn)業(yè)專(zhuān)業(yè)內(nèi)容、數(shù)據(jù)解讀、研報(bào)解讀等。

2. 接入大模型的產(chǎn)品需求

應(yīng)用場(chǎng)景:自然語(yǔ)言處理、文章分析、內(nèi)容識(shí)別和分類(lèi)、智能推薦、數(shù)據(jù)分析。

功能需求:自然語(yǔ)言對(duì)話、智能摘要、文章解讀、文檔閱讀、推薦算法、行業(yè)模型微調(diào)。

性能需求:

  1. 如響應(yīng)速度快,有專(zhuān)屬的客服團(tuán)隊(duì),日常工作中能及時(shí)響應(yīng);
  2. 并發(fā)處理能力稍強(qiáng),大于30QPS;
  3. 穩(wěn)定性要好,系統(tǒng)故障和奔潰率要低于0.05%;
  4. 安全性要強(qiáng),符合國(guó)內(nèi)的政策法規(guī),經(jīng)過(guò)備案,對(duì)敏感詞有過(guò)濾,對(duì)用戶(hù)輸入有識(shí)別和違禁詞的攔截;
  5. 支持可擴(kuò)展性,支持微調(diào)。

成本預(yù)算:年成本不高于120w。

服務(wù)與支持:考察供應(yīng)商的售后服務(wù)體系,包括技術(shù)支持、培訓(xùn)服務(wù)、升級(jí)維護(hù)等。

技術(shù)路線與未來(lái)發(fā)展:考慮產(chǎn)品是否符合行業(yè)發(fā)展趨勢(shì),能否滿(mǎn)足企業(yè)未來(lái)一段時(shí)間內(nèi)的發(fā)展需求。

3. 大模型選型原則與標(biāo)準(zhǔn)

基于以上需求,*在選擇大模型產(chǎn)品時(shí)應(yīng)該遵循以下原則與標(biāo)準(zhǔn):

  1. 性能:產(chǎn)品的性能要穩(wěn)定可靠,能夠高效地處理大量數(shù)據(jù),滿(mǎn)足企業(yè)的業(yè)務(wù)需求。
  2. 易用性:產(chǎn)品的操作要簡(jiǎn)單易懂,不需要過(guò)多的技術(shù)門(mén)檻,方便企業(yè)快速上手。
  3. 可擴(kuò)展性:產(chǎn)品要具有良好的可擴(kuò)展性,能夠隨著企業(yè)業(yè)務(wù)的發(fā)展而不斷升級(jí)和優(yōu)化。
  4. 成本:產(chǎn)品的價(jià)格要合理,同時(shí)要考慮其性?xún)r(jià)比,避免不必要的浪費(fèi)。
  5. 技術(shù)支持與服務(wù):產(chǎn)品提供商要具備完善的技術(shù)支持和服務(wù)體系,能夠及時(shí)解決企業(yè)遇到的問(wèn)題。

三、大模型產(chǎn)品概述

1. 大模型技術(shù)的發(fā)展歷程

大模型技術(shù),也稱(chēng)為深度學(xué)習(xí)模型,其發(fā)展歷程可以追溯到2006年,當(dāng)時(shí)深度學(xué)習(xí)的概念被提出,并在語(yǔ)音識(shí)別、圖像處理等領(lǐng)域開(kāi)始得到應(yīng)用。隨著數(shù)據(jù)的不斷積累和計(jì)算能力的提升,深度學(xué)習(xí)模型逐漸從傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)演變?yōu)楦鼜?fù)雜的結(jié)構(gòu),如卷積神經(jīng)網(wǎng)絡(luò)(CNN)、循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)和Transformer等。

其中,Transformer結(jié)構(gòu)在大模型中得到了廣泛應(yīng)用,尤其是在自然語(yǔ)言處理領(lǐng)域。隨著預(yù)訓(xùn)練語(yǔ)言模型的出現(xiàn),如GPT系列和BERT等,大模型在自然語(yǔ)言處理任務(wù)中取得了顯著成果,推動(dòng)了人工智能技術(shù)的進(jìn)一步發(fā)展。

通俗地解釋就是:如果電腦是個(gè)孩子,那么大模型技術(shù)就是他的大腦。一開(kāi)始,這個(gè)孩子不太聰明,后來(lái)他通過(guò)不斷學(xué)習(xí),變得越來(lái)越聰明。大模型技術(shù)就是這樣,它通過(guò)大量數(shù)據(jù)的學(xué)習(xí),變得越來(lái)越“聰明”。這個(gè)技術(shù)的發(fā)展經(jīng)歷了很長(zhǎng)時(shí)間,現(xiàn)在已經(jīng)被廣泛應(yīng)用于各種領(lǐng)域。

2. 競(jìng)爭(zhēng)格局與主要參與者

大模型的競(jìng)爭(zhēng)格局日趨激烈,全球范圍內(nèi),眾多企業(yè)、初創(chuàng)公司和研究機(jī)構(gòu)都在積極投入和研發(fā)大模型技術(shù)。

1)國(guó)內(nèi)主要大模型企業(yè):

① 百度

百度在人工智能領(lǐng)域有著深厚積累,其研發(fā)的大模型包括“文心一言”(ERNIE系列),這是一個(gè)預(yù)訓(xùn)練語(yǔ)言模型,具有強(qiáng)大的自然語(yǔ)言理解和生成能力。百度利用該模型在搜索、信息流推薦、廣告投放、智能寫(xiě)作、對(duì)話系統(tǒng)等場(chǎng)景中實(shí)現(xiàn)智能化升級(jí),為用戶(hù)提供更精準(zhǔn)和個(gè)性化的服務(wù)。

② 阿里巴巴

阿里巴巴推出的是“通義千問(wèn)”大模型,這是基于阿里云構(gòu)建的大型預(yù)訓(xùn)練模型,在電商、金融、物流等多個(gè)業(yè)務(wù)場(chǎng)景發(fā)揮了重要作用。例如,它能夠優(yōu)化商品推薦算法,提升客服效率,輔助決策分析,并在文本生成、問(wèn)答交互等方面提供強(qiáng)大的技術(shù)支持。

③ 騰訊

騰訊在AI領(lǐng)域的布局也十分積極,盡管混元大模型還在內(nèi)測(cè)階段,但預(yù)計(jì)會(huì)在游戲開(kāi)發(fā)、內(nèi)容生成、社交網(wǎng)絡(luò)、在線娛樂(lè)等多個(gè)方面發(fā)揮重要作用,以提升用戶(hù)體驗(yàn)并增強(qiáng)騰訊產(chǎn)品和服務(wù)的競(jìng)爭(zhēng)力。

④ 華為

華為研發(fā)了盤(pán)古大模型系列,旨在通過(guò)先進(jìn)的深度學(xué)習(xí)技術(shù)推動(dòng)云計(jì)算、物聯(lián)網(wǎng)、智能終端等領(lǐng)域的技術(shù)創(chuàng)新。盤(pán)古大模型可應(yīng)用于華為云服務(wù),賦能行業(yè)解決方案,同時(shí)也在華為自家的智能手機(jī)、智能家居等智能硬件設(shè)備上提供了更加智能的功能。

⑤ 字節(jié)跳動(dòng)

字節(jié)跳動(dòng)雖然沒(méi)有公開(kāi)具體的大模型名稱(chēng),但在自然語(yǔ)言處理和推薦系統(tǒng)等領(lǐng)域有深厚的積累和技術(shù)實(shí)力。其旗下的抖音、今日頭條等平臺(tái)依賴(lài)于高度智能的算法和模型,推測(cè)正在內(nèi)部研發(fā)或應(yīng)用大模型來(lái)提升內(nèi)容理解與個(gè)性化推薦效果。

⑥ 京東

京東的言犀大模型是專(zhuān)為其電商平臺(tái)定制的人工智能模型,尤其擅長(zhǎng)在智能客服、智能營(yíng)銷(xiāo)和智能供應(yīng)鏈管理等方面發(fā)揮作用。通過(guò)言犀,京東可以高效地處理用戶(hù)咨詢(xún)、精準(zhǔn)推薦商品以及優(yōu)化運(yùn)營(yíng)策略。

⑦ 科大訊飛

科大訊飛作為中國(guó)語(yǔ)音識(shí)別和人工智能行業(yè)的領(lǐng)軍企業(yè)之一,推出了星火大模型,這是一種認(rèn)知智能大模型,集成了多種自然語(yǔ)言處理和機(jī)器學(xué)習(xí)技術(shù)。星火大模型在教育、醫(yī)療、政務(wù)、司法等行業(yè)應(yīng)用場(chǎng)景中廣泛使用,尤其是在智能語(yǔ)音合成、語(yǔ)音識(shí)別、語(yǔ)義理解和知識(shí)圖譜構(gòu)建等方面表現(xiàn)突出。

⑧ 360集團(tuán)

360集團(tuán)依托自身在搜索引擎和網(wǎng)絡(luò)安全領(lǐng)域的優(yōu)勢(shì),推出了360GPT大模型。這款大模型不僅強(qiáng)化了360搜索引擎的智能化程度,還在網(wǎng)絡(luò)安全防護(hù)、威脅情報(bào)分析、智能硬件協(xié)同等方面展現(xiàn)出強(qiáng)大的功能,有助于提升整體的互聯(lián)網(wǎng)安全水平及用戶(hù)體驗(yàn)。

2)國(guó)外主要大模型企業(yè)

  1. 谷歌:擁有LaMDA、PaLM等大模型,并在搜索、廣告、自然語(yǔ)言處理等領(lǐng)域有廣泛應(yīng)用。
  2. 微軟:推出了Azure OpenAI服務(wù),集成了GPT系列等大模型,并在云服務(wù)、辦公軟件等領(lǐng)域有所應(yīng)用。
  3. 亞馬遜:擁有自己的大模型技術(shù),并在電商、云服務(wù)、智能音響等領(lǐng)域有所應(yīng)用,但尚未公開(kāi)具體的大模型名稱(chēng)。
  4. Meta:在自然語(yǔ)言處理和圖像處理等領(lǐng)域有所布局,推出了LLaMA等大模型。
  5. 蘋(píng)果:雖然蘋(píng)果尚未公開(kāi)具體的大模型技術(shù),但其在Siri、Face ID等方面已有所應(yīng)用。

3)初創(chuàng)公司和研究機(jī)構(gòu)

當(dāng)然,以下是您提到的國(guó)外主要大模型企業(yè)的詳細(xì)情況:

① 谷歌

谷歌在人工智能領(lǐng)域處于全球領(lǐng)先地位,其研發(fā)的大模型包括LaMDA(Language Model for Dialogue Applications)和PaLM(Pathways Language Model)。LaMDA是專(zhuān)為對(duì)話交互設(shè)計(jì)的大型語(yǔ)言模型,旨在提供更自然、有深度的人機(jī)對(duì)話體驗(yàn);而PaLM則是一個(gè)超大規(guī)模的語(yǔ)言模型,具有極強(qiáng)的推理能力和泛化能力,在搜索、廣告相關(guān)性預(yù)測(cè)、智能助手響應(yīng)生成等方面發(fā)揮關(guān)鍵作用。

② 微軟

微軟通過(guò)與OpenAI合作,將GPT系列大模型集成到了Azure云服務(wù)中,為企業(yè)客戶(hù)提供強(qiáng)大的自然語(yǔ)言處理能力。例如,Azure OpenAI服務(wù)使得用戶(hù)能夠方便地調(diào)用GPT-3等先進(jìn)的預(yù)訓(xùn)練模型來(lái)開(kāi)發(fā)聊天機(jī)器人、文本生成工具以及增強(qiáng)辦公軟件如Office 365中的智能功能。

③ 亞馬遜

亞馬遜作為電商和云計(jì)算巨頭,雖然尚未公開(kāi)特定的大模型名稱(chēng),但無(wú)疑在其業(yè)務(wù)中有應(yīng)用自研或整合的大模型技術(shù)。這些技術(shù)可能體現(xiàn)在個(gè)性化推薦系統(tǒng)、客戶(hù)服務(wù)機(jī)器人、Alexa智能語(yǔ)音助手等領(lǐng)域,利用大模型提高用戶(hù)體驗(yàn)和服務(wù)效率。

④ Meta(前身為Facebook)

Meta在人工智能領(lǐng)域的探索廣泛且深入,已推出了LLaMA(Large Language Models at Meta)等大模型,主要用于自然語(yǔ)言處理任務(wù),同時(shí)也涉足圖像處理、跨模態(tài)學(xué)習(xí)等前沿領(lǐng)域。此類(lèi)大模型的應(yīng)用場(chǎng)景涵蓋社交網(wǎng)絡(luò)內(nèi)容理解與推薦、AR/VR虛擬世界互動(dòng)、元宇宙建設(shè)等多個(gè)方面。

⑤ 蘋(píng)果

蘋(píng)果公司雖未正式對(duì)外宣布具體的大模型技術(shù)細(xì)節(jié),但在其產(chǎn)品和服務(wù)中廣泛應(yīng)用了深度學(xué)習(xí)和人工智能技術(shù)。例如,Siri語(yǔ)音助手背后的自然語(yǔ)言理解和語(yǔ)音合成技術(shù)、Face ID面部識(shí)別系統(tǒng)中的機(jī)器學(xué)習(xí)算法等,都體現(xiàn)了蘋(píng)果在先進(jìn)模型上的研發(fā)投入。盡管如此,推測(cè)蘋(píng)果內(nèi)部正在積極研發(fā)或使用定制化的大型模型以提升旗下產(chǎn)品的智能化水平。

4)國(guó)內(nèi)大模型初創(chuàng)公司

① 云從科技:專(zhuān)注于人臉識(shí)別和自然語(yǔ)言處理領(lǐng)域,開(kāi)發(fā)了多款大模型應(yīng)用。

作為一家人工智能領(lǐng)軍企業(yè),云從科技主要聚焦在計(jì)算機(jī)視覺(jué)和自然語(yǔ)言處理領(lǐng)域。其核心技術(shù)包括人臉識(shí)別、圖像識(shí)別、語(yǔ)音語(yǔ)義理解等,并基于這些技術(shù)開(kāi)發(fā)了多款大模型應(yīng)用,廣泛應(yīng)用于金融、安防、交通、商業(yè)等多個(gè)行業(yè)場(chǎng)景,如智慧銀行、智慧城市等。

② 達(dá)闥科技:專(zhuān)注于云端機(jī)器人技術(shù),開(kāi)發(fā)了多款大模型應(yīng)用。

達(dá)闥科技以云端機(jī)器人技術(shù)為核心,通過(guò)構(gòu)建智能云腦和智能終端的架構(gòu),研發(fā)了針對(duì)服務(wù)機(jī)器人的大模型應(yīng)用。他們致力于將人工智能與機(jī)器人技術(shù)相結(jié)合,打造具備復(fù)雜環(huán)境感知、決策規(guī)劃及自主行動(dòng)能力的智能機(jī)器人解決方案。

③ 思必馳:專(zhuān)注于智能語(yǔ)音交互技術(shù),開(kāi)發(fā)了多款大模型應(yīng)用。

思必馳是一家專(zhuān)注于智能語(yǔ)音交互技術(shù)的企業(yè),為各類(lèi)智能硬件和軟件提供全鏈路語(yǔ)音交互解決方案。其研發(fā)的大模型應(yīng)用在語(yǔ)音識(shí)別、語(yǔ)音合成、語(yǔ)義理解等方面具有先進(jìn)的性能,被廣泛應(yīng)用在智能家居、智能車(chē)載、智能客服等領(lǐng)域。

④ 深言科技:專(zhuān)注于自然語(yǔ)言處理和智能推薦技術(shù),開(kāi)發(fā)了多款大模型應(yīng)用。

深言科技專(zhuān)攻于自然語(yǔ)言處理以及智能推薦技術(shù),他們的大模型產(chǎn)品可進(jìn)行深度語(yǔ)義理解和用戶(hù)行為分析,用于智能對(duì)話系統(tǒng)、個(gè)性化內(nèi)容推薦等方面,提升用戶(hù)體驗(yàn)并助力企業(yè)智能化升級(jí)。

⑤ 云知聲:專(zhuān)注于語(yǔ)音識(shí)別和自然語(yǔ)言處理技術(shù),開(kāi)發(fā)了多款大模型應(yīng)用。

云知聲是國(guó)內(nèi)領(lǐng)先的智能語(yǔ)音技術(shù)服務(wù)商,特別是在語(yǔ)音識(shí)別和自然語(yǔ)言處理方面有深厚的技術(shù)積累。它們開(kāi)發(fā)的大模型應(yīng)用在智能家居控制、醫(yī)療、教育等行業(yè)得到廣泛應(yīng)用,旨在實(shí)現(xiàn)“聽(tīng)見(jiàn)·看見(jiàn)·認(rèn)知·思考”的AI能力。

⑥ 明略科技:專(zhuān)注于數(shù)據(jù)分析和管理領(lǐng)域,開(kāi)發(fā)了多款大模型應(yīng)用。

明略科技著重于數(shù)據(jù)分析和知識(shí)圖譜構(gòu)建,結(jié)合大數(shù)據(jù)技術(shù)和大模型算法,為企業(yè)級(jí)客戶(hù)提供智能決策支持和數(shù)據(jù)驅(qū)動(dòng)的運(yùn)營(yíng)管理方案。其大模型應(yīng)用有助于挖掘海量數(shù)據(jù)中的價(jià)值信息,優(yōu)化業(yè)務(wù)流程和提高決策效率。

⑦ 格靈深瞳:專(zhuān)注于計(jì)算機(jī)視覺(jué)和深度學(xué)習(xí)技術(shù),開(kāi)發(fā)了多款大模型應(yīng)用。

格靈深瞳深耕計(jì)算機(jī)視覺(jué)和深度學(xué)習(xí)技術(shù),其大模型應(yīng)用主要用于視頻內(nèi)容分析、行為識(shí)別、物體檢測(cè)等場(chǎng)景,在公共安全、城市管理、零售業(yè)、體育賽事分析等多個(gè)行業(yè)中實(shí)現(xiàn)了智能化監(jiān)控和管理。

⑧ 商湯科技:專(zhuān)注于計(jì)算機(jī)視覺(jué)和人工智能領(lǐng)域,開(kāi)發(fā)了多款大模型應(yīng)用。

商湯科技是全球領(lǐng)先的人工智能平臺(tái)公司,尤其在計(jì)算機(jī)視覺(jué)和深度學(xué)習(xí)方面擁有頂尖實(shí)力。它們不僅開(kāi)發(fā)了一系列基于大模型的應(yīng)用,如圖像識(shí)別、視頻分析、增強(qiáng)現(xiàn)實(shí)等,還將其技術(shù)廣泛應(yīng)用于智能手機(jī)、自動(dòng)駕駛、智慧城市、娛樂(lè)影視、教育健康等多個(gè)領(lǐng)域。

5)國(guó)外大模型初創(chuàng)公司

① Scale AI

Scale AI是一家以人工智能數(shù)據(jù)標(biāo)注和訓(xùn)練為核心業(yè)務(wù)的公司,為自動(dòng)駕駛、國(guó)防、電子商務(wù)等領(lǐng)域的機(jī)器學(xué)習(xí)模型提供高質(zhì)量的數(shù)據(jù)集。他們開(kāi)發(fā)的大模型應(yīng)用和服務(wù)極大地加速了AI模型的訓(xùn)練過(guò)程,通過(guò)精細(xì)標(biāo)注的數(shù)據(jù)有效提升了模型性能。

② Hugging Face

Hugging Face是一家在自然語(yǔ)言處理(NLP)領(lǐng)域極具影響力的公司,他們運(yùn)營(yíng)著一個(gè)開(kāi)放源碼社區(qū),并推出了Transformers庫(kù),其中包含了大量的預(yù)訓(xùn)練模型,如BERT、GPT系列等,使得開(kāi)發(fā)者能夠輕松地利用這些大模型進(jìn)行二次訓(xùn)練或直接應(yīng)用于文本生成、問(wèn)答系統(tǒng)、語(yǔ)義分析等各種場(chǎng)景。

③ Domino Data Lab

Domino Data Lab提供了一個(gè)企業(yè)級(jí)的數(shù)據(jù)科學(xué)平臺(tái),致力于簡(jiǎn)化并加速?gòu)臄?shù)據(jù)準(zhǔn)備到模型部署的整個(gè)機(jī)器學(xué)習(xí)生命周期。該平臺(tái)支持大規(guī)模數(shù)據(jù)處理、模型訓(xùn)練以及版本控制,讓數(shù)據(jù)科學(xué)家能夠高效地開(kāi)發(fā)和管理包括大模型在內(nèi)的各類(lèi)機(jī)器學(xué)習(xí)項(xiàng)目。

④ DataRobot

DataRobot提供自動(dòng)化機(jī)器學(xué)習(xí)解決方案,幫助企業(yè)用戶(hù)快速構(gòu)建和優(yōu)化預(yù)測(cè)性模型。其平臺(tái)允許用戶(hù)無(wú)需編碼或深度理解算法即可訓(xùn)練各種復(fù)雜的大模型,尤其擅長(zhǎng)于預(yù)測(cè)分析和決策制定,在金融、零售、醫(yī)療等行業(yè)有廣泛應(yīng)用。

⑤ Feast (Feast Feature Store)

Feast是一個(gè)開(kāi)源的特征存儲(chǔ)系統(tǒng),雖然它不直接提供大模型的應(yīng)用,但作為機(jī)器學(xué)習(xí)工程的重要組成部分,它對(duì)特征工程有著關(guān)鍵作用。Feast幫助團(tuán)隊(duì)管理和共享用于訓(xùn)練大模型的特征數(shù)據(jù),從而改善模型效果和協(xié)作效率。

⑥ Invenia Data Science

Invenia主要聚焦在復(fù)雜系統(tǒng)的建模與預(yù)測(cè)上,尤其是能源市場(chǎng)。他們的工作結(jié)合了高級(jí)數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)技術(shù),盡管可能不直接對(duì)外提供大模型服務(wù),但內(nèi)部研發(fā)的模型通常規(guī)模龐大且復(fù)雜,用于解決電力市場(chǎng)的供需預(yù)測(cè)和其他復(fù)雜問(wèn)題。

⑦ FloydHub

FloydHub是面向機(jī)器學(xué)習(xí)和深度學(xué)習(xí)研究者的云端服務(wù)平臺(tái),提供GPU資源,支持用戶(hù)方便快捷地在云端進(jìn)行大模型訓(xùn)練。用戶(hù)可以通過(guò)簡(jiǎn)單的命令行工具或API將代碼上傳至云端環(huán)境,從而實(shí)現(xiàn)計(jì)算資源的彈性擴(kuò)展,大大降低了模型訓(xùn)練門(mén)檻。

⑧ FastAI

FastAI 是一個(gè)專(zhuān)注于使深度學(xué)習(xí)易于使用的開(kāi)源庫(kù)和教育項(xiàng)目,它構(gòu)建于PyTorch之上,簡(jiǎn)化了大模型的訓(xùn)練流程。FastAI 提供了一系列工具和框架,使得即便是初學(xué)者也能快速搭建和訓(xùn)練高性能的計(jì)算機(jī)視覺(jué)和自然語(yǔ)言處理模型,并將其部署到生產(chǎn)環(huán)境中。

請(qǐng)注意,以上列舉的初創(chuàng)公司并非全部,還有許多其他的大模型初創(chuàng)公司在不同領(lǐng)域進(jìn)行著創(chuàng)新和應(yīng)用。同時(shí),隨著技術(shù)的不斷發(fā)展和市場(chǎng)的不斷變化,這些初創(chuàng)公司的競(jìng)爭(zhēng)格局也可能會(huì)發(fā)生變化。

3. 產(chǎn)品類(lèi)型與特點(diǎn)分析

大模型產(chǎn)品按照應(yīng)用場(chǎng)景和功能可以分為多種類(lèi)型,如:

  1. 自然語(yǔ)言處理大模型
  2. 計(jì)算機(jī)視覺(jué)大模型
  3. 語(yǔ)音識(shí)別大模型等

這些產(chǎn)品在模型結(jié)構(gòu)、參數(shù)規(guī)模、訓(xùn)練方法等方面存在差異,具有各自的特點(diǎn)和優(yōu)勢(shì)。其中,自然語(yǔ)言處理大模型是目前應(yīng)用最廣泛的類(lèi)型之一,其特點(diǎn)是通過(guò)海量數(shù)據(jù)訓(xùn)練得到豐富的語(yǔ)義信息和語(yǔ)言知識(shí),能夠?qū)崿F(xiàn)自然語(yǔ)言理解、生成以及文本分類(lèi)等任務(wù)。

計(jì)算機(jī)視覺(jué)大模型則注重圖像特征的提取和分類(lèi),廣泛應(yīng)用于人臉識(shí)別、目標(biāo)檢測(cè)等領(lǐng)域。語(yǔ)音識(shí)別大模型則注重語(yǔ)音信號(hào)的處理和識(shí)別,能夠?qū)崿F(xiàn)語(yǔ)音轉(zhuǎn)文字、語(yǔ)音合成等功能。

大模型產(chǎn)品的特點(diǎn)是具有高度靈活性和可擴(kuò)展性,能夠根據(jù)不同場(chǎng)景和需求進(jìn)行定制化開(kāi)發(fā)和應(yīng)用。同時(shí),大模型產(chǎn)品的應(yīng)用也需要相應(yīng)的數(shù)據(jù)資源和計(jì)算能力支持,因此在實(shí)際應(yīng)用中需要考慮數(shù)據(jù)隱私和安全等方面的問(wèn)題。

此外,由于大模型產(chǎn)品的技術(shù)門(mén)檻較高,需要專(zhuān)業(yè)的人才和技術(shù)支持服務(wù)。因此,企業(yè)在選擇大模型產(chǎn)品時(shí)需要綜合考慮產(chǎn)品的性能、易用性、可擴(kuò)展性以及技術(shù)支持和服務(wù)質(zhì)量等因素。

四、大模型產(chǎn)品對(duì)比分析

1. 分析對(duì)象選取

在大模型調(diào)研和分析的對(duì)象選擇上,主要考慮已備案、開(kāi)放商用、有完備的API接入部署方式的國(guó)內(nèi)的大模型產(chǎn)品。

1)第一批通過(guò)備案的大模型

  • 百度文心大模型
  • 百川大模型
  • Minimax大模型
  • 阿里通義大模型
  • 智譜AI大模型

2)第二批通過(guò)備案的大模型

訊飛星火大模型。

3)國(guó)外大模型

  • OpenAI
  • Google Gemini

2. 百度·文心大模型

1)模型定位分析

大模型產(chǎn)品介紹:https://wenxin.baidu.com/

大模型的能力:

  1. 通用大模型
  2. 多模態(tài)
  3. 行業(yè)級(jí)應(yīng)用
  4. AI應(yīng)用場(chǎng)景全覆蓋
  5. 多類(lèi)AI工具配合使用

NLP大模型:面向語(yǔ)言理解、語(yǔ)言生成等NLP場(chǎng)景,具備超強(qiáng)語(yǔ)言理解能力以及對(duì)話生成、文學(xué)創(chuàng)作等能力。創(chuàng)新性地將大數(shù)據(jù)預(yù)訓(xùn)練與多源豐富知識(shí)相結(jié)合,通過(guò)持續(xù)學(xué)習(xí)技術(shù),不斷吸收海量文本數(shù)據(jù)中詞匯、結(jié)構(gòu)、語(yǔ)義等方面的新知識(shí),實(shí)現(xiàn)模型效果不斷進(jìn)化。

在文心大模型的基礎(chǔ)上,有獨(dú)立的應(yīng)用場(chǎng)景大模型可供選擇和單獨(dú)采購(gòu)使用,例如:

  1. 對(duì)話PLATO-XL
  2. 搜索ERNIE-Search
  3. 跨語(yǔ)言ERNIE-M
  4. 代碼ERNIE-Code

除了大語(yǔ)言模型,還有視覺(jué)模型、跨模態(tài)模型、生物計(jì)算模型等。在這里,可以考慮一下自家企業(yè)的產(chǎn)品和應(yīng)用場(chǎng)景是否涉及并需要這些模型能力。

2)產(chǎn)品體驗(yàn)和測(cè)評(píng)

3)接入方式

文心大模型4.0已正式發(fā)布,個(gè)人和企業(yè)客戶(hù)可通過(guò)百度智能云千帆大模型平臺(tái)接入使用。

網(wǎng)址:https://cloud.baidu.com/product/wenxinworkshop

4)分析小結(jié)

  1. 模型性能好,多工具使用,AI產(chǎn)品矩陣比較全面;
  2. 接入成本較高,可通過(guò)API計(jì)入or 私有云部署(價(jià)格比較貴);
  3. 3針對(duì)目前XXX的產(chǎn)品需求和應(yīng)用場(chǎng)景,主要可以使用百度的文心大模型的NLP大模型;
  4. 在未來(lái)的文檔分析和歸類(lèi)應(yīng)用上,可以考慮跨模態(tài)的ERNIE-Layout模型,主要作用是文檔分類(lèi)、信息抽取、文檔問(wèn)答等。
  5. 百度在互聯(lián)網(wǎng)產(chǎn)品上,利用大模型,以產(chǎn)品為切入點(diǎn)做了一些落地應(yīng)用。例如:百度搜索助手、文庫(kù)助手、網(wǎng)盤(pán)助手、瀏覽器助手、AI圖片助手、百家號(hào)創(chuàng)作助手等。

3. 百川大模型

1)模型定位分析

大模型產(chǎn)品介紹:https://www.baichuan-ai.com/home

最新的Baichuan2-Turbo大模型版本的能力:

  1. 搜索增強(qiáng)
  2. 開(kāi)放API
  3. 中英雙語(yǔ)

Baichuan2 Turbo大模型,融合長(zhǎng)上下文窗口和搜索增強(qiáng),實(shí)現(xiàn)大模型與領(lǐng)域知識(shí)、全網(wǎng)知識(shí)的全新鏈接。支持PDF、Word等多種文檔上傳及網(wǎng)址輸入,信息獲取及時(shí)、全面,輸出結(jié)果準(zhǔn)確、專(zhuān)業(yè)。

產(chǎn)品優(yōu)勢(shì)

  1. 支持搜索增強(qiáng)+企業(yè)知識(shí)庫(kù)(限時(shí)免費(fèi)?。?/li>
  2. 實(shí)現(xiàn)互聯(lián)網(wǎng)實(shí)時(shí)信息+企業(yè)完整知識(shí)的融合
  3. 能將足夠多的知識(shí)加載到192k上下文窗口
  4. 解決大部分定制化場(chǎng)景

2)產(chǎn)品體驗(yàn)和測(cè)評(píng)

3)接入方式

百川全新開(kāi)放Baichuan2-Turbo系列API,支持搜索增強(qiáng)和 192K長(zhǎng)窗口,新增 百川搜索增強(qiáng)知識(shí)庫(kù), 通過(guò)多項(xiàng)創(chuàng)新精準(zhǔn)理解用戶(hù)意圖,召回更加準(zhǔn)確。同時(shí)上線API體驗(yàn)中心,歡迎您使用。

網(wǎng)址:https://platform.baichuan-ai.com/playground?sceneId=14

4)分析小結(jié)

通過(guò)對(duì)百川大模型的分析,結(jié)合XXX目前的AI產(chǎn)品應(yīng)用場(chǎng)景,可取之處是:

  1. 文檔讀取提煉能力,是已有的服務(wù),接入可使用。
  2. 企業(yè)知識(shí)庫(kù)功能比較完備,可以借鑒和使用。
  3. 長(zhǎng)文本的輸入是一個(gè)優(yōu)勢(shì)。
  4. 新聞?wù)?、投資研究分析、辦公提效、公文寫(xiě)作、文檔翻譯,這些工具已經(jīng)設(shè)計(jì)并開(kāi)發(fā)好了,可以借鑒和使用,有比較好的表現(xiàn)。
  5. 輸入網(wǎng)址,可以讀取內(nèi)容。
  6. 總結(jié):性能強(qiáng),技術(shù)好,系統(tǒng)生態(tài)和產(chǎn)品矩陣欠缺,初創(chuàng)公司,服務(wù)不一定能跟上。

4. MINIMAX大模型

1)模型定位分析

大模型產(chǎn)品介紹:https://api.minimax.chat/

MiniMax開(kāi)放平臺(tái)提供基于自然語(yǔ)言交互的文本生成能力(文本大模型)、語(yǔ)音生成能力(語(yǔ)音大模型)和長(zhǎng)記憶檢索、知識(shí)庫(kù)檢索等能力,賦能開(kāi)發(fā)者完成所在行業(yè)的AI場(chǎng)景創(chuàng)新。

  • 文本大模型(Chat Completion、Chat Completion Pro):基于自然語(yǔ)言交互的文本生成能力接口;
  • 語(yǔ)音大模型(T2A、T2A pro、T2A large):基于自然語(yǔ)言交互生成能力的文字轉(zhuǎn)語(yǔ)音接口;
  • 向量(Embeddings):文本轉(zhuǎn)化為高維向量接口,可實(shí)現(xiàn)如長(zhǎng)記憶檢索、知識(shí)庫(kù)檢索等能力;
  • 知識(shí)庫(kù)(Retrieval):支持高效檢索文檔信息,準(zhǔn)確回答專(zhuān)業(yè)問(wèn)題,為大模型補(bǔ)充專(zhuān)業(yè)領(lǐng)域知識(shí)。

除了標(biāo)準(zhǔn)的API接口,我們提供定制模型微調(diào)。支持構(gòu)造定制數(shù)據(jù)集對(duì)預(yù)訓(xùn)練模型進(jìn)行微調(diào)、支持多樣化微調(diào),還支持云端私有化等多種交付方式。

2)產(chǎn)品體驗(yàn)和測(cè)評(píng)

文本體驗(yàn)中心:

語(yǔ)音體驗(yàn)中心:

3)接入方式

4)分析小結(jié)

通過(guò)對(duì)百川大模型的分析,結(jié)合XXX目前的AI產(chǎn)品應(yīng)用場(chǎng)景,可取之處是:

  1. 文本大模型沒(méi)什么特色和亮點(diǎn),收費(fèi)比百度貴;
  2. 語(yǔ)音大模型,可以考慮接入,對(duì)資訊文章進(jìn)行語(yǔ)音播報(bào),但是收費(fèi)比較貴,一篇500字左右的文章語(yǔ)音播放費(fèi)用,大概是3~5元。

5. 阿里通義大模型

1)模型定位分析

① 大模型產(chǎn)品介紹:https://tongyi.aliyun.com/

② 大模型的通用能力:

③ 垂直領(lǐng)域模型:

基座模型已升級(jí)到2.0版本。

開(kāi)發(fā)并上線了基于通義千問(wèn)的8個(gè)垂直領(lǐng)域模型。

2)產(chǎn)品體驗(yàn)和測(cè)評(píng)

提問(wèn)體驗(yàn)和測(cè)評(píng):

3)接入方式

4)分析小結(jié)

  1. 模型通用能力強(qiáng),對(duì)用戶(hù)語(yǔ)言理解好,回答較充分;
  2. 行業(yè)垂類(lèi)模型做得好,產(chǎn)品矩陣好,可作為工具模型接入“通義點(diǎn)金”等產(chǎn)品;
  3. 產(chǎn)品設(shè)計(jì)能力強(qiáng),體系化值得借鑒;
  4. 圖片解析能力一般;
  5. 文檔解讀能力強(qiáng)。

6. 智譜大模型

1)模型定位分析

大模型產(chǎn)品介紹:https://www.zhipuai.cn/

大模型的能力:

基于千億基座模型 GLM-130B,注入代碼預(yù)訓(xùn)練,通過(guò)有監(jiān)督微調(diào)等技術(shù)實(shí)現(xiàn)人類(lèi)意圖對(duì)齊,具備問(wèn)答、多輪對(duì)話、代碼生成功能的中英雙語(yǔ)大模型。

2)產(chǎn)品體驗(yàn)和測(cè)評(píng)

3)接入方式

4)分析小結(jié)

  1. 接入的價(jià)格比較低,通用能力還OK;
  2. 技術(shù)實(shí)力比較好。

7. 訊飛星火大模型

1)模型定位分析

大模型產(chǎn)品介紹:

https://xinghuo.xfyun.cn/?ch=bdtg_xh_kw612&bd_vid=10136413666023107181

大模型的能力:

新一代認(rèn)知智能大模型,擁有跨領(lǐng)域知識(shí)和語(yǔ)言理解能力,能夠基于自然對(duì)話方式理解與執(zhí)行任務(wù)。

2)產(chǎn)品體驗(yàn)和測(cè)評(píng)

3)大模型原生應(yīng)用產(chǎn)品體驗(yàn)

4)接入方式

5)分析小結(jié)

  1. 模型性能好,多工具使用,AI產(chǎn)品矩陣比較全面;
  2. 文本回答好、圖片解析精準(zhǔn),有情感;
  3. 產(chǎn)品生態(tài)強(qiáng),有多個(gè)原生應(yīng)用可接入,落地應(yīng)用做得好;
  4. 【訊飛智文】這個(gè)產(chǎn)品有很好的借鑒作用,可考慮在實(shí)際應(yīng)用場(chǎng)景中進(jìn)行落地。

8. OpenAI chatGPT-Turbo大模型

定位:

ChatGPT-Turbo被設(shè)計(jì)為提供高效、快速和準(zhǔn)確的自然語(yǔ)言處理服務(wù),它適用于多種場(chǎng)景,如智能客服、自然語(yǔ)言生成、文本摘要等。

能力:

該模型具備強(qiáng)大的語(yǔ)言理解和生成能力,能夠理解和處理各種復(fù)雜的語(yǔ)言結(jié)構(gòu)和含義,并根據(jù)用戶(hù)輸入的上下文生成相應(yīng)的回復(fù)或文本。它還能夠處理多種語(yǔ)言,包括英語(yǔ)、中文等,使得跨語(yǔ)言交流更加便捷。

特點(diǎn):

ChatGPT-Turbo采用了先進(jìn)的深度學(xué)習(xí)技術(shù)和大規(guī)模語(yǔ)料庫(kù)進(jìn)行訓(xùn)練,從而使其具備了高度的泛化能力和魯棒性。此外,該模型還支持微調(diào),可以根據(jù)特定任務(wù)或領(lǐng)域的數(shù)據(jù)進(jìn)行進(jìn)一步的優(yōu)化,提高其在特定場(chǎng)景下的性能。

價(jià)格:

名為“gpt-3.5-turbo”的模型,其價(jià)格為0.002美元/每1000 tokens。

9. Google Gemini大模型

Google Gemini大模型是Google推出的一款多模態(tài)大模型,它的定位、能力、特點(diǎn)和價(jià)格可以從以下幾個(gè)方面進(jìn)行分析:

定位:

Google Gemini大模型被定位為能夠同時(shí)處理文本、圖像、音頻、視頻和代碼五種類(lèi)型信息的人工智能模型,旨在提供全面的多模態(tài)處理能力,支持廣泛的自然語(yǔ)言處理和多媒體任務(wù)。它可以應(yīng)用于搜索、廣告、Chrome等服務(wù)中,也可以用于開(kāi)發(fā)者和企業(yè)客戶(hù)的各種應(yīng)用場(chǎng)景中。

能力:

  1. 多模態(tài)處理能力:Gemini大模型具備同時(shí)處理文本、圖像、音頻、視頻和代碼五種類(lèi)型信息的能力,可以實(shí)現(xiàn)不同模態(tài)之間的轉(zhuǎn)換和理解。
  2. 自然語(yǔ)言處理能力:Gemini在自然語(yǔ)言處理方面表現(xiàn)出色,包括文本分類(lèi)、情感分析、問(wèn)答系統(tǒng)等任務(wù),同時(shí)支持多種主流編程語(yǔ)言的高質(zhì)量代碼生成。
  3. 強(qiáng)大的推理能力:Gemini能夠在短時(shí)間內(nèi)通讀大量論文并進(jìn)行總結(jié),展現(xiàn)出了強(qiáng)大的復(fù)雜推理能力。

特點(diǎn):

  1. 原生多模態(tài):與之前的多模態(tài)AI模型不同,Gemini是原生支持多模態(tài)能力的AI模型,從一開(kāi)始就在不同模態(tài)上進(jìn)行預(yù)訓(xùn)練,能更高效地使用AI模型的算力。
  2. 安全性評(píng)估:Gemini在發(fā)布時(shí)經(jīng)過(guò)了全面的安全性評(píng)估,以確保其在實(shí)際應(yīng)用中的安全性和穩(wěn)定性。
  3. 可擴(kuò)展性:Gemini具有三個(gè)不同體量的模型,可以根據(jù)不同任務(wù)需求進(jìn)行選擇和擴(kuò)展。

價(jià)格:

關(guān)于Google Gemini大模型的具體價(jià)格,目前尚未有公開(kāi)信息??紤]到Google通常將其AI技術(shù)通過(guò)Google Cloud AI平臺(tái)提供服務(wù),預(yù)計(jì)其價(jià)格會(huì)根據(jù)使用量、模型大小和所需計(jì)算資源等因素進(jìn)行計(jì)費(fèi)。具體價(jià)格需要參考Google Cloud的官方定價(jià)頁(yè)面或聯(lián)系銷(xiāo)售代表獲取。

整體而言,該大模型的英文效果不錯(cuò),不支持中文。

10. 對(duì)比分析總結(jié)

1)百度文心大模型

  • 優(yōu)勢(shì):語(yǔ)言大模型技術(shù)領(lǐng)先,中文處理能力強(qiáng),有豐富的應(yīng)用場(chǎng)景和生態(tài)。
  • 劣勢(shì):對(duì)硬件要求較高,部署和運(yùn)維成本較高。
  • 產(chǎn)品性能:高性能的自然語(yǔ)言處理能力。
  • 擅長(zhǎng)領(lǐng)域:語(yǔ)言生成、語(yǔ)言理解、機(jī)器翻譯等。
  • 接入方式:API接入,支持多種編程語(yǔ)言。
  • 使用成本:中等。

2)百川大模型

  • 優(yōu)勢(shì):模型規(guī)模大,能夠處理大規(guī)模的文本數(shù)據(jù)和復(fù)雜場(chǎng)景。
  • 劣勢(shì)部署和運(yùn)維成本較高,對(duì)硬件資源要求嚴(yán)格。
  • 產(chǎn)品性能:高性能的自然語(yǔ)言處理和文本生成能力。
  • 擅長(zhǎng)領(lǐng)域:文本摘要、內(nèi)容生成等。
  • 接入方式:API接入,支持多種編程語(yǔ)言。
  • 使用成本:中等。

3)Minimax

  • 優(yōu)勢(shì):技術(shù)實(shí)力雄厚,致力于開(kāi)發(fā)AI解決方案,具有廣泛的應(yīng)用場(chǎng)景和生態(tài)。
  • 劣勢(shì):對(duì)硬件要求較高,部署和運(yùn)維成本較高。
  • 產(chǎn)品性能:高性能的自然語(yǔ)言處理能力。
  • 擅長(zhǎng)領(lǐng)域:語(yǔ)言生成、語(yǔ)言理解、機(jī)器翻譯等。
  • 接入方式:API接入,支持多種編程語(yǔ)言。
  • 使用成本:中等。

4)阿里通義

  • 優(yōu)勢(shì):有著強(qiáng)大的云計(jì)算基礎(chǔ)設(shè)施,大模型定制化程度高,性能穩(wěn)定。
  • 劣勢(shì):與外部生態(tài)的連接不夠豐富,應(yīng)用場(chǎng)景有限。
  • 產(chǎn)品性能:高性能的自然語(yǔ)言處理和圖像處理能力。
  • 擅長(zhǎng)領(lǐng)域:智能客服、智能推薦等。
  • 接入方式:API接入,支持多種編程語(yǔ)言。
  • 使用成本:中等。

5)訊飛星火

  • 優(yōu)勢(shì):語(yǔ)音識(shí)別與生成技術(shù)領(lǐng)先,語(yǔ)音大模型應(yīng)用廣泛。
  • 劣勢(shì):語(yǔ)言大模型技術(shù)相對(duì)較弱,對(duì)文本長(zhǎng)度和領(lǐng)域有一定的限制。
  • 產(chǎn)品性能:高性能的語(yǔ)音識(shí)別和生成能力。
  • 擅長(zhǎng)領(lǐng)域:語(yǔ)音交互、語(yǔ)音轉(zhuǎn)換等。
  • 接入方式:API接入,支持多種編程語(yǔ)言。
  • 使用成本:較高。

6)OpenAI

  • 優(yōu)勢(shì):在自然語(yǔ)言處理領(lǐng)域具有很高的聲譽(yù)和技術(shù)實(shí)力,有廣泛的應(yīng)用場(chǎng)景和生態(tài)。
  • 劣勢(shì):對(duì)硬件要求較高,部署和運(yùn)維成本較高。
  • 產(chǎn)品性能:高性能的自然語(yǔ)言處理能力。
  • 擅長(zhǎng)領(lǐng)域:語(yǔ)言生成、語(yǔ)言理解、機(jī)器翻譯等。
  • 接入方式:API接入,支持多種編程語(yǔ)言。
  • 使用成本:較高。

五、大模型橫向?qū)Ρ葴y(cè)試

1. 翻譯文章功能測(cè)試

專(zhuān)家審核結(jié)果:

邀請(qǐng)行業(yè)知名英文編輯老師查看翻譯質(zhì)量的結(jié)論。

看了4家翻譯,每家都有錯(cuò)。具體問(wèn)題如下:

1)專(zhuān)有公司名都是錯(cuò)的,都是按照字面翻。這是非特別訓(xùn)練的數(shù)據(jù)的基本共同問(wèn)題。

2)文字的基本語(yǔ)法是正確的。

但是不能達(dá)到專(zhuān)業(yè)新聞寫(xiě)作的提供解釋性?xún)?nèi)容的要求。特別是百川的好些。

3)4個(gè)翻譯中,百川大模型中準(zhǔn)確性最高,百度文心和訊飛星火并列。最差是OpenAI,把“盛美上?!弊g為中芯國(guó)際的“SMIC”。

文中涉及的公司名,標(biāo)準(zhǔn)處理如下:

  • 中科共芯 (剛注冊(cè),還沒(méi)有官網(wǎng),用漢語(yǔ)拼音可以)
  • 盛美上海 ACM Research
  • 拓荊科技 Picotech
  • 中科飛測(cè) Skyverse
  • 微導(dǎo)納米 Leadmicro

2. 通用問(wèn)題測(cè)試

以下是10個(gè)通用的問(wèn)題,它們覆蓋了不同的主題和領(lǐng)域,旨在幫助您測(cè)試大模型的語(yǔ)言能力:

這些問(wèn)題旨在評(píng)估大模型在不同主題和領(lǐng)域內(nèi)的知識(shí)理解、分析能力和語(yǔ)言表達(dá)水平。通過(guò)這些問(wèn)題,您可以對(duì)大模型的語(yǔ)言能力進(jìn)行全面而有效的測(cè)試。

問(wèn)題1:什么是人工智能?請(qǐng)簡(jiǎn)述其發(fā)展歷程和當(dāng)前應(yīng)用領(lǐng)域。

測(cè)試結(jié)果如下:

問(wèn)題2:環(huán)境保護(hù)對(duì)于可持續(xù)發(fā)展為何重要?請(qǐng)談?wù)勀目捶ā?/strong>

測(cè)試結(jié)果如下:

問(wèn)題3:描述一下互聯(lián)網(wǎng)如何改變了我們的生活方式和工作方式?

測(cè)試結(jié)果如下:

問(wèn)題4:在全球化背景下,不同文化間的交流與融合有哪些積極作用?

測(cè)試結(jié)果如下:

問(wèn)題5:請(qǐng)談?wù)勀鷮?duì)健康和健康生活方式的理解,以及它們對(duì)個(gè)人和社會(huì)的重要性。

測(cè)試結(jié)果如下:

問(wèn)題6:教育對(duì)于個(gè)人成長(zhǎng)和社會(huì)發(fā)展有何重要性?您認(rèn)為教育的未來(lái)趨勢(shì)是什么?

測(cè)試結(jié)果如下:

問(wèn)題7:科技進(jìn)步如何影響我們的日常生活?請(qǐng)舉例說(shuō)明。

測(cè)試結(jié)果如下:

問(wèn)題8:旅行可以帶來(lái)哪些好處?請(qǐng)談?wù)勀钕矚g的旅行經(jīng)歷及其對(duì)您的影響。

測(cè)試結(jié)果如下:

  1. 百川、MINIMAX、千問(wèn)比較雷同;
  2. 百度和訊飛的回答風(fēng)格比較類(lèi)似;
  3. OpenAI的是最全面,并且最智能的,知道自己是虛擬助手。

問(wèn)題9:您如何看待社交媒體在現(xiàn)代社會(huì)中的角色?它有哪些正面和負(fù)面影響?

測(cè)試結(jié)果如下:

問(wèn)題10:請(qǐng)描述一下您對(duì)未來(lái)世界的展望,包括科技、環(huán)境、社會(huì)等方面的發(fā)展趨勢(shì)。

測(cè)試結(jié)果如下:

3. 測(cè)試結(jié)果小結(jié)

橫向?qū)Ρ然卮穑诿總€(gè)問(wèn)題上的表現(xiàn),表現(xiàn)比較好的打鉤√,表現(xiàn)稍微差一些的不標(biāo)識(shí)。

小結(jié):

  1. 通用問(wèn)題是AI生成的。
  2. 測(cè)評(píng)打分主要是從回答的豐富度、完整等、深度,以及連接輸出的穩(wěn)定性上進(jìn)行考察。
  3. 整體而言,Open AI的效果確實(shí)比國(guó)內(nèi)大模型的表現(xiàn)要好一些。
  4. 國(guó)內(nèi)大模型,在通用能力的語(yǔ)言理解和表達(dá)上,以百度文心和通義千問(wèn)效果最佳。
  5. 訊飛星火的得分比較低,主要是因?yàn)樵谕粋€(gè)問(wèn)題上,回答的結(jié)構(gòu)性,輸出的文字內(nèi)容豐富度不夠其他家好,但是整體給出的回答也是不錯(cuò)的。
  6. 結(jié)果只是相對(duì)而言,摻雜著作者的主觀感受,僅供參考。

4. 專(zhuān)業(yè)機(jī)構(gòu)測(cè)評(píng)結(jié)果參考

SuperCLUE總排行榜(2023年12月)

可參考:

SuperCLUE十大基礎(chǔ)能力排行榜(2023年12月)

可參考:

分析小結(jié):

  1. 在計(jì)算、邏輯與推理、代碼、語(yǔ)言理解和收取、生成與創(chuàng)作、上下文對(duì)話、角色扮演、工具使用、傳統(tǒng)安全等領(lǐng)域,GPT4-Turbo是表現(xiàn)最好的,其次是國(guó)內(nèi)的文心一言4.0,千問(wèn)等;
  2. 知識(shí)與百科,國(guó)內(nèi)的大模型表現(xiàn)比較好。

六、調(diào)研總結(jié)對(duì)比

1. 大模型的分類(lèi)及主要應(yīng)用場(chǎng)景

目前國(guó)內(nèi)主流使用的是大語(yǔ)言模型、CV視覺(jué)模型,以及一些行業(yè)應(yīng)用的垂類(lèi)模型。

2. 大語(yǔ)言模型的應(yīng)用分類(lèi)

3. 能力對(duì)比

4. 價(jià)格對(duì)比

七、大模型選型建議

1. 選擇一家供應(yīng)商的方案

  1. 如果是“API接入”的方式,取通用能力,首選效果好的百川大模型、其次是百度文心大模型、阿里通義大模型;
  2. 如果是“API接入+微調(diào)+服務(wù)器”的方式,取生態(tài)好,有云服務(wù)的廠商,首選:百度文心大模型、阿里通義大模型;
  3. 如果是“API接入+微調(diào)+服務(wù)器+行業(yè)落地應(yīng)用+AI工具”的方式,取通用能力強(qiáng)、生態(tài)好、產(chǎn)品矩陣豐富、有云服務(wù)的廠商、行業(yè)落地產(chǎn)品有實(shí)際案例的,首選:阿里通義大模型、百度文心大模型、其次訊飛星火大模型。

綜合來(lái)看,考慮企業(yè)的實(shí)際情況,最有可能選擇的供應(yīng)商:阿里通義大模型、百度文心大模型。

2. 多家供應(yīng)商并用的方案

  1. 通用大模型,可選:百度文心大模型、阿里通義大模型、百川大模型、訊飛星火大模型;
  2. 行業(yè)落地垂類(lèi)模型,可選:阿里通義大模型;
  3. 更多AI工具接入,可選:訊飛星火大模型。

綜合來(lái)看,可采用API的方式接入:百度文心大模型、阿里通義大模型、訊飛星火大模型,局部AI能力購(gòu)買(mǎi)百度或訊飛。

放棄微調(diào),采用百度、阿里的垂類(lèi)模型定制功能,可能成本更低一些。

3. 低成本提效的方案

如果成本考慮優(yōu)先、又希望效果比較,在目前用戶(hù)量和影響力還比較好的情況下,可采取:

  1. 通用能力接openAI 的ChatGPT3.5或ChatGPT4.0的模型。前提是合法合規(guī)。
  2. 放棄微調(diào),購(gòu)買(mǎi)定制開(kāi)發(fā)垂類(lèi)模型。
  3. 定向開(kāi)發(fā)AI行業(yè)屬性應(yīng)用工具

八、小結(jié)

本文調(diào)研的過(guò)程有其限制性,隨著時(shí)間的推移,大模型技術(shù)在不斷更新迭代,調(diào)研結(jié)果僅供參考交流使用。

在調(diào)研過(guò)程中受益最大的是本人自己,整體對(duì)各家大模型產(chǎn)品和效果進(jìn)行了橫向比較和測(cè)試。通過(guò)實(shí)際試用和體驗(yàn),對(duì)國(guó)內(nèi)大模型有了比較全面的了解。

專(zhuān)欄作家

Echo 產(chǎn)品論,微信公眾號(hào):產(chǎn)品經(jīng)理的邏輯與審美,人人都是產(chǎn)品經(jīng)理專(zhuān)欄作家。10年產(chǎn)品經(jīng)驗(yàn),多個(gè)0~1的完整產(chǎn)品經(jīng)歷,前好未來(lái)智能學(xué)習(xí)內(nèi)容產(chǎn)品專(zhuān)家,目前聚焦在AI領(lǐng)域,專(zhuān)研AIGC行業(yè)應(yīng)用產(chǎn)品落地研發(fā),對(duì)產(chǎn)品的邏輯和審美有獨(dú)到的思考。

本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載

題圖來(lái)自Unsplash,基于CC0協(xié)議

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 個(gè)人感覺(jué)最新的智譜4.0要比文心和通義已經(jīng)領(lǐng)先了

    來(lái)自浙江 回復(fù)
    1. 某些方面吧,大模型都在進(jìn)化,可以多嘗試使用幾種

      如需了解更多產(chǎn)品內(nèi)容,可以關(guān)注我的公號(hào)哦,【產(chǎn)品經(jīng)理的邏輯與審美】

      來(lái)自北京 回復(fù)
  2. 哈哈哈辛苦辛苦

    來(lái)自廣東 回復(fù)
    1. 1

      來(lái)自北京 回復(fù)
  3. 好多啊,花了不少時(shí)間吧,博主牛,感謝分享!

    來(lái)自福建 回復(fù)