產(chǎn)品趨勢(shì):四大批次備案境內(nèi)深度學(xué)習(xí)算法及公司一覽
隨著人工智能賽道的火熱,監(jiān)管方面的相關(guān)工作也在不斷推進(jìn)中。本文總結(jié)了四大批次備案境內(nèi)深度學(xué)習(xí)算法及公司一覽,供你參考。
2024年3月,人工智能賽道上,中美印歐等國(guó)家和地區(qū)在監(jiān)管探索方面展現(xiàn)出不同策略。而在我國(guó),隨著一系列監(jiān)管方案的出臺(tái),境內(nèi)深度學(xué)習(xí)算法的備案工作也在有序推進(jìn)。
梳理了網(wǎng)信辦《境內(nèi)深度合成服務(wù)算法備案清單》四份備案材料,統(tǒng)計(jì)一共涉及了326項(xiàng)算法備案,包括2023年6月、2023年8月、2024年1月、2024年2月的備案清單,以及最后的3項(xiàng)補(bǔ)充備案。
一、哪個(gè)細(xì)分賽道的深度合成算法玩家最多?最卷?
在深度合成算法領(lǐng)域,幾類(lèi)算法因其廣泛的應(yīng)用和實(shí)用性而備受歡迎。這些算法包括文本生成算法、圖像生成算法、語(yǔ)音生成算法、視頻生成算法、數(shù)字人生成算法、代碼生成算法以及音頻生成算法。
1. 文本生成算法:主要用途包括智能對(duì)話、知識(shí)問(wèn)答、文章寫(xiě)作、機(jī)器翻譯等
- 智譜ChatGLM生成算法 (北京智譜華章科技有限公司)
- 百度PLATO大模型算法 (北京百度網(wǎng)訊科技有限公司)
- 小冰語(yǔ)言模型算法 (北京紅棉小冰科技有限公司)
比如,智譜ChatGLM生成算法的準(zhǔn)確性不亞于GPT3.5,同時(shí)集成了文生圖、智能對(duì)話、數(shù)據(jù)分析等。測(cè)試下來(lái),智譜的長(zhǎng)文本解讀功能真的強(qiáng)悍,支持不超過(guò)30M的PDF文件解讀,準(zhǔn)確率極高,期待開(kāi)放更多doc等格式。但文生圖、數(shù)據(jù)分析功能并不好用。舉個(gè)例子,其中文生圖的promote語(yǔ)句“不帶眼鏡”但生成的圖像基本都帶有眼鏡、數(shù)據(jù)分析只能支持平均數(shù)、中文數(shù)等分析。
智譜并不是一個(gè)熟悉的AI公司,但其背后卻是互聯(lián)網(wǎng)資本。早在2023年的8月和9月,阿里巴巴旗下的螞蟻集團(tuán)與阿里云戰(zhàn)投相繼參與了對(duì)智譜AI的融資,分別投入了4.4億元和12億元,助力其B輪次的融資。此外,這一輪融資還吸引了順為、小米、紅杉、高瓴、騰訊等眾多知名投資方的加入,形成了豪華的投資陣容。
2. 圖像生成算法:主要用途涵蓋虛擬試衣、虛擬裝修、虛擬形象、表情特效、圖片編輯等
- 百度文生圖內(nèi)容生成算法(北京百度網(wǎng)訊科技有限公司)
- 商湯秒畫(huà)內(nèi)容生成算法(上海商湯智能科技有限公司)
- 商湯格物高精度重建算法(上海商湯智能科技有限公司)
本月商湯系的MiniMax剛獲得阿里巴巴的領(lǐng)投,根據(jù)彭博社的消息,新一輪融資完成后,MiniMax的估值將超25億美元(約合人民幣180億)。
MiniMax自主研發(fā)的AI聊天應(yīng)用Glow允許用戶(hù)親手“塑造”出個(gè)性化的AI智能體,無(wú)論是理想的戀人還是親密的朋友,用戶(hù)都可以根據(jù)自己的喜好為其取名,并設(shè)定獨(dú)特的人設(shè)、性格和愛(ài)好。通過(guò)與這些AI智能體的內(nèi)容生成和用戶(hù)反饋機(jī)制,用戶(hù)可以進(jìn)行自然而流暢的溝通交流。據(jù)媒體報(bào)道,Glow自上線以來(lái)僅短短4個(gè)月時(shí)間,用戶(hù)數(shù)量便迅速逼近500萬(wàn),展現(xiàn)出強(qiáng)大的市場(chǎng)潛力和用戶(hù)吸引力。
3. 語(yǔ)音生成算法主要用途包括文本轉(zhuǎn)語(yǔ)音、語(yǔ)音合成、歌聲合成等
- 百度語(yǔ)音合成算法(北京百度網(wǎng)訊科技有限公司)
- 達(dá)摩院語(yǔ)音合成算法(阿里巴巴達(dá)摩院(杭州)科技有限公司)
- 訊飛語(yǔ)音合成算法(科大訊飛股份有限公司)
語(yǔ)音生成算法在文本轉(zhuǎn)語(yǔ)音、語(yǔ)音合成和歌聲合成等方面具有廣泛應(yīng)用,為語(yǔ)音交互和語(yǔ)音內(nèi)容創(chuàng)作提供了可能。我使用最多的是飛書(shū)妙記的語(yǔ)音轉(zhuǎn)文字,相比onenote插件僅支持繁體字、騰訊會(huì)議的ai錄屏等,飛書(shū)妙記的網(wǎng)頁(yè)版非常方便、不容易斷續(xù)且文本翻譯質(zhì)量非常高。
此外,字節(jié)在剪映等視頻剪輯軟件中的變聲、文字轉(zhuǎn)語(yǔ)音等應(yīng)用也非常使用且場(chǎng)景豐富。
4. 視頻生成算法:主要用途包括虛擬數(shù)字人、視頻換臉、視頻風(fēng)格轉(zhuǎn)換等
- 百度數(shù)字人驅(qū)動(dòng)算法(北京百度網(wǎng)訊科技有限公司)
- 商湯2D數(shù)字人合成算法(上海商湯智能科技有限公司)
- 騰訊云數(shù)字人形象合成算法(深圳市騰訊計(jì)算機(jī)系統(tǒng)有限公司)
騰訊云、火山引擎B端定制數(shù)字人的價(jià)格是6000+/個(gè),但通用版其實(shí)基本免費(fèi),這類(lèi)IP類(lèi)的落地和使用也較多。應(yīng)用場(chǎng)景比如說(shuō)金融行業(yè):銀行、保險(xiǎn)、證券等,證券分析師、保險(xiǎn)代理人等觸客一線的專(zhuān)業(yè)人士可以利用數(shù)字人進(jìn)行溝通產(chǎn)出,我們公司已在使用。此外自媒體等ip產(chǎn)出也較多,例如財(cái)經(jīng)類(lèi)大V等視頻其實(shí)并不是本人,而是MCN機(jī)構(gòu)量產(chǎn)的數(shù)字人。
5. 代碼生成算法:主要用途包括代碼自動(dòng)生成、代碼翻譯等
- 商湯AI代碼生成算法(上海商湯智能科技有限公司)
- 商湯AI代碼生成算法-1(上海商湯智能科技有限公司)
我們公司已在推廣使用代碼助手,看了一眼推特上STEVEN HONG利用AI發(fā)布的代碼問(wèn)答非常專(zhuān)業(yè),理解后續(xù)能解放雙手、釋放效率也非常棒。
6. 音頻生成算法:主要用途包括語(yǔ)音合成、歌聲合成等
- 快音音色提取和歌聲合成算法(成都開(kāi)心音符科技有限公司)
- 小冰歌聲合成服務(wù)算法(北京紅棉小冰科技有限公司)
- 唱鴨文字生成音樂(lè)算法(廣州歡城文化傳媒有限公司)
二、主要玩家是哪些?
就備案數(shù)量而言,深度合成算法領(lǐng)域,國(guó)內(nèi)的主要玩家包括北京百度網(wǎng)訊科技有限公司、上海商湯智能科技有限公司和北京紅棉小冰科技有限公司。
北京百度網(wǎng)訊科技有限公司以19次的出現(xiàn)次數(shù)高居榜首,顯示了其在深度合成算法領(lǐng)域的廣泛布局和強(qiáng)大實(shí)力。百度在文本生成、圖像生成、語(yǔ)音生成、視頻生成、數(shù)字人生成等多個(gè)領(lǐng)域均有突出的算法表現(xiàn),如百度PLATO大模型算法、百度文生圖內(nèi)容生成算法、百度語(yǔ)音合成算法以及百度數(shù)字人驅(qū)動(dòng)算法等。
上海商湯智能科技有限公司以12次的出現(xiàn)次數(shù)緊隨其后,其在圖像生成、代碼生成等領(lǐng)域擁有強(qiáng)大的技術(shù)實(shí)力。商湯的秒畫(huà)內(nèi)容生成算法、格物高精度重建算法以及AI代碼生成算法等,都展現(xiàn)了其在深度合成算法領(lǐng)域的創(chuàng)新能力和應(yīng)用潛力。
北京紅棉小冰科技有限公司以7次的出現(xiàn)次數(shù)位列第三,其在語(yǔ)言模型、數(shù)字人生成和音頻生成等領(lǐng)域有著不俗的表現(xiàn)。小冰語(yǔ)言模型算法、數(shù)字人合成算法以及歌聲合成服務(wù)算法等,都體現(xiàn)了小冰在人工智能領(lǐng)域的深厚積累和獨(dú)特優(yōu)勢(shì)。紅棉小冰前身為微軟(亞洲)互聯(lián)網(wǎng)工程院人工智能小冰團(tuán)隊(duì),是微軟全球最大的人工智能獨(dú)立產(chǎn)品研發(fā)團(tuán)隊(duì),該團(tuán)隊(duì)于2013年12月在中國(guó)組建。
三、第一批次到第四批次發(fā)生了哪些變化?
在2023年6月至2024年2月期間,深度合成服務(wù)算法備案清單展現(xiàn)出了明顯的變化趨勢(shì)。
首先,備案數(shù)量呈現(xiàn)出持續(xù)增長(zhǎng)的趨勢(shì)。從2023年6月的41個(gè)備案算法,到2024年2月的255個(gè),備案數(shù)量在短短幾個(gè)月內(nèi)實(shí)現(xiàn)了大幅提升。這反映出深度合成技術(shù)在我國(guó)的快速發(fā)展和廣泛應(yīng)用,同時(shí)也體現(xiàn)了監(jiān)管部門(mén)對(duì)于該領(lǐng)域日益嚴(yán)格的監(jiān)管要求。
其次,各類(lèi)算法的備案數(shù)量也呈現(xiàn)出不同的增長(zhǎng)態(tài)勢(shì)。文本生成類(lèi)算法的增長(zhǎng)尤為明顯,從2023年6月的較低占比增長(zhǎng)到2024年2月的超過(guò)50%。這表明文本生成技術(shù)在自然語(yǔ)言處理、智能問(wèn)答、內(nèi)容創(chuàng)作等領(lǐng)域的應(yīng)用正在不斷深化和拓展。同時(shí),圖像生成、語(yǔ)音生成、視頻生成、數(shù)字人生成、代碼生成和音頻生成等類(lèi)型的算法也都有不同程度的增長(zhǎng),反映了深度合成技術(shù)在多個(gè)領(lǐng)域的全面發(fā)展。
最后放鏈接《國(guó)家互聯(lián)網(wǎng)信息辦公室關(guān)于發(fā)布第四批深度合成服務(wù)算法備案信息的公告》https://www.cac.gov.cn/2024-02/18/c_1709925427424332.htm
本文由 @AI營(yíng)銷(xiāo)先鋒派 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉(zhuǎn)載。
題圖來(lái)自Unsplash,基于CC0協(xié)議。
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。
- 目前還沒(méi)評(píng)論,等你發(fā)揮!