200元可以播一天,數(shù)字人才是終極“搬磚”人?
數(shù)字人的身影已經(jīng)越來越頻繁地出現(xiàn)在人們的視野當(dāng)中,比如在帶貨直播間里,又比如在短視頻里。那么在未來,數(shù)字人是不是真的可以取代真人主播?可能一切還有待市場的反饋。本篇文章里,作者便針對數(shù)字人主播的發(fā)展進(jìn)行了解讀,一起來看。
日均成本200元左右的數(shù)字人直播間,你見過嗎?
最近,抖音的某個本地生活類賬號進(jìn)行了兩場帶貨直播。據(jù)新榜旗下抖音數(shù)據(jù)平臺新抖數(shù)據(jù)統(tǒng)計(jì),該賬號兩場直播的預(yù)估銷售額均在7萬元上下。數(shù)據(jù)看起來不高,但這兩場直播全程由數(shù)字人完成,單日成本僅190元,不需要場地以及燈光、攝像頭等硬件投入,只需要一臺電腦即可,且?guī)ж洺煽兒痛饲暗恼嫒酥鞑ハ嗖畈淮蟆?/p>
要知道,帶貨主播現(xiàn)在已經(jīng)是實(shí)實(shí)在在的高薪行業(yè)。以杭州為例,月薪1.5萬元都不一定能吸引到合適的主播,更何況一個直播間至少還需要承擔(dān)運(yùn)營等人力成本,以及燈光、場地等固定成本。
又便宜、又能7×24小時工作的數(shù)字人主播真出現(xiàn)了?
數(shù)字人公司硅基智能相關(guān)負(fù)責(zé)人羅峰(化名)告訴新榜編輯部,這種數(shù)字人屬于2D超寫實(shí)數(shù)字人。據(jù)介紹,硅基智能克隆數(shù)字人前需要主播先提供一段3-5分鐘的真人出鏡口播視頻,以及30秒的真人出鏡靜默視頻、純綠幕視頻、錄音文件。
“這些素材輸入到后臺,我們的代碼就能調(diào)用算力讓數(shù)字人根據(jù)對應(yīng)文本動起來,同時做好音畫同步的修正。”
羅峰強(qiáng)調(diào),數(shù)字人最好根據(jù)應(yīng)用場景來提供素材,如果想要讓數(shù)字人的應(yīng)用場景更通用,還可以提供比較通用的肢體動作素材。數(shù)字人從需求提交到克隆完成一般只需要5-7天即可。“得益于對嘴唇、身體動作等的精準(zhǔn)控制,硅基智能的數(shù)字人的聲音還原度可以達(dá)到80%-90%,擬真度最高能達(dá)到99%,外表基本上看不太出來”。
硅基智能采用的核心技術(shù)。圖源:受訪者
倒映有聲聯(lián)合創(chuàng)始人、CTO李驍補(bǔ)充,目前業(yè)內(nèi)的數(shù)字人公司主要有兩種技術(shù)路線:一種是紋理式,通過拼接聲音、口型、動作等讓數(shù)字人動起來;一種則是生成式,把數(shù)字人作為一個整體整個驅(qū)動起來。
籠統(tǒng)地說,區(qū)別于柳夜熙等3D超寫實(shí)數(shù)字人,以及A-soul等2D二次元數(shù)字人,2D超寫實(shí)數(shù)字人就是以真人為基礎(chǔ),制作出一個有動作、有聲音的二維圖片。李驍強(qiáng)調(diào):“對于數(shù)字人來說,最終是否足夠逼真是非常關(guān)鍵的一點(diǎn)?!?/p>
圖源:抖音
在最近的《劉潤年度演講2022:進(jìn)化的力量》中,潤米咨詢創(chuàng)始人劉潤爆料,今年10月1日開始,自己發(fā)布在社交平臺的視頻有不少都是由數(shù)字人完成的。利用數(shù)字人技術(shù),博主似乎不需要再化妝、背臺本、拍攝,只需要輸入一段文本就可以輸出一段以假亂真的短視頻。
羅峰透露,目前國內(nèi)提供類似服務(wù)的至少有4-5家,單單硅基智能就為抖音上的3萬多位博主制作了數(shù)字人。據(jù)了解,目前博主使用數(shù)字人時一般會穿插使用,有時間時就自己拍攝,外地出差時則在高鐵上編輯好文本,直接使用數(shù)字人。
據(jù)觀察,目前包括“劉潤”“駱駱整理說”“大巫聊裝修”等博主的視頻并未因?yàn)槭褂脭?shù)字人而出現(xiàn)明顯數(shù)據(jù)下滑。
從帶貨主播到短視頻博主,數(shù)字人真能代替真人嗎?
一、2D超寫實(shí),數(shù)字人的新解法?
數(shù)字人很多人應(yīng)該不陌生,此前新榜編輯部在系列文章《造價從100元到100萬,虛擬人究竟是什么?》《90%玩家處在早期階段,虛擬人靠什么賺錢?》《虛擬人四大難題:技術(shù)、產(chǎn)品、市場、中之人》中也做了相關(guān)報(bào)道。
數(shù)字人行業(yè)目前存在兩種路線:
3D超寫實(shí)數(shù)字人的優(yōu)勢非常明顯,不僅極具科技感,還能搭上元宇宙概念股,但劣勢同樣突出:價錢太貴,門檻太高。一個標(biāo)準(zhǔn)線以上的3D超寫實(shí)數(shù)字人,市場報(bào)價普遍在百萬級別,且產(chǎn)能有限。這也是為什么3D超寫實(shí)數(shù)字人更多活躍在短視頻甚至是圖片中。
2D二次元數(shù)字人的優(yōu)勢是便宜,能吸引二次元用戶,但卻很難幫品牌覆蓋更大范圍的用戶。有業(yè)內(nèi)人士表示,二次元數(shù)字人太小眾了。早在去年,韓束等品牌就開始在淘寶直播間使用2D二次元數(shù)字人帶貨,但更多是為了填充凌晨之后的“垃圾時間”。
圖源:抖音、淘寶
擬真度高,能降低觀眾接受難度之外,2D超寫實(shí)數(shù)字人的另一個特點(diǎn)就是便宜。
以硅基智能為例,數(shù)字人形象+聲音克隆的費(fèi)用為幾萬元/年。數(shù)字人如果用于拍攝短視頻,只需要再支付大約幾十元/分鐘的時長費(fèi);如果用于直播帶貨,則需要再支付幾千元/月的服務(wù)費(fèi)。
“中小商家使用素材庫中199元/月的通用數(shù)字人,直播費(fèi)用最低可以壓縮到5699元/月,有些通用數(shù)字人還是免費(fèi)的?!?/p>
羅峰透露,為了滿足中小商家的需求,硅基智能和模特經(jīng)紀(jì)公司合作,集中采購了一批模特的形象授權(quán)用于制作通用數(shù)字人。“通用數(shù)字人我們會盡量選得寬一些,各個行業(yè)都有,且不斷補(bǔ)充更新,另外還會有外國人形象的數(shù)字人用于英文直播?!?/p>
圖源:硅語元宇宙App
事實(shí)上,目前業(yè)內(nèi)已經(jīng)出現(xiàn)不少2D超寫實(shí)數(shù)字人創(chuàng)業(yè)公司,核心賣點(diǎn)就是便宜。比如“磊哥說同城運(yùn)營”在直播中就表示,數(shù)字人主播的費(fèi)用可以低至13.66元/小時,每月穩(wěn)定產(chǎn)出500條短視頻。
不同的數(shù)字人服務(wù)商。圖源:抖音
總得來說,不同城市、不同類目、不同直播間的成本差異極大,不同數(shù)字人公司給出的報(bào)價也不盡相同,但數(shù)字人主播比真人主播便宜,是沒什么問題的。
二、數(shù)字人做帶貨、拍視頻靠譜嗎?
從資本角度,數(shù)字人往往和元宇宙聯(lián)系在一起,數(shù)字人的價值取決于能否講出一個漂亮的、著眼未來的故事,但從直播、短視頻角度,判斷數(shù)字人價值的標(biāo)準(zhǔn)很簡單:能不能帶貨、有沒有流量。
先說直播帶貨。
需要具備一定的靈性,能和觀眾進(jìn)行深度的情感互動,同時必須進(jìn)行大量機(jī)械勞動,比如同樣的話術(shù)反復(fù)說無數(shù)次,這是帶貨主播少而貴的內(nèi)在原因。
以目前的技術(shù),數(shù)字人大概率代替不了董宇輝、李佳琦等個人風(fēng)格強(qiáng)烈的主播,但如果是在強(qiáng)調(diào)“貨帶人”的品牌直播間呢?觀眾不需要和主播進(jìn)行情感互動,產(chǎn)品好,價格便宜,還能把相關(guān)信息講清楚就行。
羅峰透露,大品牌的數(shù)字人通常在非熱門時段使用,熱門時段仍需要真人主播拉人氣。這個時候,數(shù)字人的定位更多是為了輔助主播,承擔(dān)一部分機(jī)械性勞動,以便支撐起24小時直播間。
至于中小商家,基本都是平播,提前錄好0.5-1小時的語音后,就可以配合數(shù)字人在直播間循環(huán)播放。這個時候,數(shù)字人的角色定位更像是圖像版智能客服。
面向淘寶商家的智能客服曾是一個垂直創(chuàng)業(yè)賽道,數(shù)字人主播像是直播電商時代的智能客服。圖源:網(wǎng)絡(luò)
數(shù)字人主播算是介于貨架電商和真人主播帶貨之間的一個新解決方案。
再來說短視頻拍攝。
做個選擇題,你能分辨出來劉潤的哪條視頻是真人拍攝,哪條視頻是用數(shù)字人拍攝嗎?
單就我的個人體驗(yàn),在快節(jié)奏的刷屏場景下,真人和數(shù)字人的視頻觀看體驗(yàn)差別并不大。
劉潤和崔磊的共同特點(diǎn)都是口播博主,他們的視頻特點(diǎn)是:場景固定,機(jī)位固定,動作固定,且更強(qiáng)調(diào)知識輸出而非個人表演。對這類博主來說,只要保證文本質(zhì)量,同時視頻觀看體驗(yàn)不太差,流量并不會有太大變化。
倒映有聲為陶勇醫(yī)生制作的數(shù)字人分身
圖源:騰訊視頻“眼科醫(yī)生陶勇”
對于數(shù)字人博主,自媒體人倪叔曾提出兩個問題:當(dāng)觀眾知道博主是數(shù)字人的時候,他們還有觀看、互動的動力嗎?當(dāng)知道博主的視頻只要輸入一段語音就能生成卻報(bào)價10萬元時,品牌方還愿意給錢嗎?
這里有個微妙的地方在于,我們可以說博主輸出的內(nèi)容質(zhì)量沒有變,視頻的流量也沒變,但觀眾和品牌的感受也不會變嗎?這個沒有絕對的對與錯,但需要時間來給出答案。羅峰提到,不少使用數(shù)字人的博主都和硅基智能簽署了保密協(xié)議??磥?,博主們可能也擔(dān)心這一點(diǎn)。
總得來說,數(shù)字人最明顯的優(yōu)勢就是能降低真人的時間成本、團(tuán)隊(duì)成本,提高他們的勞動產(chǎn)出。羅峰說:“我們想做的就是通過數(shù)字分身幫客戶躺著賺錢?!?/p>
此外,李驍認(rèn)為,數(shù)字人的另一大優(yōu)勢是可以進(jìn)行能力遷移,數(shù)字人既可以瞬間學(xué)會英語、法語等多國語言,還可以加載唱歌、跳舞等技能?!案裾嫒耍€能做一些真人做不到的事情,這會是數(shù)字人未來的兩個發(fā)展方向?!?/p>
三、數(shù)字人能讓人躺賺嗎?
幾年前,“睡后收入”概念曾流行一時,簡單來說,一個人什么都不用干,每天睡醒就能看到銀行卡里的錢越來越多,通過金融、IP等方式獲得大量非勞動性收入。
業(yè)內(nèi)對數(shù)字人的追捧,表面上是因?yàn)椴┲鲿r間太緊,沒時間拍視頻,主播價錢太貴,商家支付不起,但更深層次的原因是,業(yè)內(nèi)希望能用數(shù)字人完成視頻拍攝、直播帶貨等勞動,進(jìn)而實(shí)現(xiàn)低成本、無限制的效率產(chǎn)出。
想法很美好,但目前的數(shù)字人技術(shù)仍然存在一定局限。李驍表示,數(shù)字人最難的就是肢體動作的精準(zhǔn)匹配?!叭绾胃鶕?jù)語義對動作進(jìn)行推斷,如何把動作渲染出來,尤其是復(fù)雜環(huán)境下的運(yùn)動預(yù)判,目前還是一個比較難的問題?!?/p>
正因如此,目前的數(shù)字人還無法快速、低成本地滿足劇情、搞笑、顏值等博主的視頻拍攝要求,而更多聚焦動作變化不大,且主要展示上半身的口播主播。據(jù)了解,目前2D超寫實(shí)數(shù)字人創(chuàng)業(yè)公司的主要客群就是想轉(zhuǎn)型口播博主的律師、醫(yī)生、會計(jì)、心理咨詢師等專業(yè)人士。
當(dāng)然,隨著技術(shù)進(jìn)步,我相信數(shù)字人的智能程度會越來越高、相關(guān)成本會越來越低。但是,數(shù)字人也存在3個根本性問題:
第一,數(shù)字人只能解決效率問題,無法解決內(nèi)容問題、產(chǎn)品問題。劉潤可以靠數(shù)字人省去視頻拍攝的時間,但數(shù)字人說什么,仍然來自他對行業(yè)、人性、世界的思考;商家可以靠數(shù)字人獲得一定的成本優(yōu)勢,但當(dāng)大部分商家用上數(shù)字人后,決定貨能不能賣出去的,仍然是產(chǎn)品是否有足夠的競爭力。
倒映有聲聯(lián)合創(chuàng)始人、CMO何培成認(rèn)為:“如果最后數(shù)字人的效果不好,是怪自己的運(yùn)營能力還是怪?jǐn)?shù)字人?通過解放重復(fù)性勞動來壓縮人力成本,這才是數(shù)字人能解決的核心問題?!?/p>
第二,數(shù)字人尚未跑出成熟、可復(fù)制的商業(yè)模式。巨量引擎數(shù)據(jù)顯示,2022年直播電商行業(yè)至少有378萬的人才缺口。如果數(shù)字人能解決直播電商行業(yè)的勞動力問題,應(yīng)該會有不錯的商業(yè)前景。
在何培成看來,數(shù)字人的未來一定是面向廣大普通人,但很多人可能并沒有想清楚數(shù)字人到底有什么用?!拔覀儸F(xiàn)在主要聚焦廣電融媒體等B端用戶,一個原因就是B端用戶客單價更高,需求也更明確,相反,C端用戶并沒有太高的付費(fèi)意愿?!?/p>
此外,一旦數(shù)字人被證明可行,行業(yè)會迅速從卷真人變成卷數(shù)字人。最后,整個行業(yè)的競爭態(tài)勢很可能并不會發(fā)生根本性變化。
第三,數(shù)字人可以滿足博主、商家的需求,但未必能滿足觀眾的需求。觀眾可能因?yàn)樾迈r感圍觀少數(shù)幾個數(shù)字人,但無數(shù)科幻電影也描述了一種擔(dān)憂:相比帶來的便利,人類更厭惡數(shù)字人帶給生活的虛幻感?!凹兪止ぁ睘槭裁茨艹蔀闋I銷標(biāo)簽?因?yàn)楹芏嗳烁敢鉃橐粋€有血有肉的人付費(fèi),向一個活生生的人投入感情。
因?yàn)橛脩粜枨螅脚_也未必會允許數(shù)字人的大規(guī)模應(yīng)用。
數(shù)字人帶貨屬于抖音明文禁止的“錄播”行為嗎?新榜編輯部就此向幾大直播帶貨平臺詢問,截至發(fā)稿前,幾大平臺均未給出明確回復(fù)。此前有相關(guān)從業(yè)者表示,淘寶、京東這類純電商平臺不會限制數(shù)字人帶貨,但抖音、快手等內(nèi)容電商平臺,可能會在流量上做出一定限制。
圖源:抖音電商
據(jù)了解,目前的數(shù)字人直播通常會配備一個運(yùn)營,運(yùn)營既可以在后臺實(shí)時輸入文本,操作數(shù)字人回答觀眾提問,也可以以助理的身份幫助數(shù)字人回答問題?!拔覀兊臄?shù)字人不僅支持中之人模式,還可以實(shí)現(xiàn)數(shù)字人、真人的聯(lián)合直播”,羅峰補(bǔ)充。
短期內(nèi),如果能把技術(shù)、市場問題解決好,數(shù)字人主播/博主應(yīng)該能成為一個不錯的效率工具,但能否撐得上一個更大的故事,未來會不會被證明是泡沫,只能等更多市場反饋。
“說實(shí)話,數(shù)字人行業(yè)的真正需求我們也在持續(xù)深挖,更多的應(yīng)用場景也在嘗試落地;但毋庸置疑,在元宇宙和Web3.0的世界里,數(shù)字人是必定需要的底層基礎(chǔ)設(shè)施”,何培成說。
作者:云飛揚(yáng);編輯:張潔;校對:卷毛
原文標(biāo)題:不怕996,200元播一天,數(shù)字人才是終極社畜?
來源公眾號:新榜(ID:newrankcn),專注互聯(lián)網(wǎng)內(nèi)容領(lǐng)域的觀察報(bào)道,關(guān)心與內(nèi)容產(chǎn)業(yè)相關(guān)的人和事。
本文由人人都是產(chǎn)品經(jīng)理合作媒體@新榜 授權(quán)發(fā)布,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自Unsplash,基于CC0協(xié)議
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。提供信息存儲空間服務(wù)。
- 目前還沒評論,等你發(fā)揮!