用一篇文章,幫你了解什么是虛擬數(shù)字人?

1 評(píng)論 33483 瀏覽 41 收藏 15 分鐘

編輯導(dǎo)讀:洛天依的出現(xiàn)和爆火,讓很多人看到了虛擬偶像的廣闊市場(chǎng)。不僅如此,虛擬主播、虛擬員工等數(shù)字人不斷涌現(xiàn),在代替人類從事某些行業(yè)的同時(shí)也引發(fā)了一些爭(zhēng)議。本文作者圍繞“數(shù)字人”進(jìn)行分析,希望對(duì)你有幫助。

大家好,我是Clippp。今天為大家分享的是「虛擬數(shù)字人」。這段時(shí)間元宇宙概念的大火帶動(dòng)了很多人對(duì)未來(lái)的無(wú)限遐想,與元宇宙緊密相關(guān)的虛擬數(shù)字人的熱度也在提升。

現(xiàn)在網(wǎng)絡(luò)上經(jīng)常出現(xiàn)各式各樣的數(shù)字人,虛擬偶像、虛擬主播層出不窮,當(dāng)然伴隨著數(shù)字人一同出現(xiàn)的還有各種爭(zhēng)議。

今天我們就來(lái)一起探究虛擬數(shù)字人是什么、具有哪些特征,分為哪幾種類型以及都應(yīng)用在什么行業(yè),深入地了解虛擬數(shù)字人概念。

一、數(shù)字人的三方面特征

虛擬數(shù)字人是指具有數(shù)字化外形的虛擬人物。與具備實(shí)體的機(jī)器人不同,虛擬數(shù)字人依賴顯示設(shè)備存在,我們所知的很多虛擬人都要通過(guò)手機(jī)、電腦或者智慧大屏等設(shè)備才能顯示。

虛擬數(shù)字人宜具備以下三方面特征:

  • 一是擁有人的外觀,具有特定的相貌、性別和性格等人物特征;
  • 二是擁有人的行為,具有用語(yǔ)言、面部表情和肢體動(dòng)作表達(dá)的能力;
  • 三是擁有人的思想,具有識(shí)別外界環(huán)境、并能與人交流互動(dòng)的能力。

綜合來(lái)看,就是具備四方面的能力,即形象能力、感知能力、表達(dá)能力和娛樂互動(dòng)能力。

如果我們下次再看到有公司推出數(shù)字人,就可以結(jié)合這些特征和能力來(lái)判斷這個(gè)數(shù)字人的可信度,避免被借勢(shì)營(yíng)銷的企業(yè)鉆了空子。

二、數(shù)字人的運(yùn)作原理

知道了什么是數(shù)字人,接下來(lái)就要搞清楚數(shù)字人到底是怎么說(shuō)話、互動(dòng)的,是背后有真人在操控,還是完全通過(guò)技術(shù)生成。

面對(duì)新興的數(shù)字人,相信很多讀者都存在類似的疑問。

數(shù)字人的誕生發(fā)展和AI人工智能可以說(shuō)是密不可分,想了解數(shù)字人的運(yùn)作原理,首先要知道數(shù)字人的通用系統(tǒng)框架。

虛擬數(shù)字人系統(tǒng)一般情況下由人物形象、語(yǔ)音生成、動(dòng)畫生成、音視頻合成顯示、交互等5個(gè)模塊構(gòu)成。(資料參考:2020年虛擬數(shù)字人發(fā)展白皮書)

交互模塊為擴(kuò)展項(xiàng),根據(jù)其有無(wú),可將數(shù)字人分為交互型數(shù)字人和非交互型數(shù)字人。

首先看一下非交互型數(shù)字人:系統(tǒng)依據(jù)目標(biāo)文本生成對(duì)應(yīng)的人物語(yǔ)音及動(dòng)畫,并合成音視頻呈現(xiàn)給用戶。

交互型數(shù)字人

根據(jù)驅(qū)動(dòng)方式的不同可分為智能驅(qū)動(dòng)型和真人驅(qū)動(dòng)型。

?智能驅(qū)動(dòng)型數(shù)字人

通過(guò)智能系統(tǒng)自動(dòng)讀取并解析識(shí)別外界輸入信息,根據(jù)解析結(jié)果決策數(shù)字人后續(xù)的輸出文本,驅(qū)動(dòng)人物模型生成相應(yīng)的語(yǔ)音與動(dòng)作來(lái)使數(shù)字人跟用戶互動(dòng)。

這種人物模型是預(yù)先通過(guò)AI技術(shù)訓(xùn)練得到,可通過(guò)文本驅(qū)動(dòng)生成語(yǔ)音和對(duì)應(yīng)動(dòng)畫,業(yè)內(nèi)將此模型稱為TTSA(Text To Speech & Animation)人物模型。

真人驅(qū)動(dòng)型數(shù)字人

真人根據(jù)視頻監(jiān)控系統(tǒng)傳來(lái)的用戶視頻,與用戶實(shí)時(shí)語(yǔ)音,同時(shí)通過(guò)動(dòng)作捕捉采集系統(tǒng)將真人的表情、動(dòng)作呈現(xiàn)在虛擬數(shù)字人形象上,從而與用戶進(jìn)行交互。

三、數(shù)字人常見的類型

調(diào)研分析當(dāng)前市場(chǎng)上的數(shù)字人,根據(jù)人物圖形維度,分為2D和3D兩大類,從外形上可分為卡通、寫實(shí)等風(fēng)格,綜合來(lái)看可分為二次元、3D卡通、3D高寫實(shí)、真人形象四種類型。

接下來(lái)根據(jù)每種類型的特點(diǎn),從外在形象、服飾裝扮、表情動(dòng)作等方面,結(jié)合典型案例來(lái)逐一分析虛擬數(shù)字人的設(shè)計(jì)。

1. 二次元類型

虛擬歌手-洛天依

洛天依的職業(yè)設(shè)定為虛擬歌姬,個(gè)性軟萌可愛、溫柔細(xì)膩,外貌特征上是灰發(fā)、綠瞳,頭戴碧玉發(fā)飾。

▲除了獨(dú)特的形象和性格,洛天依還能唱歌、跳舞、直播帶貨,多樣的才藝加持讓人物設(shè)定不單薄,受到很多用戶的關(guān)注。

2. 3D卡通類型

虛擬助理-度曉曉

度曉曉是基于虛擬人IP的陪伴型虛擬助理。在小度助手的能力基礎(chǔ)上,度曉曉有虛擬人物形象和情感交互系統(tǒng),具備視覺識(shí)別能力,支持自然的交流方式。

▲在外形裝扮上,度曉曉是紅色短發(fā)的甜美可愛風(fēng),五官比例偏向二次元風(fēng)格。根據(jù)現(xiàn)有案例來(lái)看,度曉曉在眨眼、微笑等面部微動(dòng)作以及肢體的造型,都很自然、生動(dòng),整體設(shè)計(jì)效果相對(duì)較好。

▲度曉曉定期更新身穿不同主題服裝、擺著各種pose的形象,每套服裝都有一個(gè)主題再帶配上各種周邊小配飾,營(yíng)造出一種清新時(shí)尚的效果。

3. 3D高寫實(shí)類型

浦發(fā)銀行數(shù)字員工-小浦

小浦作為銀行的數(shù)字員工,主要進(jìn)行風(fēng)險(xiǎn)評(píng)估、要聞播報(bào)、投資建議等在線服務(wù)。

▲從外觀上,小浦在形象上無(wú)論發(fā)型還是五官都足夠擬人化、職業(yè)化,穿著銀行職業(yè)裝,屬于比較典型的銀行職員形象。

▲小浦沒有很夸張的面部表情,始終以面帶微笑的狀態(tài)面向用戶,給人一種親切感。肢體動(dòng)作相對(duì)較少,沒有特別夸張的動(dòng)作設(shè)定,只有固定的幾套動(dòng)作。

4. 虛擬偶像-AYAYI

AYAYI是使用Unreal引擎造出來(lái)的特別擬真的Metahuman形象。

▲外在形象:寫實(shí)程度更高,人物整體效果已經(jīng)和真人十分接近,五官特別精致、眼瞼微斂、銀色短發(fā),散發(fā)著一種清冷氣質(zhì)。

▲從AYAYI社交賬號(hào)的更新來(lái)看,目前主要是分享一些AYAYI的擺拍圖片,穿著的服裝、飾品都比較真實(shí)、時(shí)尚,拍照環(huán)境都是休閑、藝術(shù)類的場(chǎng)景。

▲ AYAYI人物形象的時(shí)尚感和真實(shí)感,更容易切入商業(yè)化,比如穿著特定品牌的服裝進(jìn)行擺拍。

高保真數(shù)字人-Siren(塞壬)

Siren是高保真、實(shí)時(shí)、可交互數(shù)字人,用到了實(shí)時(shí)渲染、表情捕捉、動(dòng)作捕捉、高保真3D掃描等前沿技術(shù),達(dá)到了目前業(yè)界最高的技術(shù)水平。

▲Siren的面貌細(xì)節(jié)更加真實(shí),可以很清楚看到皮膚的細(xì)節(jié)、眼睛的轉(zhuǎn)動(dòng)、說(shuō)話的神態(tài)、臉上各種各樣的細(xì)紋。不管是毛孔、細(xì)紋等皮膚質(zhì)感,還是神態(tài)上的表情,都很像真人。

▲Siren在說(shuō)話時(shí)嘴唇動(dòng)作自然,效果真實(shí)。之所以有的數(shù)字人看起來(lái)不自然,很大一部分原因是因?yàn)閿?shù)字人面部表情不生動(dòng),特別是在說(shuō)話時(shí)嘴唇和臉部、牙齒甚至舌頭的聯(lián)動(dòng),很容易出現(xiàn)動(dòng)作不聯(lián)動(dòng)、不真實(shí)的情況。

5. 真人形象類型

新華社AI合成主播-新小浩

“新小浩”是無(wú)論外在形象、面部表情、服裝搭配、說(shuō)話聲音,還是肢體動(dòng)作上,都是完全基于真實(shí)主持人生成。

通過(guò)語(yǔ)音合成、唇形合成、表情合成以及深度學(xué)習(xí)等技術(shù),克隆出具備和真人主播一樣播報(bào)能力的“AI 合成主播”。

▲我們每天都會(huì)遇見各種各樣的人,即使臉上最細(xì)微的表情,我們都可以感知到,用計(jì)算機(jī)打造出來(lái)的表情,往往缺乏靈氣。

真人形象的虛擬主播的優(yōu)勢(shì)在于,他的特征都是來(lái)源于真人,呈現(xiàn)的面貌和狀態(tài)更容易被用戶了解。如果不仔細(xì)看,可能分辨不出是不是真人。

四、數(shù)字人的應(yīng)用場(chǎng)景

目前國(guó)內(nèi)市場(chǎng)上已經(jīng)出現(xiàn)了非常多的虛擬數(shù)字人,在各行各業(yè)中有著廣泛的應(yīng)用。

虛擬數(shù)字人技術(shù)結(jié)合實(shí)際應(yīng)用場(chǎng)景領(lǐng)域,切入各類,形成行業(yè)應(yīng)用解決方案,賦能影視、傳媒、游戲、金融、文旅等領(lǐng)域,根據(jù)需求為用戶提供定制化服務(wù)。

按照應(yīng)用場(chǎng)景或行業(yè)的不同,已經(jīng)出現(xiàn)了娛樂型數(shù)字人,如虛擬偶像、歌手、網(wǎng)紅、虛擬代言人等;

助手型數(shù)字人,如虛擬客服、虛擬導(dǎo)游、智能助手。

主播型數(shù)字人,如虛擬主播、虛擬支持人等。

這里搜集的案例只是虛擬數(shù)字人的應(yīng)用的一小部分,還有很多優(yōu)秀的應(yīng)用案例等待著大家去一起發(fā)現(xiàn)。

五、代表性的研發(fā)平臺(tái)

國(guó)內(nèi)有很多互聯(lián)網(wǎng)平臺(tái)在研發(fā)虛擬數(shù)字人,我也從中收獲了大量的信息和資料,這次把這些平臺(tái)分享給大家:

  • 搜狗AI開放平臺(tái)
  • 網(wǎng)易伏羲、網(wǎng)易易現(xiàn)
  • 百度AI開放平臺(tái)
  • 騰訊云、騰訊NEXTStudios
  • 訊飛開放平臺(tái)

如果大家想了解更多關(guān)于AI人工智能、數(shù)字人和最新科技的發(fā)展,可以去這些平臺(tái)學(xué)習(xí)~

慢慢來(lái)比較快,希望對(duì)你有所幫助!

#專欄作家#

作者:Clippp,微信公眾號(hào):Clip設(shè)計(jì)夾。每周精選設(shè)計(jì)文章,專注分享關(guān)于產(chǎn)品、交互、UI視覺上的設(shè)計(jì)思考。

本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)作者許可,禁止轉(zhuǎn)載。

題圖來(lái)自Unsplash,基于CC0協(xié)議。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 你好像什么都說(shuō)了,又好像什么都沒說(shuō)

    來(lái)自湖北 回復(fù)