除了制造“逼真假臉”,GANs還在看不見(jiàn)的角落里悄悄搞事情

0 評(píng)論 1688 瀏覽 4 收藏 14 分鐘

GANs(Generative Adversarial Nets,生成對(duì)抗網(wǎng)絡(luò))是非監(jiān)督式學(xué)習(xí)的一種方法,通過(guò)讓兩個(gè)神經(jīng)網(wǎng)絡(luò)相互博弈的方式進(jìn)行學(xué)習(xí),常用于生成以假亂真的圖片視頻、三維物體模型等。

自2014年誕生之日起,GANs(Generative Adversarial Nets,生成對(duì)抗網(wǎng)絡(luò))就一直是機(jī)器學(xué)習(xí)領(lǐng)域的“流量擔(dān)當(dāng)”,過(guò)去的兩年間更是迎來(lái)了成果井噴。

有人還專門為它建立了一個(gè)GAN Zoo,用來(lái)收集所有已被命名的GAN,目前已經(jīng)有500多個(gè)了。欣賞一下這令人咋舌的增長(zhǎng)曲線:

除了制造“逼真假臉”,GANs還在看不見(jiàn)的角落里悄悄搞事情

盡管GANs的進(jìn)步是日新月異,但仔細(xì)觀察一下就會(huì)發(fā)現(xiàn),最廣為人知的吸睛案例,大都集中在娛樂(lè)領(lǐng)域,而且不乏吐槽之聲。

比如從去年年底英偉達(dá)推出的GAN,合成的人臉幾乎能夠以假亂真,一眾媒體直呼“可怕”。前不久它終于有了自己的名字“StyleGAN”,源代碼也免費(fèi)公布,立馬又被愛(ài)搞事情的網(wǎng)友送到了風(fēng)口浪尖上。

來(lái)自Uber的軟件工程師Philip Wang利用styleGAN做了一個(gè)網(wǎng)站,每次刷新都會(huì)生成一個(gè)“現(xiàn)實(shí)中不存在”的人臉,逼真得令人毛骨悚然。

很快就有網(wǎng)友表示,看到了一張跟自己一樣的臉,然后她就真的不存在了……這個(gè)賽博朋克式的神展開(kāi),立馬讓大家?guī)肓吮弧凹倌槨敝涞目謶帧?/p>

當(dāng)然,除了探討照片是否可信、帶來(lái)識(shí)別安全問(wèn)題怎么辦這些問(wèn)題之外,或許我們也應(yīng)該關(guān)注一下,為什么GANs一路進(jìn)化,大多數(shù)研究卻總是聚焦在換臉技術(shù)上呢?

這場(chǎng)熱鬧非凡的換臉游戲背后,恐怕隱藏著一個(gè)GANs從算法走向產(chǎn)業(yè)道路上最難突破的瓶頸。

GANs新成員:換臉技術(shù)哪家強(qiáng)?

GANs從出道那天開(kāi)始,“圖像生成”就是最能打的一塊招牌。而在各種各樣GANs中,“新晉網(wǎng)紅”styleGAN,絕對(duì)是面部生成的技術(shù)擔(dān)當(dāng)。

關(guān)于英偉達(dá)這個(gè)新模型,我們?nèi)ツ昃偷谝粫r(shí)間解讀過(guò),在此不再贅述。簡(jiǎn)單來(lái)說(shuō),就是讓生成器模仿風(fēng)格遷移算法的方法,學(xué)會(huì)識(shí)別出更高級(jí)、也更有意義的特征變化(比如年齡、臉部細(xì)節(jié)等等),從而讓圖像生成效果更加逼真。

除了制造“逼真假臉”,GANs還在看不見(jiàn)的角落里悄悄搞事情

同時(shí),styleGAN的識(shí)別效率也大幅度提升,能夠自動(dòng)分離圖像中的變化,開(kāi)發(fā)者能夠以直觀的方式控制合成結(jié)果。加上前不久英偉達(dá)開(kāi)放了圖像數(shù)據(jù)集和styleGAN的源代碼,自然吸引了不少技術(shù)大佬們躍躍欲試。

有用它“造老婆”的,一位名叫roadrunner01的程序猿,用大量二次元少女的圖片訓(xùn)練StyleGAN,各種風(fēng)格的紙片人妹子任由選擇。

除了制造“逼真假臉”,GANs還在看不見(jiàn)的角落里悄悄搞事情

當(dāng)然還有失敗的。由于準(zhǔn)備不充分,靠StyleGAN生成假臉的網(wǎng)站“thispersondoesnotexist”就被群嘲了,因?yàn)榫W(wǎng)友在上面找到了幾乎和自己一樣的臉,就此掀起了一陣“刷新一次消失一個(gè)人類”的都市靈異文學(xué)創(chuàng)作熱情。

真的是,沒(méi)有全球70億人的人臉數(shù)據(jù)集,就不要攬瓷器活兒啊。不僅圖像能造假,視頻也沒(méi)逃過(guò)此劫。

去年年初,基于GAN的視頻換臉術(shù)Deepfakes,就被用來(lái)制造了一大堆足以亂真的假視頻,斯嘉麗·約翰遜、神奇女俠蓋爾加朵、楊冪、劉亦菲等中外名人紛紛成了假視頻的主角。

盡管GANs的進(jìn)展很令人欣喜,但一個(gè)尷尬而無(wú)奈的現(xiàn)實(shí)也就此清晰地呈現(xiàn)在了它的進(jìn)化之路上——絕大多數(shù)成果都聚焦在圖像生成上,并且常常以?shī)蕵?lè)、夸張的形式出現(xiàn),“逆天”“以假亂真”“被色情”等新聞不絕于耳。

人臉生成的效果太好、門檻太低,正在挑戰(zhàn)著公眾的辨別能力,讓大眾對(duì)網(wǎng)絡(luò)內(nèi)容和圖像證據(jù)的信任進(jìn)一步坍塌,而那些大眾期待的、GANs真正改變產(chǎn)業(yè)和生活的效用,卻仿佛集體失聲了。怎么回事?

除了“逼真假臉”,GANs還有哪些打開(kāi)方式?

首先要替GANs澄清一下,作為一個(gè)能自我判別和推倒出新樣本的生成算法,它能應(yīng)用的訓(xùn)練場(chǎng)景和商業(yè)前景是非常大的。而且,正在勤勤懇懇地“為人民服務(wù)”,為不少產(chǎn)業(yè)的進(jìn)化添磚加瓦。比如:

1. 影視創(chuàng)作

創(chuàng)作是最考驗(yàn)想象力和藝術(shù)張力的地方,也是越來(lái)越勞動(dòng)密集型的產(chǎn)業(yè)之一。

在工業(yè)制作體系成熟的好萊塢,一部電影從編劇到營(yíng)銷團(tuán)隊(duì)往往多大數(shù)千人。而GAN恰恰可以改變這樣昂貴而高風(fēng)險(xiǎn)的生產(chǎn)過(guò)程。

項(xiàng)目前期,GAN可以利用文字描述生成相匹配的逼真圖像,快速打破次元壁,高效而還原地生成電影腳本,避免因?yàn)楫?huà)風(fēng)跑偏而收獲原著粉贈(zèng)送的“人參萬(wàn)兩”;

除了制造“逼真假臉”,GANs還在看不見(jiàn)的角落里悄悄搞事情

在后期剪輯上,IBM正在利用以GAN為基礎(chǔ)的AI算法,去識(shí)別視頻中的臺(tái)詞和場(chǎng)景的意義,根據(jù)角色的心情、劇情的復(fù)雜程度以及前后片段的關(guān)聯(lián)程度,快速生成電影宣傳片,大幅壓縮了制作成本和時(shí)間周期。

2. 圖像修復(fù)

現(xiàn)實(shí)中,我們常常會(huì)面對(duì)一些歷史原因而辨識(shí)體驗(yàn)較差的圖像,比如被損毀的文物殘片、消失了一半的古建筑、上個(gè)世紀(jì)創(chuàng)作的游戲或電影,對(duì)它們進(jìn)行修復(fù)或復(fù)刻,往往只能依靠某些專精技術(shù)人員日以繼夜的努力。

現(xiàn)在在GAN的幫助下,可以更高效地還原和處理這些瑕疵部分。

比如在英偉達(dá)的一篇論文中,就闡述了它是如何用GAN訓(xùn)練出的“圖像翻譯網(wǎng)絡(luò)”(Partial Convolutions)為圖像上的建筑和場(chǎng)景補(bǔ)上缺失部分的。

除了制造“逼真假臉”,GANs還在看不見(jiàn)的角落里悄悄搞事情

一些超經(jīng)典的游戲,比如《重返德軍總部》、《上古卷軸III》、《馬克思·佩恩》等,都陸續(xù)被 ESRGAN(增強(qiáng)型超分辨率生成對(duì)抗網(wǎng)絡(luò))進(jìn)行了重置。畫(huà)面變得更加精美的同時(shí),還忠實(shí)地保留了原來(lái)的藝術(shù)風(fēng)格,以后玩家和劇迷們?cè)僖膊挥脫?dān)心心愛(ài)的作品被人工改得面目全非了。

除了制造“逼真假臉”,GANs還在看不見(jiàn)的角落里悄悄搞事情

《馬克思·佩恩》原版截圖VSESRGAN重制后的截圖

3. 個(gè)性時(shí)尚導(dǎo)師

除了還原,GANs還具備超強(qiáng)的想象力,可以通過(guò)多元樣本進(jìn)行判斷與生成,從而輸出個(gè)性化又風(fēng)格統(tǒng)一的方案。比如亞馬遜和阿里巴巴都在打造的“時(shí)尚人工智能”(FashionAI),就是利用GANs實(shí)現(xiàn)的。

加載了GANs的電商推薦系統(tǒng)不僅能夠向用戶提供個(gè)性化的時(shí)尚搭配建議,而且還能夠?qū)⒍S商品圖轉(zhuǎn)化成3D試穿效果圖,從而幫助商家進(jìn)行服裝銷售。

研究人員利用亞馬遜商城用戶在六種商品(男女款式的鞋類,上裝,下裝)的購(gòu)買數(shù)據(jù)來(lái)分析其商品偏好,然后訓(xùn)練出相應(yīng)的GAN模型。阿里巴巴的新零售線下店,也是采用了該技術(shù)來(lái)向店內(nèi)顧客展示和推薦商品。

除了制造“逼真假臉”,GANs還在看不見(jiàn)的角落里悄悄搞事情

4. 新成分預(yù)測(cè)

除了這些觸手可及的現(xiàn)實(shí)應(yīng)用,GANs在產(chǎn)業(yè)端更值得期待的價(jià)值,還體現(xiàn)在新藥研發(fā)和材料學(xué)領(lǐng)域,比如用來(lái)生成新的藥學(xué)分子結(jié)構(gòu)和合成新材料等等。

有數(shù)據(jù)統(tǒng)計(jì),每種新藥研發(fā)大約需要10年時(shí)間。期間,制藥公司需要設(shè)計(jì)合成成千上萬(wàn)的分子,然后一一進(jìn)行生物學(xué)測(cè)試,成功率往往卻只有2萬(wàn)至3萬(wàn)分之一。

有了GANs,就能相關(guān)信息對(duì)分子結(jié)構(gòu)進(jìn)行高精度的樣本預(yù)測(cè),加快實(shí)驗(yàn)進(jìn)度的同時(shí),全新的未知成分顯然更有可能幫助人類攻克懸而未決的醫(yī)學(xué)難題。

因此,盡管這一應(yīng)用目前還停留在創(chuàng)意階段,但其背后的商業(yè)想象空間卻格外巨大。

除了制造“逼真假臉”,GANs還在看不見(jiàn)的角落里悄悄搞事情

目前來(lái)看,GANs正在一群產(chǎn)業(yè)巨頭們的支持下,開(kāi)啟了更廣闊的應(yīng)用場(chǎng)景探索之路。這場(chǎng)技術(shù)拉力賽,并不只有奇聞異事,而是在真槍實(shí)戰(zhàn)中打磨出了金子般的光芒。

為什么出風(fēng)頭的總是“變臉”?

既然GANs已經(jīng)斬獲了這么多成績(jī),為什么一提起來(lái),大家想到的總是“照騙”“視騙”這些販賣焦慮的新聞呢?那些干實(shí)事的模型不配有姓名嗎?

客觀來(lái)說(shuō),一項(xiàng)新技術(shù)要證明自己的強(qiáng)大之處,用一些“逆天”“超越人類想象”之類夸張的效果來(lái)迅速被大眾所認(rèn)知,這不難理解。

但GANs之所以被這些“造假”新聞淹沒(méi),還要感謝將股價(jià)押注在AI身上的英偉達(dá)不斷造勢(shì),而“以假亂真”“令人害怕”的新聞背后,更關(guān)系著媒體們無(wú)數(shù)爆款文的績(jī)效,在這樣的雙重推動(dòng)下,“只知換臉,無(wú)論其他”的GANs自然愈發(fā)深入人心了。

除了制造“逼真假臉”,GANs還在看不見(jiàn)的角落里悄悄搞事情

而那些下沉在產(chǎn)業(yè)端的GANs應(yīng)用,又為何都如此“謹(jǐn)小慎微”、罕見(jiàn)發(fā)聲呢?一方面GANs自身還有一些缺陷尚待解決,導(dǎo)致其成果并不穩(wěn)定。

比如模式坍塌(Mode collapse)問(wèn)題,在復(fù)雜且多模態(tài)的自然數(shù)據(jù)集中,生成器只能從相似樣本的模式集中生成樣本,這將直接限制結(jié)果的多樣性,從而影響使用。

另外,在GANs相關(guān)訓(xùn)練中,很難精準(zhǔn)地判斷合適能生成高質(zhì)量的作品,現(xiàn)實(shí)中顯然不可能投入無(wú)限多的時(shí)間和資源去等待一個(gè)未知的訓(xùn)練結(jié)果。

因此,今天說(shuō)到的應(yīng)用案例,都更具示范價(jià)值和探索意義,距離大規(guī)模應(yīng)用還有一段路要走。對(duì)于企業(yè)來(lái)說(shuō),貿(mào)然推出不成熟的產(chǎn)品反而會(huì)引發(fā)群嘲,自然更愿意低調(diào)行事、關(guān)門打磨產(chǎn)品了。

更重要的是,GANs需要大量商業(yè)數(shù)據(jù)的投喂,才能發(fā)揮出實(shí)驗(yàn)室類似的效果。而無(wú)論是數(shù)據(jù)成本還是算力成本,都決定了GANs所代表的便利和可能性,目前只對(duì)一些產(chǎn)業(yè)巨頭有用。

這也是為什么,除了學(xué)界和個(gè)人開(kāi)發(fā)者偶爾搞點(diǎn)“聳人聽(tīng)聞”的大新聞,GANs至今還沒(méi)能在現(xiàn)實(shí)領(lǐng)域中遍地開(kāi)花。

不過(guò),娛樂(lè)往往是速朽的,“造假”恐怖事件玩得多了,大眾也會(huì)產(chǎn)生審美疲勞,最終很可能將一個(gè)特殊領(lǐng)域的潛在危險(xiǎn),變成對(duì)整個(gè)技術(shù)的泛在質(zhì)疑。不要讓一切值得思考的,都成為娛樂(lè)的附庸。

 

作者:腦極體,微信公眾號(hào):腦極體

本文由 @腦極體 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來(lái)源于 Unsplash,基于CC0協(xié)議

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒(méi)評(píng)論,等你發(fā)揮!