別鬧了,AIGC殺不“死”藝術(shù)家
AICG 爆紅之后,不少人都發(fā)出了疑惑,比如 AICG 生成內(nèi)容未來是否會(huì)替代真人創(chuàng)作,又是否會(huì)顛覆藝術(shù)繪畫領(lǐng)域。而關(guān)于這類問題的解答,也許我們需要從 AICG 這項(xiàng)技術(shù)本身與實(shí)際應(yīng)用等方面進(jìn)行解讀。本篇文章里,作者便結(jié)合從業(yè)者們的視角,發(fā)表了一定看法。
AIGC生成內(nèi)容能取代插畫師、設(shè)計(jì)師的工作嗎?或者更瘋狂一點(diǎn),AI 能批量生產(chǎn)藝術(shù)作品,乃至從根本上顛覆藝術(shù)市場嗎?
關(guān)于AIGC的爆紅我們已經(jīng)和科技界探討的足夠多,今天我們把目光轉(zhuǎn)向從業(yè)者——AI能否取代他們的工作?
下面是他們的回答。
一、畫家自己下筆之前都不知道會(huì)發(fā)生什么,AI如何能知道?又如何計(jì)算出來?
AI不能繪制的東西
當(dāng)我詢問能否清楚地辨認(rèn)AI和人類繪畫作品的時(shí)候,建筑系大四的吳佳佑給出了非常明快的肯定答案。
吳佳佑正在申請英國倫敦皇家藝術(shù)學(xué)院的研究生,而他提交的申請作品之一即是一個(gè)由AI輔助創(chuàng)作的交互式網(wǎng)站,訪問的人可以在圖像搭建而成的互動(dòng)頁面中探索由他設(shè)計(jì)的故事,而組成網(wǎng)站的所有圖像都由 Disco diffusion 和 MidJourney 這兩個(gè)2022年大火的AIGC人工智能生成工具制作。
圖源:吳佳佑提供,基于AIGC模型生成后微調(diào)
“AI生成圖像在整體光影、結(jié)構(gòu)以及色彩上的表現(xiàn)在我看來無可挑剔,但很多細(xì)節(jié)經(jīng)不起推敲?!睂碛欣L畫功底,又經(jīng)常使用AI工具的吳佳佑來說(他的交互式網(wǎng)站制作花費(fèi)了四個(gè)月的時(shí)間,期間用AI生成了數(shù)千張圖),目前AI生成圖片迥異于人類的風(fēng)格是顯而易見的。
“細(xì)節(jié)上經(jīng)常出現(xiàn)色塊堆積,過度不自然和線條粗細(xì)變化不均勻這樣的問題。”吳佳佑拿著我給的幾張?jiān)谕铺厣项H受好評的AI生成圖像逐字句的點(diǎn)評起來,雖然只有大四,但他的口吻很自信。
圖源:吳佳佑提供,基于AIGC模型生成后微調(diào)
對一個(gè)美術(shù)門外漢來說,這樣的細(xì)節(jié)(尤其你很多時(shí)候需要放大作品觀察)可能并不重要,但對專業(yè)人士來說,差別是顯著的?!拔医o同學(xué)說了竅門后,大家不管有沒有美術(shù)功底,基本上都能看出來。AI生成的圖像看不出繪制的前后順序,因?yàn)樗澈鬀]有人類繪畫的基本邏輯支撐?!眳羌延诱f。
問題的根源可能來自算法本身。目前的主流AIGC工具都采用了diffusion model 擴(kuò)散模型,它的訓(xùn)練基于有文字描述的圖片數(shù)據(jù),通過對圖片反復(fù)降噪,AI學(xué)習(xí)如何生成符合文字描述的圖片。由于文字描述往往是整個(gè)圖片的內(nèi)容,因此AI深度學(xué)習(xí)的結(jié)果會(huì)對整體圖片結(jié)構(gòu)和光影的把握比較良好,而相對的在細(xì)節(jié)上就會(huì)失準(zhǔn),因?yàn)檫@些細(xì)節(jié)往往缺乏文字描述,又相當(dāng)復(fù)雜多變。
這可能是在日漫界最近熱炒的AI三大畫圖難題的來歷。所謂三大難題,指的是目前的AI模型不能完成的三種主題創(chuàng)作:薩菲羅斯游泳、樋口円香吃拉面和哭泣的美少女吃蛋糕。AI模型在輸入相關(guān)指令后往往會(huì)生成讓人啼笑皆非的圖片。
圖源:Neil Shen 使用 MidJourney 生成
其實(shí)AI 不能完成的創(chuàng)作遠(yuǎn)不止這三種,比如如果你讓AI生成游泳的三文魚,那它大概率給你的圖片將會(huì)是三文魚片而不是活蹦亂跳的魚。
圖源:Neil Shen 使用 MidJourney 生成
AIGC這些人類看來非常匪夷所思的錯(cuò)誤同樣要?dú)w因于算法,一旦給出的指令過于偏狹,比如日漫中較少表現(xiàn)的水中游泳動(dòng)作,或者其畫面內(nèi)容存在較為復(fù)雜多變的物理交互邏輯,比如“吃拉面”圖像意味著同時(shí)處理人物、手指、面條和筷子這幾個(gè)在AI看來都屬于線條的內(nèi)容時(shí),AI大概率會(huì)存在翻車的現(xiàn)象,因?yàn)橛?xùn)練算法所用的樣本集可能較少涵蓋相關(guān)內(nèi)容,而擴(kuò)散模型對復(fù)雜細(xì)節(jié)線條交互變化的理解還相當(dāng)初級(jí)。
但細(xì)節(jié)往往是決定畫家藝術(shù)風(fēng)格和水平的決定性因素之一。插畫師元元是少見的迄今仍然堅(jiān)持純手繪作圖的職業(yè)畫師,研究生畢業(yè)于清華美院的元元講述了科班美術(shù)生的結(jié)構(gòu)、線條色彩和細(xì)節(jié)是如何被訓(xùn)練的——因循著與AI生成完全不同的邏輯。
圖源:百科 《萬壑松風(fēng)圖》 宋朝 李唐繪
“老師會(huì)讓你以操場為主題畫十幅同樣的畫,一開始你會(huì)想要把每一條跑道線,按照透視、光影結(jié)構(gòu)完整的畫出來,但到某一個(gè)時(shí)刻,你會(huì)想要去若隱若現(xiàn)地處理某些跑道線,有些留白,有些加重,有些干脆去掉?!痹f,“很多時(shí)候畫家追尋的是這種主觀感受,作品生動(dòng)不是說要畫的和真實(shí)世界一模一樣?!?/p>
繪畫的過程不僅考驗(yàn)畫家個(gè)人的技巧(這部分AI很好達(dá)到),畫家作為個(gè)人,他的感受,心境乃至成長歷程、教育背景等都發(fā)揮了影響,這些數(shù)據(jù)量之龐大都是AI所無法計(jì)算的。更何況,對元元來說,真正的創(chuàng)作過程在于打破某些規(guī)則和邏輯,“國畫中很多時(shí)候松弛的閑閑一筆就是遠(yuǎn)山,層云。此處留白,彼處著墨,很多時(shí)候畫家自己下筆之前都不知道會(huì)發(fā)生什么,AI如何能知道?又如何計(jì)算出來?”
二、剝離所謂“低效率工作”意味著什么?
AI可以模仿的東西
就像對人工智能倫理的討論一樣,科技界對AIGC內(nèi)容對藝術(shù)性的沖擊的討論也經(jīng)常是模棱兩可的。技術(shù)至上主義者(硅谷的一大部分人)幾乎回避了有關(guān)藝術(shù)性的討論,對他們來說不斷而持續(xù)的精進(jìn)深度學(xué)習(xí)算法才是重要的事情。隨著數(shù)據(jù)集和算法的優(yōu)化,藝術(shù)性似乎同樣能被01的字符所表達(dá)。
圖源:Google Imagen video 論文 顯示AIGC已經(jīng)能夠制作梵高風(fēng)格的圖像
https://imagen.research.Google/video/paper.pdf
某種意義上他們成功了,甚至連谷歌最新推出的基于擴(kuò)散算法的 imagen video 模型在生成視頻方面都能夠模仿藝術(shù)家風(fēng)格(比如一只以梵高風(fēng)格繪就的貓咪在吃東西),而使用AI 輔助創(chuàng)作在許多游戲美術(shù)師的工作中已經(jīng)是通行慣例。
在多家大廠有過游戲制作經(jīng)驗(yàn)的阿丁在談到AIGC時(shí)頻繁提到一個(gè)詞——“喂圖”,意思是在游戲人物形象設(shè)計(jì)的最初——尤其針對一閃而過的NPC人物,美術(shù)設(shè)計(jì)會(huì)給AIGC工具輸入很多參考圖學(xué)習(xí),進(jìn)而快速生成符合游戲要求的結(jié)果。
“雖然還要經(jīng)過后期的調(diào)整,但AI現(xiàn)在確實(shí)已經(jīng)取代人力開始承擔(dān)這部分的工作量了?!卑⒍≌f,他們目前使用較多的工具是較為側(cè)重二次元風(fēng)格訓(xùn)練的novel AI ,它基于目前最火的 stable diffusion 模型,數(shù)據(jù)集由500多萬張帶有文本標(biāo)記的圖片組成。
然而通過“喂圖”訓(xùn)練的AIGC模型充滿了爭議。10月7日,推特用戶@BG_5you 基于剛過世的韓國著名漫畫家金政基作品使用 Stable Diffusion訓(xùn)練出了金政基風(fēng)格的繪畫模型,此舉引來的網(wǎng)友的如潮惡評,而緊接著10月底,工程師Ogbogu Kalu 因?yàn)榘训鲜磕岷灱s畫師Hollie Mengert的作品未經(jīng)同意后抓取訓(xùn)練出可以批量生成 Mengert畫風(fēng)的模型再度沖上熱搜。
圖源:@BG_5you 使用模型生成的“金政基”風(fēng)格作品
如果說前者網(wǎng)友一邊倒的批評尚主要基于對死者的尊重,后者則將AIGC快速發(fā)展對現(xiàn)行插畫市場的沖擊鮮明地點(diǎn)了出來。要知道由于 Hollie Mengert簽約了迪士尼,甚至她本人都不能隨意發(fā)布自己的作品,而從畢業(yè)開始算起,她的畫風(fēng)形成至少花費(fèi)了十多年的時(shí)間,相比之下Ogbogu Kalu訓(xùn)練新模型的時(shí)間只有幾個(gè)小時(shí),且成本幾乎為零。
圖源:左圖為Hollie Mengert 原創(chuàng),右圖為Ogbogu Kalu訓(xùn)練的模型生成
https://waxy.org/2022/11/invasive-diffusion-how-one-unwilling-illustrator-found-herself-turned-into-an-AI-model/
如果風(fēng)格模仿是如此的輕而易舉,那么畫家十?dāng)?shù)年的繪畫訓(xùn)練有什么意義?他們的商業(yè)價(jià)值又該被如何衡量?這樣的叩問出現(xiàn)在許多插畫師的心中。
坦率地說,機(jī)器學(xué)習(xí)并不能準(zhǔn)確模仿所有風(fēng)格,但AIGC目前的進(jìn)化程度已經(jīng)強(qiáng)到開始對許多領(lǐng)域產(chǎn)生沖擊。阿丁就直言,既然AIGC已經(jīng)能夠介入游戲原畫和人物設(shè)計(jì)(“很多效果圖生成的精度比一般畫師高多了?!卑⒍⊙a(bǔ)充說),現(xiàn)在網(wǎng)上流行的美術(shù)外包中很多基礎(chǔ)工作很快就將被AI替代。
畫師們對此不是沒有警惕,許多人在給自己作品標(biāo)注“未經(jīng)許可不得使用”的版權(quán)聲明之外,還會(huì)加上“禁止AI學(xué)習(xí)”聲明,有些人則干脆從公開平臺(tái)撤掉自己的作品以防被抓取成為AI學(xué)習(xí)的數(shù)據(jù)。在二次元繪畫發(fā)育最成熟的日本,“AI 學(xué)習(xí)禁止”已經(jīng)成為了一個(gè)流行詞。
然而,對硅谷來說AI風(fēng)格遷移造成的爭議并不是他們考慮的首要問題,技術(shù)中立,更時(shí)髦的詞叫做 AI 的民主化 democratization of AI是他們的信仰,AIGC技術(shù)潛在的巨大商業(yè)前景才是真正重要的。根據(jù)彭博社的報(bào)道,投資了 stability AI 的 Lightspeed 合伙人Gaurav Gupta 直言不諱地表示,AIGC技術(shù)根本性地賦予了人們更多的權(quán)力,同時(shí)讓“低效率 inefficiency”工作從內(nèi)容創(chuàng)作中剝離。
三、“只要 AIGC生成內(nèi)容滿足質(zhì)量要求,我不介意全面使用它?!?/h2>
AI將替代誰?
AI將替代誰?
Gaurav Gupta的表態(tài)幾乎是在明示AIGC生成技術(shù)對現(xiàn)有繪畫市場的顛覆性沖擊。如果我們把繪畫市場簡單分為商業(yè)繪畫和藝術(shù)繪畫兩部分的話,前者顯然會(huì)更直接受到影響。
對于這個(gè)問題,在某游戲工作室擔(dān)任原畫師的劉紀(jì)揚(yáng)表現(xiàn)的很輕松,“許多人說它做出來的東西冰冷,我沒那么矯情,我就覺得它弄得挺好的,構(gòu)圖顏色都好。更深的內(nèi)容AI目前還做不了,但我覺得它給我們設(shè)計(jì)師和美術(shù)師的前期工作提供了許多思路參考?!眲⒓o(jì)揚(yáng)說到。
圖源:受訪者劉紀(jì)揚(yáng)提供
在劉紀(jì)揚(yáng)看來,盡管AIGC內(nèi)容在游戲策劃的最初階段能夠輔佐策劃更好的表達(dá)想要的游戲效果,但它尚不能介入游戲原畫師更高階和精確的工作。“我們的設(shè)計(jì),越到后期要求越精確、細(xì)致,AI 只能粗疏的在需求非常模糊的時(shí)候一次性生成許多選擇,但當(dāng)方向明確的時(shí)候,AI還無法勝任規(guī)模化的游戲設(shè)計(jì)場景。”
圖源:受訪者劉紀(jì)揚(yáng)提供
相比之下阿丁的看法有所不同:“AIGC生成的高精度的圖片不僅可以應(yīng)用于前期策劃,在游戲的人物設(shè)計(jì)和場景設(shè)計(jì)中都將擁有廣泛的前景,與之相伴的就是大量腰部以下插畫師會(huì)失去工作,目前阻擋大規(guī)模使用的其實(shí)是潛在的法律風(fēng)險(xiǎn),而不是生成內(nèi)容的質(zhì)量本身。”
不只是游戲的前期策劃,泛化的商業(yè)繪畫領(lǐng)域,從影視美術(shù)、網(wǎng)站設(shè)計(jì)乃至圖書制作,現(xiàn)有的AIGC技術(shù)在描繪大場景、特定繪畫風(fēng)格和精細(xì)度效果上均有優(yōu)勢,更不必說其成本低、速度快,且不會(huì)被題材、風(fēng)格乃至數(shù)量局限的特點(diǎn)。盡管存在類似“游泳三文魚”這樣的問題,但毋庸諱言商業(yè)繪畫這個(gè)過去只能依靠人力的創(chuàng)意市場迎來了最強(qiáng)勁競爭者,首當(dāng)其沖受沖擊的將是對精度和創(chuàng)意要求不那么高的細(xì)分領(lǐng)域。
“說實(shí)話,只要 AIGC生成內(nèi)容滿足質(zhì)量要求,我是不介意全面使用它,因?yàn)檎娴臅?huì)節(jié)省許多成本?!蹦骋痪€時(shí)尚雜志的執(zhí)行主編在被問及對AIGC內(nèi)容看法時(shí)說到。
對時(shí)尚雜志來說,拍攝大片時(shí)產(chǎn)生的置景、燈光、場地成本是一筆不菲的開支,而大片的制作過程往往還受到時(shí)間、空間以及人員因素的限制。AIGC生成技術(shù)從根本上解決這些困難,同時(shí)還能極大拓展視覺語言的豐富程度——“要是AI足夠強(qiáng)大,我一個(gè)人就能制作一本雜志了不是嗎?”實(shí)際上,今年美國版《Cosmopolitan》已經(jīng)使用 MidJourney制作了一期封面。
圖源:Cosmopolitan
官方網(wǎng)站 https://www.cosmopolitan.com/lifestyle/a40314356/dall-e-2-artificial-intelligence-cover/
四、中國人說“興之所至”,可AI根本無法“起興”,又能“至”去何處?
AI有創(chuàng)造性嗎?
如果說對商業(yè)繪畫領(lǐng)域AIGC的潛在顛覆性毋庸置疑,那么在藝術(shù)繪畫領(lǐng)域這個(gè)問題就充滿了爭議。
“如果你水平好的話是永遠(yuǎn)不可能被替代的?!边@是許多人強(qiáng)調(diào)的論點(diǎn)。盡管AI可以惟妙惟肖的模仿風(fēng)格,但它不理解圖像背后所代表的含義,換言之,AI不具備真正的創(chuàng)造力。
這不是說AIGC完全沒有任何創(chuàng)造力,Deepmind的創(chuàng)始人,當(dāng)代人工智能領(lǐng)軍人物Demis Hassabis 曾在Lex Fridman 的訪談中表示,AI的創(chuàng)造力可以讓它通過看數(shù)百萬張貓的照片來“創(chuàng)造”一只普通的貓,但人類目前還不能把高層次的抽象概念(比如發(fā)明象棋規(guī)則,而不是教AI學(xué)會(huì)下象棋)用算法準(zhǔn)確地表示。
從這個(gè)意義上說,探討 AIGC 的藝術(shù)性甚至顯得有些滑稽。被問及AI的藝術(shù)性時(shí),藝術(shù)留學(xué)機(jī)構(gòu)創(chuàng)始人Evan 迅速就給出否定回答,他所在的藝術(shù)留學(xué)機(jī)構(gòu)每年向全世界頂尖藝術(shù)學(xué)府輸送大批學(xué)生,AIGC領(lǐng)域是他們關(guān)注的重點(diǎn)之一。
“我們學(xué)生提交的申請作品主體是不建議過度使用有AIGC創(chuàng)作內(nèi)容的?!盓van說到。在他看來,藝術(shù)品的價(jià)值來自于背后的感染力,這種感染力只能來自人,相比之下,AI 作品太過“冷靜”、“匠氣”。“我可以感受到它每個(gè)部分的精巧,但它的靈魂是不統(tǒng)一的,它不夠動(dòng)人?!?/p>
圖源:百科 蘇軾《寒食帖》被譽(yù)為天下第三行書 無論線條、留白或造型變化均極富風(fēng)格韻味。
藝術(shù)創(chuàng)作的立意和技法都服務(wù)于人本身的思緒脈絡(luò),“只要是稍微成熟點(diǎn)的藝術(shù)家,他的創(chuàng)作都是精準(zhǔn)的?!?對Evan 來說,真正突破和創(chuàng)造性的偉大藝術(shù)作品,永遠(yuǎn)不會(huì)拘泥于既有數(shù)據(jù)的窠臼,沒有人的主觀能動(dòng),AI作品精巧而平庸。
在自己專欄中大量使用生成圖片配圖的自由撰稿人小溫對此有個(gè)精妙比喻:有一類作品創(chuàng)作出來不用寫注釋,因?yàn)樽髌繁旧碜銐蚺?;另一類則必須要寫注釋,否則大家不知道看的是什么;但最糟糕的作品就是有沒有注釋都無所謂,因?yàn)樽髌繁旧聿粔蚝?,而文字注釋也不夠重要。AI生成作品正屬于此類。
“AI依靠算法以結(jié)果生成結(jié)果,但人的創(chuàng)造過程最革命性的東西,嘗試和試錯(cuò),打破規(guī)則和重塑規(guī)則在這個(gè)過程中被根本忽略掉了,中國人說‘興之所至’,可AI根本無法‘起興’,又能‘至’去何處?”小溫補(bǔ)充道。
總的來說,AIGC在藝術(shù)領(lǐng)域的實(shí)踐目前來看更像是一件精準(zhǔn)執(zhí)行的工具,它可以產(chǎn)出精確的結(jié)果,前提是人本身已經(jīng)有了創(chuàng)意的框架。正如文章一開頭提到的吳佳佑,很難想象如果沒有AIGC工具的幫助,他的交互網(wǎng)站所需要的幾千張圖片該如何獲得。而在國外,資深的AI生成愛好者已經(jīng)開始運(yùn)營AI制作電影——除了主創(chuàng)本人的配音,從語言腳本、鏡頭畫面到音效都將運(yùn)用AIGC模型來完成。
圖源:吳佳佑提供,基于AIGC模型生成后微調(diào)
AIGC的確實(shí)極大降低了人們的創(chuàng)作門檻,沒有經(jīng)過技法訓(xùn)練的人現(xiàn)在僅憑自己的想法就能方便創(chuàng)造屬于自己的作品,在未來這將重塑人們認(rèn)知藝術(shù)的維度,它的革命性就好像照相機(jī)之于油畫,在央美藝術(shù)史博士小楊看來,這同樣有一個(gè)漸進(jìn)的過程?!靶鹿ぞ叩某霈F(xiàn)總會(huì)帶來對藝術(shù)本質(zhì)理解的新思考,這在歷史上已經(jīng)發(fā)生了不止一次,相比于藝術(shù)技術(shù)的革新,藝術(shù)理論總是相對滯后的?!?/p>
話雖如此,小楊之前并沒有親自嘗試過AIGC工具,對于網(wǎng)絡(luò)上充斥著的 AIGC生成圖片內(nèi)容,她從專業(yè)角度以“不和諧”三個(gè)字概括。在推薦下小楊第一次使用MidJourney,選擇 Gothic letters (哥特式字母)和她名字拼音的縮寫作為關(guān)鍵詞,由于服務(wù)器不穩(wěn)定,MidJourney一口氣返回了三組共12張圖片,小楊看了之后說,這種水平還不如我從隨便哪個(gè)中世紀(jì)手抄本里剪切來的方便和好看呢。
圖源:MidJourney 生成圖片
這段話仿佛可以當(dāng)做對目前 AIGC與藝術(shù)關(guān)系的注腳。
隨著算法的發(fā)展,AIGC進(jìn)化速度只會(huì)加速而不會(huì)減慢,它不僅將對繪畫相關(guān)領(lǐng)域產(chǎn)生重大影響,在交互設(shè)計(jì)、實(shí)驗(yàn)藝術(shù)乃至未來的元宇宙社交場景中,AIGC可預(yù)見的都將扮演重要角色。
在介紹完自己的交互式網(wǎng)站后吳佳佑告訴我,剛和英國皇家藝術(shù)學(xué)院的老師聊完他的作品,錄取的可能性很大,而他的專業(yè) information experience design 細(xì)分方向之一就叫 moving image design 動(dòng)態(tài)圖像設(shè)計(jì),這聽上去就像是專門為AIGC準(zhǔn)備的一條賽道。
而這究竟是AIGC技術(shù)的勝利,還是人的勝利呢?
作者:Neil Shen
來源公眾號(hào):品玩(ID:pinwancool),有品好玩的科技,一切與你有關(guān)。
本文由人人都是產(chǎn)品經(jīng)理合作媒體 @品玩 授權(quán)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自Unsplash,基于CC0協(xié)議。
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。
MJ目前的能力已經(jīng)脫離了第一點(diǎn)所說的,如果親眼看到過,原本認(rèn)為人類必勝的信心會(huì)產(chǎn)生動(dòng)搖
ai繪畫確實(shí)很火,但是那又怎么樣,人類能完成很多ai做不到的東西,藝術(shù)家更是有著充分的情感
AI繪畫還是有一定的弊端,像人所獨(dú)特?fù)碛械母星槭茿I所不能畫出來的