看完AI畫畫,我的插畫師朋友挺急的

5 評論 8267 瀏覽 46 收藏 19 分鐘

#本文為人人都是產(chǎn)品經(jīng)理《原創(chuàng)激勵計(jì)劃》出品。

前不久,一幅由AI軟件創(chuàng)造出來的畫作《空間歌劇院》在網(wǎng)絡(luò)上引起爭議。網(wǎng)絡(luò)上有兩派聲音,一派認(rèn)為這畫是AI創(chuàng)作的,沒有靈魂,不能和人創(chuàng)作的畫作一起評比;另一派認(rèn)為,這是AI已經(jīng)能創(chuàng)作出符合人類審美的創(chuàng)意作品了,是技術(shù)的一大進(jìn)步。本文作者對此進(jìn)行了分析,與你分享。

一、AI畫畫做得有多好了?

最近一個新聞非常出圈,并且成功登上微博熱搜,一個來自美國的39歲的游戲設(shè)計(jì)師用AI畫畫工具-midjourney創(chuàng)作的一張作品,獲得了科羅拉多州博覽會的藝術(shù)比賽第一名。

作品名稱叫做《空間歌劇院》,作品本身非常漂亮,作為一個藝術(shù)圈外行的我,都覺得這張畫作拋開本身創(chuàng)作來源不講,都是一個配得上大獎的作品。AI至少比我畫的好多了,甚至贏了很多其他參賽的人類藝術(shù)家。

事情一出,評論呈兩極化分布,對于“老藝術(shù)家”派們當(dāng)然對于這件事情十分抵制,認(rèn)為這畫是AI創(chuàng)作的,完全沒有意義,沒有靈魂,作者根本就是褻瀆藝術(shù),他不配做一個畫家。

而另外一派,當(dāng)然是像我一樣的AI從業(yè)者或者是技術(shù)擁躉,我們看到這樣的作品是非常激動的,AI創(chuàng)作得也太美了,驚為天人,前途無量,于是第一時間上網(wǎng)把所有的熱門AI畫畫軟件都試了一遍。

作為吃瓜群眾的你們,怎么看待這張AI創(chuàng)作獲得大獎的事情呢?

無獨(dú)有偶,另一個主打“免費(fèi)開源”AI畫畫的公司stablediffusion,目前已經(jīng)估值超過10億美金,這離他們發(fā)布才過去了1個月,與上文提到的獲獎的midjourney(新注冊免費(fèi)送25次)和Dall.E不同的是,這個工具完全免費(fèi),不限次數(shù)、任何人都可以使用。

而且親測,stablediffusion是幾個AI畫畫工具中交互最為簡單的。比起Google的另一款競品discodiffusion,需要注冊谷歌機(jī)器學(xué)習(xí)平臺,甚至要手動調(diào)整一些參數(shù),對于一些非技術(shù)從業(yè)者要友好多了,基本上就是有手聯(lián)網(wǎng)就可以用。

谷歌的discodiffusion

stability.ai的stablediffusion

除了交互更加友好外,stablediffusion的創(chuàng)作風(fēng)格更加寫實(shí)(更加符合主流大眾審美),比如我在midjourney上創(chuàng)作的作品有點(diǎn)后現(xiàn)代抽象畫的感覺。

文字prompt:一只綠色海豚在紫色海上飛躍遠(yuǎn)方有一艘巨輪(版權(quán)歸大仙河所有)

而OpenAI的DallEmini是“梗圖風(fēng)”,百度的“文心.一格”風(fēng)格偏向于二次元/國畫風(fēng),字節(jié)的tiktokAI偏向油畫風(fēng)。

除了繪畫風(fēng)格外,商業(yè)模式或者是版權(quán)也是stablediffusion為什么僅僅上線一個月就亂拳打死老師傅的另一個原因。

因?yàn)榘鏅?quán)或者是所有權(quán)是決定一個內(nèi)容創(chuàng)作產(chǎn)品的商業(yè)模式的主要因素,比如百度一格的作品所有權(quán)就歸百度所有,你就不太可能拿這個AI平臺創(chuàng)作的作品去進(jìn)行銷售,或者是放在各種商業(yè)宣傳的文案里作為插圖(參考視覺中國的故事)。百度的商業(yè)模式就是賣版權(quán)。

另外的玩法,比如midjourney,類似軟件使用付費(fèi),除了剛開始的一些免費(fèi)試用,后面創(chuàng)作都是要付費(fèi)的。當(dāng)然這產(chǎn)生的作品版權(quán)就是歸用戶所有了。

Stablediffusion很顛覆的地方就在于,版權(quán)歸用戶外,平臺還免費(fèi)不限次數(shù)使用,交互方式還比其他競品更好用,是不是有點(diǎn)像互聯(lián)網(wǎng)剛開始沖入傳統(tǒng)行業(yè)的打法?此外其還在官網(wǎng)上寫著“bythepeople,forthepeople”,意思是民治和民享,是不是有點(diǎn)天下為公的意味。

所以stablediffusion做到了真正的出圈,很多其他行業(yè)的從業(yè)者,比如我們產(chǎn)品經(jīng)理經(jīng)常用來畫原型交互的figma,就準(zhǔn)備引入stablediffusion的創(chuàng)作能力,一句話生成用戶界面元素。

看到這里,我突然明白了為什么看到了ai60“一句話”畫畫的「超能力」后,很多插畫師陷入了深深的焦慮,說實(shí)話,作為產(chǎn)品經(jīng)理的我也很焦慮。

二、AI畫畫是如何做到符合人類的創(chuàng)意和審美的?

焦慮歸焦慮,我們即使要被取代,最好也要明白自己是如何被AI一步步取代的。

網(wǎng)上寫diffusion的文章很多,但是大部分都是講如何使用,或者評論diffusion的作品如何驚為天人。要么就是特別專業(yè)的角度,給大家拆解模型。

作為一個AI產(chǎn)品經(jīng)理,我嘗試用大眾能聽懂的話為大家解釋下AI是如何創(chuàng)作出來如此及美輪美奐的作品的。

首先,大家需要知道一個關(guān)于自然語言大模型的背景知識,如果不知道的可以復(fù)習(xí)我的上一篇文章我和AI聊了一下午被氣哭了,沒看過或者看過忘了的都可以去與預(yù)習(xí)或者復(fù)習(xí)下,加深記憶。

「AI畫畫」原理網(wǎng)絡(luò)架構(gòu)(能力強(qiáng)的讀者嘗試?yán)斫猓饕次淖置枋觯?/p>

我們提到了AI想要理解人,或者能和人們對話,需要上億的參數(shù)、超大模型再加上海量的數(shù)據(jù),才能回答一些人們常規(guī)的問題或者理解人們某些話背后的含義。

自然語言大模型是第一步,相當(dāng)于把人們說的話(文字)轉(zhuǎn)換為機(jī)器能理解的語言或者是參數(shù)(或者是一個公式)。但是這個表示對于人類是完全看不懂的,對于機(jī)器卻包含了非常豐富的信息。

機(jī)器拿著這個表達(dá)+一個混合著隨機(jī)添加的高斯噪聲的圖片(大家理解成電視機(jī)的馬賽克圖片,混沌狀態(tài)),一起送到一個網(wǎng)絡(luò)中訓(xùn)練,這個訓(xùn)練的目標(biāo)就是得到一個交叉熵最小值,相當(dāng)于就是解一個非常復(fù)雜的很多元的函數(shù)(這個過程需要計(jì)算機(jī)不斷地計(jì)算,不斷的迭代)。

求解完函數(shù)后,機(jī)器再把這個函數(shù)的未知數(shù)求得的值送到一個編解碼器中,類似電視臺發(fā)射電視節(jié)目信號進(jìn)行編碼,最終家里電視再接收解碼輸出畫面。你家里就不再是噪聲的雪花點(diǎn)了,逐漸出現(xiàn)了電視節(jié)目的畫面。

AI畫畫(diffusion擴(kuò)散模型原理)大仙河版解釋

最后就能把這個圖像生成出來了,這個圖就是計(jì)算機(jī)/AI理解的人類描述語言的畫面。以上就是白話版AI畫畫的原理(專指diffusion擴(kuò)散方法,包括上文提及的各種競品)。

看完了上述原理,你還覺得自然語言大模型是無用的嗎?你還覺得人工智能是人工智障嗎?正是因?yàn)橛辛烁鞣N自然語言大模型(無論是英文的、中文的),才能讓「AI畫畫」成為可能。

如果說大家覺得各種AI虛擬聊天助手智商堪憂的話,可以嘗試AI畫畫,真正可以感受到科技的力量,因?yàn)楫吘埂耙粓D勝千言”。

至少對于我來講,一個AI行業(yè)的非技術(shù)從業(yè)者,也在體驗(yàn)了「AI畫畫」之后,覺得“大模型”真香。

今年是text-to-image(文字到圖像)蓬勃發(fā)展的一年,我們看到了AIGC逐步出圈,不再是學(xué)術(shù)圈一小撮人自娛自樂的狂歡,而變成了真正民治、民享的產(chǎn)品。

前不久知名網(wǎng)絡(luò)作家「和菜頭」專門寫了一篇專欄分享他使用AI畫畫軟件的心得,想來AI畫畫的影響已經(jīng)逐步擴(kuò)散至插畫師們、數(shù)位藝術(shù)家們、游戲畫師以及廣大的內(nèi)容創(chuàng)作者們了。

因?yàn)锳I畫畫確實(shí)畫得更好了、更好用了、更方便了,其速度和質(zhì)量已經(jīng)超過大部分人類,所以AI畫畫才能出圈,才可以實(shí)現(xiàn)AI全民化。

三、AI會不會取代創(chuàng)意類工作?有什么影響?

最后聊聊所有人都會關(guān)心的問題,AI畫畫全民化了,那我們怎么辦?所有內(nèi)容創(chuàng)作者、數(shù)位藝術(shù)家們怎么辦?我們會被取代嗎?

首先,我們要肯定技術(shù)進(jìn)步帶來的社會進(jìn)步,整體來說我們大部分人會因此受益。因?yàn)楫嫯嫷拈T檻變低了,或者說人們獲得一張好看的、自己腦海中的畫面的成本很低。我們不用再去像是達(dá)·芬奇畫雞蛋那樣,一張一張地重復(fù)打磨基礎(chǔ)也可以獲得一張很漂亮的畫作。

比如說,對于前面提到的產(chǎn)品經(jīng)理或者是文字作家,完全就可以通過「AI畫畫」能力,直接文字描述獲得想要的畫面,穿插于自己的作品中,提升創(chuàng)作效率,也增加讀者和用戶的可讀性,提高內(nèi)容表達(dá)豐富性。

內(nèi)容生產(chǎn)力效率提升還能帶來什么呢?往大了說,能加速人類文明蓬勃發(fā)展。舉個例子,放在古代,沒有造紙術(shù)的時候,人們靠牛車?yán)瓭M車竹簡刻的書上所包含的信息量和你今天手機(jī)上的內(nèi)容量,哪個更多?

而且現(xiàn)在人們每個人都能獲得這些信息,每個人都可以創(chuàng)作更好的內(nèi)容,「AI畫畫」為人類文明加載了助推器也不為過。

其次,AI畫畫促進(jìn)了相關(guān)產(chǎn)業(yè)的發(fā)展,同時也創(chuàng)造了與之相關(guān)的新的崗位。比如現(xiàn)在很多科技大廠都在重金投入智慧創(chuàng)作,而智慧創(chuàng)作的核心就是“AI創(chuàng)作”,除了AI畫畫、AI寫詩、AI剪輯視頻、AI驅(qū)動虛擬頭像、AI換背景等等,AI創(chuàng)作還能做什么呢?如何讓用戶更喜歡用,更好用呢?

AI創(chuàng)作需要產(chǎn)品經(jīng)理定義產(chǎn)品需求、用戶場景,需要開發(fā)人員開發(fā)相關(guān)應(yīng)用,當(dāng)然也需要算法人員在相應(yīng)的細(xì)分用戶場景上進(jìn)一步調(diào)優(yōu):大模型雖好,但不能包治百病。產(chǎn)業(yè)發(fā)展起來了,需要上下游參與的人越來越多,自然也創(chuàng)造了很多就業(yè)崗位。

當(dāng)然除了2D靜態(tài)的創(chuàng)作,AI還可以進(jìn)行視頻的創(chuàng)作,比如前不久剛從Tesla離職的計(jì)算機(jī)視覺大牛AndrejKarpathy就上傳了自制的python學(xué)習(xí)課程,里面的視頻內(nèi)容就全部都是stablediffusion創(chuàng)作的。如果你是一個知識視頻up主,不愿意露臉也不太會各種復(fù)雜的剪輯,通過AI創(chuàng)作就可以讓很多不會做視頻的人群瞬間具備了做視頻的能力,普通人也可以參與到視頻創(chuàng)作的工作中來,賺取相應(yīng)的收益。

AI同樣可以創(chuàng)作3D的物體或者是人物形象,現(xiàn)在很多3D游戲里的場景和人物已經(jīng)是AI批量生成的了,元宇宙的場景中同樣也需要大量的3D素材,如何使用AI將其創(chuàng)作出來,其實(shí)也是一個技術(shù)活。

此外還有AI畫畫衍生出來的一些工種,比如有的人會通過讓AI創(chuàng)作出來不同畫風(fēng)的高清/4K/8K壁紙,看哪類型的壁紙受益好,放到相應(yīng)的壁紙網(wǎng)站上賺取受益,同理也可以制作短視頻,在短視頻平臺上養(yǎng)號,賺取收益。

說完C需求,我們看看B端需求?,F(xiàn)在很多廣告已經(jīng)不再是“人”來制作了,而是直接讓AI來創(chuàng)作,AI學(xué)習(xí)各種用戶點(diǎn)擊率高、轉(zhuǎn)化率高的廣告,可以更加快速地編輯生成滿足廣告主爸爸們需求的廣告,而且甚至可以根據(jù)不同的投放渠道,不同的目標(biāo)人群進(jìn)行相應(yīng)的調(diào)整。這背后當(dāng)然也需要大量的算法同學(xué)、產(chǎn)品策略同學(xué)等等來支持維護(hù),AI創(chuàng)作才能發(fā)揮其最大的效益。

那些畫家或者是藝術(shù)創(chuàng)作者呢?他們要擔(dān)心被AI取代工作嗎?我覺得還好,每個人的風(fēng)格大不相同,而且藝術(shù)家最最核心的能力在于打造屬于自己的風(fēng)格,而不是去臨摹追隨其他人的風(fēng)格,而風(fēng)格的創(chuàng)造和定義是人類獨(dú)一無二的,AI無法替代的。

未來藝術(shù)家們?nèi)耘f可以一邊潛心自己的創(chuàng)作和風(fēng)格摸索,一邊調(diào)教AI,讓TA更好地學(xué)習(xí)你的創(chuàng)作風(fēng)格,創(chuàng)作出同風(fēng)格的更多作品,滿足更多的目標(biāo)客戶,甚至未來的藝術(shù)品都可以千人千面。

比如有的人可能就想要黃色的「星空」、藍(lán)色的「向日葵」來裝飾自己的家,那么藝術(shù)家當(dāng)然完全可以將這類工作交給AI來處理。到那時,人投入時間和心血創(chuàng)作的作品肯定價值會更高,但是藝術(shù)家的產(chǎn)量也會總體增加,總收益和影響力都會極大地增加。

最后,想要打消大家的過度憂慮,每個科學(xué)技術(shù)的進(jìn)步都會帶來巨大的社會變革是沒錯,但是我們不能因此拒絕或者是抵觸技術(shù)的進(jìn)步。AI創(chuàng)作本質(zhì)上是提升了人類社會內(nèi)容創(chuàng)作的效率并降低了成本,間接可以讓文明更好的傳承。將人類從一些低效耗時的事情上釋放出來,向價值鏈更高處遷移。

原來已有的方式不會消亡,反而會變得更加珍貴。比如說工業(yè)革命之后,大家都用了工業(yè)品,極大地改善了生活品質(zhì),但是手工業(yè)并沒有消亡,而現(xiàn)在很多純手工打造的產(chǎn)品反而會更加昂貴,甚至很多奢侈品都會主打是純手工。

同理,未來,畫畫門檻便低了之后,人們可以欣賞到、體驗(yàn)到更加精美的作品,但是也可以花更高的價格去買“純手工”的畫作。

畢竟AI并不能「誕生」畢加索、達(dá)利、米開朗琪羅、哥白尼、牛頓,但是人類可以。既要踏入無人之境,就請擁抱變化和未知吧,請對科技擁有更多善意和信心。

專欄作家

大仙河,公眾號:大仙河知識學(xué)堂,人人都是產(chǎn)品經(jīng)理專欄作家。7年AI產(chǎn)品相關(guān)經(jīng)驗(yàn),專注AI產(chǎn)品化(元宇宙、數(shù)字人、全息通信等)領(lǐng)域,致力于構(gòu)建人工智能學(xué)術(shù)和工業(yè)界的橋梁。

本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

本文為人人都是產(chǎn)品經(jīng)理《原創(chuàng)激勵計(jì)劃》出品。

題圖來自Unsplash,基于CC0協(xié)議

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 人工智能畫畫,可以降低創(chuàng)作成本和精力

    回復(fù)
  2. 好評!受益匪淺

    來自北京 回復(fù)
  3. 謝謝筆者的分享,很受益。剛才看了相關(guān)的幾幅AI生成的作品 感覺人物基本都是背影 面部也不是很清晰,是不是因?yàn)榧夹g(shù)原因?

    來自廣東 回復(fù)
    1. 可以通過一些文字描述 幫助ai更進(jìn)一步理解

      來自廣東 回復(fù)
    2. 明白了 謝謝您

      來自廣東 回復(fù)