GPT-4o深度體驗后發(fā)現,可能comfyUI工作流真不用學了
本文深入體驗了GPT-4o圖像生成模型,發(fā)現其在多種設計場景中表現出色,甚至可能讓comfyUI工作流的學習變得不再必要。
上周我介紹了gemini生圖模型,我覺得已經算是實用性很強了,但緊接著Open AI就卷起來了,也更新了一波圖像生成模型,然后迅速在全網刷屏。那它的效果到底好不好用呢?是不是被吹的很厲害?我很好奇啊,所以周末趕緊深度實測了一波,先說結論:生成的圖確實比Gemini的更好,但也并不完美。
我用GPT-4o深度測評了2天,當它真的可以指哪打哪后,我實在是不知道怎么形容。這篇文章我先跟大家總結10個最好用的使用示例,向你證明它確實是太好用了!
先說明一下,有些人可能會發(fā)現不充會員也能用GTP-4o,但出來的圖效果完全不行。這是因為免費用戶是用不了新的圖像生成模型的,每天送的那5次用的其實是Dall-E模型,不是真正的新繪圖模型。
充值后,選擇更多中的“創(chuàng)建圖片”用的才是全新的GTP-4o畫圖模型。
所以,我周末花費巨資,先是買了一張?zhí)摂M信用卡,然后又再充值了一個plus會員,很順利的就用上了。注意咱們只需要花$20買plus會員就夠了,不用去買那個$200每個月的,太浪費了。 從我使用的情況來看,plus會員就能一直生圖,我用了2天,沒出現限制的情況。
到這里估計就有朋友會問了,到底怎么充值?。吭赾hatGPT官網充值不支持國內信用卡,找淘寶代充不放心,跟別人合租使用又覺得不方便,辦海外卡又沒有途徑,怎么辦?
如何用上chatGPT-4o?
我自己試了一圈下來,最終總結還是在網上辦一張?zhí)摂M信用卡最方便,又快又省心。我用的虛擬卡網址是 WildCard (https://bewildcard.com ) ,步驟很簡單,注冊會員然后開卡就行。在開卡的時候用我的邀請碼:BJRGRQI4 ,可以減免1美元年費,不收月費,挺劃算的。
然后再往這張卡里充值20美元(用支付寶就能充),就可以買GPT-4o plus了,一個月20美元也可以用上最新的畫圖功能。
我自己的充值消費記錄
好了,到這里相信大家已經解決了充值問題,也成了chatGPT尊貴的會員了,可以開始愉快的生圖了。那有哪些有意思的應用場景可以讓我們快速玩出花來呢?
我測試了以下10種場景,各個都非常驚艷!
注意:用的時候,記得先點更多,選擇創(chuàng)建圖片后再輸出提示詞,在提示詞前面會有藍色的“創(chuàng)建圖片”,確保使用新模型且生效。
10個最常用的使用場景案例
1)生成組圖
我測試的第一個生成圖片,就是直接挑戰(zhàn)高難度,讓它在一個畫面中同時生成一批帶有對應特征的內容。這在目前其他AI生圖能力上基本都超綱了,咱們直接上強度,看看它到底行不行?
提示詞:一張正方形圖片,包含一個4行4列的網格,網格上有16個圖形,背景為白色,從左到右,從上到下。圖形的風格請保持和參考圖一致,列表如下:1、一塊橙色的面包2、一個白色的星巴克杯子3、一個草莓蛋糕4、一瓶牛奶5、一瓶汽水6、一杯奶茶7、一張桌子8、便利店9、一只戴著帽子的狗10、一輛紅色的小汽車11、一束玫瑰花12、一把黑色雨傘13、一雙紅色高跟鞋14、幾個包子15、用草書寫的“caiyun”16、辦公樓
效果出來了,16個元素,位置、內容完全正確,風格和細節(jié)程度還做到了統(tǒng)一,非常棒!
接著,我想把它的風格按我提供的參考圖重新設計下,畢竟在實際項目里,需要的風格比較確定,風格要做到一致性。
提示詞:參考這張圖,把上面的圖風格改成和參考圖一致
這是生成后的效果,開始有一些錯誤了。所以,我不滿足,讓它繼續(xù)改。
有一些修正,但也還是會有問題,所以我想把它改回來,看看有沒有修正回來的可能性,就和在實際工作中指導實習生的感覺。
提示詞:再仔細對照最初的參考圖和設計要求,顏色沒有這么多,有幾個地方的內容出錯了,第2個,第7個,第10個
最終改了幾輪后,有些改回來了,但又出了新的錯誤,我打算就此打住。
雖然它的效果還不是很完美,但總體上拿來稍微改改其實就能用了,已經給了我不小的驚喜,因為我也同時把這個提示詞問了谷歌gemini,出來的圖是這樣的。
只能說,沒有對比就沒有傷害。
2)風格轉換
GPT-4o有類似comfy UI中的ControlNet的功能,可以完全復刻參考圖中的人物姿勢,或根據線稿生成指定風格的圖像。
給大家看下我當時測試的一個例子。
提示詞:把上圖中的畫面轉換為3D風格
轉換后的圖,已經非常像了有沒有,這還學啥建模?。抠|量也太高了。
眼尖的你可能會發(fā)現,生成后的圖和原圖稍微會有點區(qū)別,但這其實是官方刻意為之,不是做不到。因為當我要求它跟原圖一樣時,就違反規(guī)定了。
可能大家在操作的時候,經常會出現一個限制提示,說你違反了他們的規(guī)定。OpenAI 的內容政策特別嚴格地限制“高度擬真人物”的圖像生成,尤其是當提示詞中涉及“肖像還原”“外貌匹配”等字樣時,哪怕是你自己的照片,模型出于防止誤用(例如深度偽造)的政策,也有可能拒絕生成。
所以當出現人物相關需求時,可以用回comfyUI或Gemini,能解決問題。
此時,我已經不滿足于把帶人物的插畫轉成照片,我想把我覺得很美的插圖壁紙也都轉成照片了,那會是什么樣的美景呢?咱們試試效果。
提示詞:把這個場景變成一張寫實照片
這是它生成出來的效果。
當我看到它生成出來的效果時,我真的是被驚艷到了,這效果還原的確實是有點太好了。
我在出這張圖的時候已經是晚上12點多了,但我已經沒了睡意,想趕緊多試試,這錢沒白花呀。
我又找了另外一張我很喜歡的風景插圖轉換成了真實美景。
除了轉成通用的卡通風格,還可以在提示詞中加入指定的漫畫家風格,使其更有對應風格的特點。比如我把上一篇文章中生成的美女圖換成海賊王風格會是什么樣的?
提示詞:將參考圖變成海賊王的畫風
再轉成樂高風格,提示詞:將參考圖變成樂高的畫風
我還想把哪吒的3D圖改為哆啦A夢的風格。
提示詞:將參考圖變成藤子不二雄風格
風格轉換后,有點大雄的感覺啊,哈哈。
3)生成海報
它能根據自身的知識庫,生成符合用戶意圖的配圖。
比如我希望它幫我生成一張宇宙百科示意圖。
提示詞:我需要給百科全書畫一張插圖,請幫我用矢量插圖風格生成一張不同類型的星球插圖,需要有對應星球的名字,一句話介紹,背景為白色
這是生成出來的效果,質量很高啊,文字也都是對的。這在之前的生圖模型中,其實很難做到,現在居然這么準確了。
英文沒問題,那中文如何呢?我又試了下
提示詞:把圖中的英文改成中文
發(fā)現基本都能對上,不過也有一些小瑕疵,比如錯別字,筆畫粗細之類的細節(jié)還有提升空間,不過基本上稍微改改就能用了。
然后我又覺得太背景太干,適當加多一些細節(jié)。
提示詞:背景上需要加多一些設計感,能用在書籍的宣傳插圖
背景加的還可以,還能繼續(xù)微調,就像在指導一位設計實習生一般,沒有脾氣,不會疲勞,可以一直改,就問老板們喜不喜歡?設計師們怕不怕!4)虛擬試穿
GPT-4o能把提供的衣服、模特素材,直接合成想要的畫面,完成電商里面經常用到的試穿效果圖。這個能力其實在comfyUI和Gemini中都能做到,但我發(fā)現GPT-4o出來的效果似乎會更好。
提示詞:把褲子,帽子,衣服穿到模特身上,并且走在街道上
出來的效果非常好,除了帽子logo那稍微有點瑕疵,其他幾乎完全被復刻了過來。瞬間感覺用comfyUI搭建的工作流已經失去了意義。
5)動漫設計
它可以一次性上傳多個角色設定,然后要求GPT-4o轉換視角和場景,生成全新的漫畫設定,同時保留漫畫角色特征。
提示詞:讓鳴人和路飛這2個角色在中忍考試的場景中激烈的戰(zhàn)斗,畫面中有相應角色的技能特效
直接這樣會提示違規(guī),猜測可能是有版權的問題。按它提示繼續(xù)操作就可以了,依然能保持參考圖的特征,繞過限制。
但在出來的圖片這里,手臂是有點問題的,我們也可以用它的局部修改功能。怎么操作呢?
點擊圖片放大,然后點右上角有一個編輯圖標
點完之后,可以看到一只畫筆,然后把想修改的地方圈出來,寫上提示詞就可以了。
這是優(yōu)化之后的,能看到還是有一些瑕疵,還可以繼續(xù)優(yōu)化,我這里就不演示了。
6)改圖標風格
在UI 領域,也可以讓它根據一種風格生成對應的圖標。咱們設計師經常找參考圖,做情緒版,不就是為了做好風格設計嗎?這下GPT-4o也能搞了,而且還挺精細。
比如讓它按找到的設計參考圖,重新設計圖標。
提示詞:按照第1個風格圖標重新設計第2張圖中的圖標
最后生成的效果,雖然圖片還存在一定的瑕疵,比如透視關系不大對,但這個效果還是非常不錯的。
一整套圖標時也可以出效果
最后的效果也還不錯,除了第一個圖標有瑕疵。
7)圖像提取
GPT-4o可以從圖像中摳圖,它還不是一種簡單的摳圖,而是扣出畫面內容,然后幫你做高清修復。
比如我找到了這張圖,水中的海豚其實已經很不清晰了,整個圖片也不到700px,要想摳出來完整細節(jié)挺不容易的。
提示詞:幫我把畫面中的海豚提取出來
看到了嗎?它不是簡單的摳圖,而是把需要摳圖的海豚完整的摳出,而且還自帶了修復,并且還給了一張透明格式的圖片!
8)AI找圖
它不僅能按提示詞出圖,還能根據它自己的知識庫,根據我的一句話描述,直接把我想要的圖“找”出來。
提示詞:找一張火影里面的小櫻的圖
這是幫我找出來的圖,質量非常高,幾乎沒有啥瑕疵。
9)老舊照片上色
這個功能其實其他AI也有,只是我覺得GPT-4o出來的圖更好,尤其是在那些細節(jié)還原度上,甚至景深那些都能比較好的復原。
比如我從網上找到這樣一張照片,我覺得挺有質感的,咱們來實驗一波。
提示詞:為這個老照片變?yōu)椴噬?/p>
這是修復后的照片,細節(jié)還原度拉滿。
10)一鍵修圖
它的修圖能力,感覺比PS還要強,一鍵就把畫面中的人物全干沒了。
提示詞:修改圖片,要求移除畫面中所有人,完全保留畫面中的其他實景細節(jié)
這是修完之后的效果,除了細微處還有點瑕疵外,乍一看,幾乎挑不出毛病。
好了,以上就是我自己在測試中覺得最實用的10個使用場景,它還有更多其他用法等待大家去發(fā)現,留言區(qū)期待你的發(fā)現和分享。
當前這個模型也不是完美的,它也有一些做的沒那么好的地方。比如對中文的生成還沒那么好,對一些細節(jié)做遷移的時候會有一些瑕疵,限制比較多,出圖速度上也比較慢,而且動不動還限速,挺麻煩的,然后它在一些出圖的美感上也有點不太足,和Midjourney稍差一些。但我覺得,這些問題很快就會被迭代解決,畢竟AI領域的更新節(jié)奏實在是太快了。
從各家大模型卷的方向來看,都是先保實用性,再提升美感。這和咱們平時做產品的思路一樣,先保證可用,再做到好看。
從天馬行空的驚喜到精準可控的生成,這就是這次升級中最核心的升級內容。
最后說點心里話。
從最初Midjourney剛出的時候,就有一種聲音在說設計師要下崗了,不再需要設計師了。但后面這種聲音也隨著實際項目中的應用情況而逐漸回歸理性,設計師還是沒法被取代。而到近期GPT-4o出來時,大家更能感覺到工具的好用,設計師下崗論似乎更加強烈。
但我覺得此時如果真的被取代的不是設計師,而是只會畫圖的美工,進而會進一步拉大初級和資深設計師之間的鴻溝。畫圖在實際項目中,只是設計師日程工作中的一部分,項目前期的需求溝通、概念策劃、后期與開發(fā)的對接、還原走查、用戶反饋后的分析、策略調整都是工作,而這個鏈路暫時都需要設計師的介入,沒法完全實現AI代辦。
雖然我覺得設計師完全被取代不大可能,但我隱約看到一種趨勢:距離直接畫圖越近的設計師,越容易被取代。而在項目中做設計項目管理,做概念策劃的人,負責節(jié)點較多的人會比較難被取代。原因是流程多,組織團隊復雜,需要人的介入就更多,越不容易被AI自動化。
所以,苦心鉆研技術可能并不會有出路,關鍵還是策略的思考。如果你想依賴學習到的技術做為壁壘,當你苦心學習了很多年的各種技能,結果被給AI說的一句話就打敗了,想想還是有點悲哀的吧。
本文由人人都是產品經理作者【彩云sky】,微信公眾號:【彩云譯設計】,原創(chuàng)/授權 發(fā)布于人人都是產品經理,未經許可,禁止轉載。
題圖來自Unsplash,基于 CC0 協(xié)議。
AI當然會在持續(xù)的發(fā)展,所以以前未具備的能力,現在會有將來也會有新的能力