只給一張Doge圖,GPT-4o就幫我畫(huà)好一整個(gè)RPG游戲

0 評(píng)論 1140 瀏覽 1 收藏 22 分鐘

GPT-4o集成圖像生成功能,開(kāi)啟創(chuàng)作自由新高峰。僅憑一張Doge圖,知危編輯部借助Sora平臺(tái),打造了一整個(gè)中世紀(jì)RPG游戲的概念設(shè)計(jì)。從柴犬騎士到橘貓魔,GPT-4o展現(xiàn)了驚人的圖像一致性和指令遵循能力,為創(chuàng)作者提供了強(qiáng)大的技術(shù)支撐。本文將帶您探索這一創(chuàng)作奇跡背后的奧秘。

上周(?3 月 26 日 ),OpenAI 突然來(lái)了一個(gè)更新,將 GPT-4o 模型集成了圖像生成功能,正式向 ChatGPT 的 Plus、Pro、Team 及免費(fèi)用戶開(kāi)放。同時(shí),該功能在 Sora 平臺(tái)也已同步啟用。經(jīng)測(cè)試,Plus 用戶幾乎沒(méi)有使用次數(shù)限制,在 Sora 上可以最多單次生成 4 張圖片,體驗(yàn)更好。( 由于訪問(wèn)量過(guò)大,現(xiàn)在已經(jīng)限制為兩張?)

觀察各種測(cè)試案例,可以發(fā)現(xiàn) GPT-4o 能夠?qū)崿F(xiàn)多種神奇的功能或特性,包括主體關(guān)系控制、多視圖生成、精準(zhǔn)輪廓的風(fēng)格遷移、知識(shí)理解能力、多輪對(duì)話編輯能力、多元素的一致穩(wěn)定性控制、復(fù)雜文字嵌入和排版等。

實(shí)際上,一句話總結(jié)就是超精準(zhǔn)的指令遵循,以及自主生成部分的可靠性。

OpenAI 的 CEO Sam Altman 表示此舉將開(kāi)啟創(chuàng)作自由的新高峰。

如果沒(méi)有深度融入創(chuàng)作者的工作流中,創(chuàng)作自由不過(guò)是隨口說(shuō)說(shuō),所以目前網(wǎng)上零散的案例并沒(méi)有太高的說(shuō)服力。

為了測(cè)試 Sam Altman 是不是在吹牛,知危編輯部做了一個(gè)深度測(cè)評(píng),用一個(gè)主題和多輪對(duì)話,將上面提到的特點(diǎn)一次性測(cè)試完成。簡(jiǎn)單來(lái)說(shuō),就是開(kāi)局一只柴犬,用 Sora ( 也就是 GPT-4o 的圖片生成能力 )來(lái)做一個(gè)中世紀(jì) RPG 游戲的概念設(shè)計(jì)。

怎么做?很簡(jiǎn)單,給柴犬穿上盔甲,通過(guò)時(shí)空隧道送到中世紀(jì)就行了。

實(shí)測(cè)效果表明,GPT-4o 畫(huà)圖的前后一致性實(shí)在太驚人了。畫(huà)了幾十張圖,就都沒(méi)有跑偏。

為了展示這種一致性,我們暫時(shí)跳過(guò)畫(huà)圖的過(guò)程、順序和提示詞,先展示一下成品樣圖。

序章:使命的開(kāi)始。傳說(shuō)中,在古老的蘭斯王國(guó),被詛咒的石頭城堡已經(jīng)被黑暗魔法侵蝕數(shù)百年。

其中棲居著可怕的橘貓魔 —— 一個(gè)吞噬靈魂、操控城堡的黑暗法師。

漢字生成還是有些問(wèn)題,但是能看懂

王國(guó)最后的希望,就寄托在這位身披銀白色板甲的柴犬騎士身上。他的名字叫艾倫,手中的長(zhǎng)劍 ” 王國(guó)的黎明 ” 是王室傳承的神器。

年輕的柴犬騎士將面臨極端危險(xiǎn)的任務(wù)。他不僅要打敗橘貓魔,還得面對(duì)城堡中9種強(qiáng)大怪物的阻撓。

他感到既興奮又緊張,急急忙忙清點(diǎn)裝備。

出發(fā)!

當(dāng)艾倫踏入詛咒城堡的瞬間,第一個(gè)考驗(yàn)已悄然而至。石之精靈——那個(gè)能融入石墻的微小怪物,突然從墻面裂縫中彈出。利爪閃爍,尖嘯劃破寂靜。

艾倫本能地側(cè)身,長(zhǎng)劍一揮,精靈應(yīng)聲而碎。

這只是開(kāi)始,城堡似乎在用最微小的守衛(wèi)測(cè)試他的決心。

隨著深入城堡,艾倫遇到越來(lái)越強(qiáng)大的敵人。

腐爛蘑菇骷髏、暗影鼠群、破碎鎧甲傀儡……

每一個(gè)怪物都仿佛是這座詛咒城堡漫長(zhǎng)歷史的見(jiàn)證者。

在城堡的深處,他遇到了最危險(xiǎn)的對(duì)手之一:全身覆蓋神秘符文的狼人。

那是一個(gè)強(qiáng)大到令人窒息的存在,仿佛隨時(shí)可以撕裂現(xiàn)實(shí)。

關(guān)鍵時(shí)刻,艾倫召喚了之前在高層的城樓戰(zhàn)斗中降服的腐肉騎士和瘟疫烏鴉。

藤蔓纏繞,烏鴉群包圍,符文狼人瞬間破防。他趁機(jī)給予致命一擊,擊敗了這個(gè)強(qiáng)大的守衛(wèi)。

在進(jìn)入城堡最高的大廳之前,柴犬騎士在一個(gè)碑文上讀到了橘貓魔的身世,以及王國(guó)災(zāi)厄的根源。

漢字生成依然有些崩但是依然能看懂

打開(kāi)大門(mén)后,柴犬騎士終于和橘貓魔面對(duì)面。

一言不合,橘貓魔瞬間黑化和巨大化。這是一個(gè)已經(jīng)與城堡融為一體的存在,半神半魔,操控著數(shù)百年的黑暗力量。

戰(zhàn)斗一觸即發(fā)!

雙方對(duì)峙,力量在空氣中激蕩;能量激烈碰撞,周?chē)臻g扭曲;艾倫積蓄所有力量,釋放 ” 王國(guó)的黎明 ” 最強(qiáng)一擊。

當(dāng)最后一縷黑暗消散,艾倫站在廢墟中。橘貓魔徹底被擊敗,城堡開(kāi)始恢復(fù)光明。遠(yuǎn)處,陽(yáng)光透過(guò)破損的窗戶灑落。橘貓魔留下的魔法袍,此刻安靜地懸浮在艾倫面前。這是戰(zhàn)利品,也是王國(guó)新的希望。

當(dāng)他披上這件充滿古老魔法的袍子,瞬時(shí)就將魔法與力量相結(jié)合,領(lǐng)悟了四個(gè)新的招式:貓爪裂空斬、貓影穿刺、貓尾旋風(fēng)、貓步震地刀。

王國(guó)重新恢復(fù)了昔日里寧?kù)o祥和。

柴犬騎士沒(méi)有停下腳步,他知道邪惡的根源沒(méi)有被徹底清除,于是繼續(xù)踏上征程。

站在一片灰暗的懸崖邊緣,魔法袍輕輕飄動(dòng)。他背對(duì)著腐爛的沼澤,長(zhǎng)劍橫在背后,寬大的袍子上點(diǎn)綴著青綠色的符文。

遠(yuǎn)處,腐爛的樹(shù)木如同巨大的骸骨,在霧氣中若隱若現(xiàn),斷裂的石橋猶如一根被折斷的脊梁,橫跨在死寂的沼澤之上。

這將是柴犬騎士要面臨的第二個(gè)難關(guān):腐敗沼澤深淵。

以上是知危編輯部臆想出的 RPG 游戲《 詛咒世界:破碎王國(guó) 》的開(kāi)頭,所有圖片均為 GPT-4o 生成。

在構(gòu)想中,破碎王國(guó)整個(gè)世界是破碎的孤島連接而成,每個(gè)關(guān)卡都是這個(gè)破碎世界的一個(gè)層級(jí),層級(jí)之間并非直線連接,而是通過(guò)扭曲的空間通道相互鏈接。

世界構(gòu)成為:

底部核心:詛咒城堡;

第二層:腐敗沼澤深淵;

第三層:冰封王座高原;

第四層:灼燒熔爐廢墟;

第五層:暗影織網(wǎng)迷宮;

頂層:時(shí)空破碎祭壇。

戰(zhàn)斗才剛剛開(kāi)始。

注:此動(dòng)圖并非 4o 生成,而是Sora生成的視頻

好了,游戲設(shè)計(jì)到此為止。我們回過(guò)頭來(lái)評(píng)估一下生成效果。

可以說(shuō),從頭到尾,柴犬和其它怪物的形象都沒(méi)有發(fā)生太大偏差,甚至裝備、城堡都保持了很好的一致性,這是整個(gè)過(guò)程中最深刻的體會(huì)。

橘貓魔的身世背景介紹展示了 GPT-4o 嵌入大量文字的強(qiáng)大能力,GPT-4o目前對(duì)非拉丁文字的生成還不擅長(zhǎng),但還是那句話,你莫名其妙基本能讀懂。

我們給 GPT-4o 的提示詞是這樣的:

以下是橘貓魔的詳細(xì)檔案,請(qǐng)用一個(gè)中世紀(jì)羊皮紙的形式呈現(xiàn)以下信息:
名稱:橘貓魔
生平背景: 橘貓魔原本是一位王國(guó)最強(qiáng)大的法師,精通黑暗魔法和古老禁忌咒術(shù)。數(shù)百年前,他因追求永生和至高無(wú)上的力量,背叛了魔法師協(xié)會(huì),將整個(gè)石頭城堡作為自己的魔法實(shí)驗(yàn)場(chǎng)。通過(guò)獻(xiàn)祭城堡中的所有居民,他完成了一個(gè)驚天動(dòng)地的儀式,將自己與城堡融為一體,成為了一個(gè)半神半魔的存在。
征服石頭城堡的過(guò)程:
用 72 天的黑暗儀式將城堡轉(zhuǎn)化為自己的永恒領(lǐng)域
吸收了城堡中所有生命的靈魂力量
將城堡本身變成了一個(gè)巨大的活體魔法生物
徹底切斷了城堡與外界現(xiàn)實(shí)世界的聯(lián)系
能力屬性:
生命值:10000
魔法值:15000
力量:850
敏捷:600
智慧:1200
精神抗性:99%
武器與魔法裝備:
主武器:滅世之爪
每次攻擊能吸收敵人10%的生命力
副武器:城堡意志權(quán)杖
能召喚城堡內(nèi)任何區(qū)域的守衛(wèi)

這些文字也被 GPT-4o 提取到了橘貓魔的資料卡中,但是你仔細(xì)看會(huì)發(fā)現(xiàn),屬性還是有一些是標(biāo)錯(cuò)了的。

城堡怪物圖譜是通過(guò)對(duì)每個(gè)怪物都指定一個(gè)描述來(lái)生成的,基本都遵循了指令。這種能力屬于多元素的一致穩(wěn)定性控制,在制作統(tǒng)一風(fēng)格的場(chǎng)景、人物、裝備元素時(shí)特別有用。

上圖我們給 GPT-4o 的提示詞是這樣的:

柴犬騎士在石頭城堡( 被詛咒的城堡 )的冒險(xiǎn)中,在找到最后的 boss 之前,將面臨 6 種小型怪物,3 種中型怪物的阻撓,以下是這些怪物的描述:
小型怪物 ( 6 種 ) :
①石之精靈:能融入石墻的微小尖嘯怪,突然從墻面彈出攻擊敵人。
②腐爛蘑菇骷髏:從地牢潮濕角落爬出的會(huì)移動(dòng)的植物骷髏。
③暗影鼠群:能在黑暗中集群攻擊,如幽靈般迅速移動(dòng)的詭異嚙齒生物。
④破碎鎧甲傀儡:由殘缺鎧甲組成的會(huì)自行移動(dòng)的戰(zhàn)爭(zhēng)殘骸。
⑤詛咒蝙蝠:翅膀帶有詭異符文,能發(fā)出令人戰(zhàn)栗的尖嘯。
⑥瘟疫烏鴉:身體散發(fā)黑色瘟疫霧氣的詭異禽類。
中型怪物 ( 3 種 ):
①石像鬼守衛(wèi):能瞬間變成石頭并偷襲的半人形怪物。
②腐肉騎士:半腐爛的騎士,身上纏繞不潔的藤蔓。
③符文狼人:全身覆蓋神秘符文的半獸人形態(tài)。
請(qǐng)生成一個(gè)游戲頁(yè)面( 怪物圖譜 )展示這些怪物的簡(jiǎn)筆畫(huà),注意頁(yè)面排布美觀整齊,怪物特征和頁(yè)面風(fēng)格要符合中世紀(jì) RPG 的世界觀。

這組怪物圖譜的畫(huà)風(fēng),也輕易地遷移到了后續(xù) Doge 獲得新技能的制作以及世界觀地圖的制作中。

制作出具有一致性圖像的關(guān)鍵,在于合適的參考圖和詳細(xì)的提示詞( 很大一部分提示詞借助了 Claude 生成,這何嘗又不是一種 NTR 呢 )。比如柴犬騎士在第二關(guān)開(kāi)頭的場(chǎng)景。

對(duì)于這個(gè)場(chǎng)景的生成,結(jié)合第一關(guān)開(kāi)頭的構(gòu)圖、柴犬騎士的本體形象,就能更好保證一致性。

對(duì)于游戲完整地圖的生成。

提供相同畫(huà)風(fēng)的圖譜、劍譜,就能控制畫(huà)風(fēng)的一致性。

空間構(gòu)圖的設(shè)計(jì),對(duì)畫(huà)面效果的呈現(xiàn)也很重要。

比如,如果用比較簡(jiǎn)單的提示詞,來(lái)生成柴犬騎士和橘貓魔的對(duì)峙,看起來(lái)像在拉家常。

我們給 GPT-4o 的提示詞是這樣的:

接下來(lái),加上空間構(gòu)圖提示詞。

氛圍感一下子就出來(lái)了。

整個(gè)生成過(guò)程當(dāng)然不是一鏡到底,還是會(huì)有不少 Bug,以及難以實(shí)現(xiàn)的細(xì)節(jié)。

比如柴犬騎士有時(shí)候雙足站立有時(shí)候不是,甚至?xí)霈F(xiàn)同時(shí)有四只腳和兩只手的情況,物品欄中的頭盔形狀和柴犬騎士實(shí)際佩戴的不一樣,城堡在被詛咒前后的外形細(xì)節(jié)偏差等等。

比如生成裝備選擇畫(huà)面的時(shí)候,調(diào)了很多次提示詞都沒(méi)有得到滿意的效果,當(dāng)然也不排除我們所使用的提示詞不夠?qū)I(yè)和系統(tǒng)的原因。

怪物圖譜生成如果元素過(guò)多或不能劃分為 m*n 的矩形( 比如 16=4*4 ),也可能導(dǎo)致生成效果不規(guī)整,視覺(jué)排布凌亂。

最難實(shí)現(xiàn)的細(xì)節(jié)是不同主體的復(fù)雜交互,比如柴犬騎士擊中石之精靈的瞬間、腐肉騎士和符文狼人打斗的瞬間,都很難遵循詳細(xì)的提示,呈現(xiàn)效果一般。

細(xì)節(jié)錯(cuò)誤可以用局部編輯完善,但對(duì)圖片進(jìn)行局部編輯的時(shí)候,不能完全保證修改范圍局限在指定的位置。

比如第一次生成的游戲地圖,在 “ 冰封王座高原 ” 部分的英文標(biāo)注是錯(cuò)誤的,應(yīng)該是 “ Frozen Throne Plateau ”,但寫(xiě)成了 “ Scorching Furnace Ruins ”( 灼熱熔爐遺跡 )。

對(duì) “ Scorching Furnace Ruins ” 涂抹掩碼,提示進(jìn)行修改并重新生成后。最終效果是滿意的,但最頂部的 “ 時(shí)空破碎祭壇 ” 的外形被修改了。

到這里,評(píng)測(cè)就結(jié)束啦!

總體而言,GPT-4o 的生圖功能,相比過(guò)往其它生圖應(yīng)用的體驗(yàn),不聽(tīng)話、亂畫(huà)沒(méi)說(shuō)的、畫(huà)的不像話,這種令人崩潰的體驗(yàn),少了太多太多。只要用 Sora 一次生成 4 張圖,獲得想要的結(jié)果的概率極大。

在 “ 柴犬騎士勇闖破碎王國(guó) ” 的概念設(shè)計(jì)中,GPT-4o 展現(xiàn)了精準(zhǔn)的指令遵循、驚人的圖像一致性,這種能力,正是將技術(shù)從工具升華為創(chuàng)作伙伴的關(guān)鍵所在??梢哉f(shuō) GPT-4o 為創(chuàng)作者打開(kāi)了一扇通向想象的大門(mén),看來(lái) Sam Altman 沒(méi)有說(shuō)的太夸張。

當(dāng)然,GPT-4o 不是終點(diǎn),而是一個(gè)令人興奮的起點(diǎn)。

本文由人人都是產(chǎn)品經(jīng)理作者【汪仔2083】,微信公眾號(hào):【知?!?,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來(lái)自Unsplash,基于 CC0 協(xié)議。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒(méi)評(píng)論,等你發(fā)揮!