為了集福,我生成了100個(gè)福字
一年一度的集五福又開(kāi)始了,不過(guò)有了AI的幫助,我們可以直接自己生成福字,不用再考慮到處找“?!弊值膯?wèn)題。這篇文章,我們來(lái)看看作者測(cè)試的效果,AI的表現(xiàn)如何。
臨近過(guò)年啊,一年一度的集福大戰(zhàn)又雙叒叕拉開(kāi)帷幕啦!之前家人不理解,說(shuō)弄這個(gè)能給幾百塊錢(qián)啊,我說(shuō)沒(méi)有,人均幾塊錢(qián),或者十幾塊錢(qián)的樣子吧,運(yùn)氣好了,能有個(gè)幾十左右吧。然后媽媽給我拿了 100 塊錢(qián),說(shuō):放下手機(jī),去打掃衛(wèi)生。
將近 40 歲的年紀(jì)啊,還被這么一個(gè)小小的利益給拿捏了。當(dāng)集福已成為習(xí)慣,越是到了年底,就會(huì)不由自主的想起來(lái)這個(gè)游戲??吹?“?!?字就像被施了定身咒,挪不動(dòng)腳,眼睛直勾勾地盯著,滿(mǎn)心想著趕緊掏出手機(jī)掃一掃,說(shuō)不定就能掃到稀缺???。我也完全被這股集福熱潮給 “拿捏” 得死死的,深陷其中,無(wú)法自拔。
但,一天了不起能找到十幾二十多個(gè)福字,概率還是很低的。如果說(shuō)依靠數(shù)量取勝,那為什么我不能先給自己生成 100 個(gè)福,讓就掃個(gè)過(guò)癮呢。
一、工具先行
說(shuō)干就干,我一頭扎進(jìn)了互聯(lián)網(wǎng)的海洋,開(kāi)始瘋狂搜索如何利用 AI 生成福字的方法 。
我先是考慮使用專(zhuān)門(mén)的圖形設(shè)計(jì)軟件,如 photoshop 、Illustrator 、CorelDRAW,畢竟咱是做設(shè)計(jì)出身的,這幾個(gè)軟件基礎(chǔ)功能還是掌握的。專(zhuān)業(yè)的設(shè)計(jì)圖形軟件功能強(qiáng)大,可以通過(guò)直接選擇字體生成,后面再進(jìn)行配圖就可以了。但萬(wàn)事開(kāi)頭難啊,第一步安裝軟件,就花費(fèi)了我好幾個(gè)小時(shí)。打開(kāi)軟件后,發(fā)現(xiàn)一臉的茫然,畢竟十多年沒(méi)有碰過(guò)了,我覺(jué)得我和這三個(gè)軟件關(guān)系很熟,都是鐵汁,但這三個(gè)軟件對(duì)我一臉的茫然。又是一個(gè)小時(shí),只生成了幾個(gè),還要排版,調(diào)整,眼瞅著天都黑了,我這點(diǎn)產(chǎn)出量,還不如直接用搜索得到的結(jié)果快呢。
但,大活人哪能讓尿給憋死啊。于是我放棄了專(zhuān)業(yè)的圖形軟件,改用 AI 工具來(lái)實(shí)現(xiàn)我的需求。
Kimi
我現(xiàn)打開(kāi)了常用了kimi,發(fā)現(xiàn)kimi默認(rèn)界面沒(méi)有生圖功能。給了我一段字體類(lèi)型的介紹,然后又給我一些網(wǎng)頁(yè)搜索結(jié)果。這 AI,和我想象的有點(diǎn)不不一樣啊。不是說(shuō) AI 能夠代替人類(lèi)寫(xiě)作、畫(huà)畫(huà)和思考嗎,這也沒(méi)理解我的意思,也沒(méi)達(dá)到我的要求啊。
雖然能夠解決問(wèn)題,但這次的結(jié)果不滿(mǎn)意,放棄~
文心一言
因?yàn)槲男囊谎员举|(zhì)上也是文生文的 AI 工具,所以我在開(kāi)始指令的時(shí)候,直接添加了場(chǎng)景的條件“畫(huà)”。很多小伙伴都說(shuō)自己對(duì) AI 軟件熟悉,但大多數(shù)都是在常用的基礎(chǔ)上,還有一些細(xì)節(jié)技巧的東西也需要知道和了解。
相對(duì)于Kimi的回答,文心一言的答案才是我這個(gè)場(chǎng)景需要的。雖然只生成了 9 個(gè)(大概率是排版的問(wèn)題),雖然在同一個(gè)對(duì)話(huà)中我更改了場(chǎng)景,讓其解釋這 10 個(gè)福字都是使用什么字體,沒(méi)有給我生成答案,而是繼續(xù)生成福字。但相對(duì)于第一目標(biāo)而言,結(jié)果還是令人滿(mǎn)意的。
文心一言似乎對(duì)上下文關(guān)聯(lián)的理解有時(shí)候不是很好?;蛘哒f(shuō),它只是在車(chē)轱轆話(huà),很少看到真正的「生成式內(nèi)容」。所以理解文心一言的底層模型邏輯上并不是這么簡(jiǎn)潔的,很可能也加入了很多中間層的處理,也就是把文章里完整的詞組、句子甚至段落也當(dāng)成了可檢索的對(duì)象,并且直出了(還要考慮一些指向性的關(guān)鍵詞觸發(fā))。所以這里就會(huì)出現(xiàn)在同一組對(duì)話(huà)中,如果你突然做了場(chǎng)景變更,文心一言就難以跳出這個(gè)邊界的范圍。那么如果我們需要一個(gè)不同的場(chǎng)景回答,就需要新建一組對(duì)話(huà)。
比如我新建了一組對(duì)話(huà),沒(méi)有加上畫(huà)這個(gè)關(guān)鍵詞做條件觸發(fā),那么就是文生文的結(jié)果。
我以為我找到了竅門(mén),所以我又返回了Kimi,告訴他,畫(huà):10 個(gè)字不同字體的福字。結(jié)果還是文生文。
豆包
再次使用豆包來(lái)生成,最近用豆包比較多,覺(jué)得豆包文生文,文生圖,對(duì)于場(chǎng)景的理解,對(duì)于概念的敘述性都很強(qiáng)。我已經(jīng)逐步從文心一言替換到 Kimi,現(xiàn)在又替換到豆包,作為 AI 常用工具了。
先來(lái)看結(jié)果:幫我生成圖片:生成 10 個(gè)不同字體的福字。
為了避免重復(fù),我直接把場(chǎng)景“圖片”這個(gè)要求先加上了。所以給的結(jié)果是圖片,這個(gè)是符合要求的。
我是要 10 個(gè)不同字體,數(shù)量上不精準(zhǔn)符合要求。但大總比少要少。
最后就是不同字體:肉眼對(duì)比了一下,有近一半的字體應(yīng)該是相同的。
相對(duì)于 Kimi和文心一言,豆包生成的結(jié)果還是令人滿(mǎn)意的,至少在便利性上面來(lái)說(shuō),一次就能解決問(wèn)題。搜索了一下關(guān)于豆包的 AI 功能,在 24 年的 12 月份智能AI助手豆包升級(jí)文生圖能力,支持一鍵生成指定文本。用戶(hù)可以在生圖提示詞中加入文本要求,如“一張帶有‘新年快樂(lè)’的圖”,即可生成帶有指定文字的圖片。
那么根據(jù)這樣的要求,我又重新提出了一個(gè)指令:一張帶有“?!钡膱D。結(jié)果令人意想不到。
豆包生成的圖片,更加具有美感,不光是字體樣式有了變化,連帶圖案也有了新的變化。這里猜測(cè),豆包應(yīng)該是在推理模塊增加了一些場(chǎng)景關(guān)聯(lián)。比如福字,在過(guò)年時(shí)候的使用場(chǎng)景,是有寓意的代表。那么單純一個(gè)字的結(jié)果是不能滿(mǎn)足用戶(hù)需要的,所以可以增加一個(gè)裝飾性的設(shè)計(jì)。也就是說(shuō)豆包能理解對(duì)話(huà)之間的關(guān)系、場(chǎng)景布局以及鏈路的整體含義。其次,豆包是具有復(fù)雜推理能力,不僅能更好地識(shí)別內(nèi)容,還能根據(jù)所識(shí)別的文字和圖像信息進(jìn)行復(fù)雜的邏輯計(jì)算。
在回到我們最開(kāi)始的主題:生成 100 個(gè)福字。豆包給出了近乎滿(mǎn)意的結(jié)果(70 來(lái)個(gè))。
Midjourney 和 StableDiffusion
這里有小伙伴會(huì)說(shuō)了,國(guó)外的MJ和 SD 不是很強(qiáng)大嗎,為啥不用呢。其實(shí)我在寫(xiě)文章最開(kāi)始的時(shí)候也是考慮了這倆軟件,畢竟之前用來(lái)做過(guò)一些比較特殊的內(nèi)容。但不知道為啥今天一直登錄不上去,折騰了一下沒(méi)辦法操作,也就放棄了。
二、AI的理解與未來(lái)
隨著 AI 技術(shù)的不斷發(fā)展,未來(lái)我們有望看到更強(qiáng)大的通用人工智能出現(xiàn)。這將使 AI 能夠在更多領(lǐng)域發(fā)揮作用,如科學(xué)研究、藝術(shù)創(chuàng)作等。量子計(jì)算技術(shù)的發(fā)展也可能為 AI 帶來(lái)巨大的計(jì)算能力提升,加速模型的訓(xùn)練和優(yōu)化。如果說(shuō)計(jì)算機(jī)還是一個(gè)機(jī)械化的工具,那么 AI 就是自動(dòng)化的升級(jí)應(yīng)用。計(jì)算機(jī)畢竟需要人去設(shè)定指令,需要人去下達(dá)指令;而 AI 則是具有一定的思考性,能夠擬人定義,能夠做出自一定的自我決策。
AI 作為一項(xiàng)具有深遠(yuǎn)影響力的技術(shù),已經(jīng)在眾多領(lǐng)域展現(xiàn)出巨大的應(yīng)用潛力和價(jià)值。通過(guò)深入理解 AI 的技術(shù)原理和應(yīng)用場(chǎng)景,我們能夠更好地把握這一技術(shù)帶來(lái)的機(jī)遇,推動(dòng)各行業(yè)的創(chuàng)新發(fā)展。然而,AI 的廣泛應(yīng)用也面臨著諸多挑戰(zhàn),需要政府、企業(yè)、科研機(jī)構(gòu)和社會(huì)各界共同努力,加強(qiáng)技術(shù)研發(fā)、完善法律法規(guī)、培養(yǎng)專(zhuān)業(yè)人才,以確保 AI 技術(shù)的健康、可持續(xù)發(fā)展。
展望未來(lái),AI 將繼續(xù)深入滲透到各個(gè)領(lǐng)域,與其他新興技術(shù)如物聯(lián)網(wǎng)、區(qū)塊鏈、量子計(jì)算等融合發(fā)展,創(chuàng)造更多的創(chuàng)新應(yīng)用和商業(yè)模式。我們有理由相信,AI 將為人類(lèi)社會(huì)帶來(lái)更加美好的未來(lái)。
最后放上三張來(lái)自大設(shè)AI特效字工具生成的福字,祝福大家新年快樂(lè)~
借鑒文章:1天100張福字海報(bào),真的有人接嗎……
圖片生成:Kimi、文心一言、豆包、大社
內(nèi)容生成:豆包(50%),手打(50%)。
專(zhuān)欄作家
老虎~色,公眾號(hào):產(chǎn)品經(jīng)理有話(huà)說(shuō),人人都是產(chǎn)品經(jīng)理專(zhuān)欄作家。13年產(chǎn)品經(jīng)理經(jīng)歷,涉及商業(yè)設(shè)計(jì)、業(yè)務(wù)轉(zhuǎn)型、產(chǎn)品架構(gòu)定義、個(gè)成成長(zhǎng)等方面。自學(xué)AIGC落地應(yīng)用,目前在鴻蒙場(chǎng)景做產(chǎn)品服務(wù)工作。
本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來(lái)自 Unsplash,基于CC0協(xié)議
該文觀(guān)點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。
- 目前還沒(méi)評(píng)論,等你發(fā)揮!