ComfyUI,AIGC工作流的啟示
今年,ChatGPT的火熱和Midjourney、Stable Diffusion等產(chǎn)品的火熱,讓AIGC這個概念影響了大多數(shù)人。大家在擔(dān)憂AI工具將自己替代的同時,也在考慮如何將AIGC產(chǎn)品融入到我們的工作流程中;而ComfyUI,就是這么一款工具。
在我過去的文章里有說過,產(chǎn)品經(jīng)理是“幫助團(tuán)隊交付正確產(chǎn)品給用戶的人”。從客戶需求挖掘到最后產(chǎn)品使用體驗,產(chǎn)品經(jīng)理要確保產(chǎn)品價值能夠端到端地傳遞給用戶,產(chǎn)品經(jīng)理需打破團(tuán)隊成員的分工壁壘,這考驗著產(chǎn)品經(jīng)理綜合能力和素質(zhì),這也是產(chǎn)品經(jīng)理的領(lǐng)導(dǎo)力的體現(xiàn)。
如今,隨著ChatGPT、Midjourney、StableDiffusion等生成模型帶動起來的熱潮,AI大模型正逐漸滲透到各種產(chǎn)品和服務(wù)中,越來越多的產(chǎn)品經(jīng)理也在考慮將AIGC(AI生成內(nèi)容)能力融入到自己的產(chǎn)品中,然而這并非易事,在項目實踐的過程中產(chǎn)品經(jīng)理面臨著諸多的挑戰(zhàn)和困惑……
一、AIGC的產(chǎn)品管理挑戰(zhàn)
在傳統(tǒng)的互聯(lián)網(wǎng)產(chǎn)品的開發(fā)流程中,產(chǎn)品原型圖是不可或缺的工具。產(chǎn)品經(jīng)理或交互設(shè)計師通常會使用Axure、Sketch或Figma等工具,投入主要的時間繪制線框圖,并通過頁面流程圖來闡釋產(chǎn)品的交互邏輯。通過這種方法,團(tuán)隊成員能直觀地理解產(chǎn)品的最終呈現(xiàn)效果,方便地討論問題并形成共識,從而保證最終交付的產(chǎn)品體驗與預(yù)期保持一致。這是過去十幾年來,互聯(lián)網(wǎng)和軟件行業(yè)一直奉行的最佳實踐。
然而在AIGC產(chǎn)品中,用戶更關(guān)心的是AIGC的數(shù)據(jù)體驗,而不是界面的交互體驗,傳統(tǒng)的體驗設(shè)計范式已經(jīng)不再適用。例如,著名圖片生成工具M(jìn)idjourney以對話機器人的形式呈現(xiàn),用戶只要在Discord中和它對話就能獲得高質(zhì)量的圖片,因為Midjourney很清楚地知道:用戶更關(guān)心的是我們能不能根據(jù)提示詞生成優(yōu)質(zhì)的圖片,而不是別的什么東西。
題外話:“知道自己應(yīng)該做什么,并把它做到極致”——正因如此才讓這只有十幾人的小團(tuán)隊能完成1億美元的年營收。這是我們每一個創(chuàng)業(yè)者和產(chǎn)品經(jīng)理都需要學(xué)習(xí)的能力。
因為AIGC產(chǎn)品體驗的重心已從界面轉(zhuǎn)向了數(shù)據(jù)。由于許多產(chǎn)品經(jīng)理對數(shù)據(jù)和AI算法了解不足,讓他們在技術(shù)溝通上遇到了極大的挫敗感,而且傳統(tǒng)的原型設(shè)計工具在應(yīng)對AI產(chǎn)品時也顯得力不從心,無法保證最終的交付效果和預(yù)期的一致性。對于一些想應(yīng)用AIGC能力的產(chǎn)品經(jīng)理而言,不僅AI模型是個不可解釋的黑盒,連AI產(chǎn)品的研發(fā)過程也變成了一個不可知的黑盒。
正所謂“拿著舊地圖無法抵達(dá)新大陸”,在新時代,我們應(yīng)該放棄舊的思維方式擁抱新的工具和新方法。
二、AIGC工作流(Workflow)
ComfyUI,作為一款廣受歡迎的圖片生成的開源項目,為AIGC內(nèi)容創(chuàng)作者提供了強大的助力。ComfyUI進(jìn)一步拓寬了Stable Diffusion的創(chuàng)作可能性。ComfyUI通過節(jié)點流程的界面設(shè)計,讓用戶可以輕松拖拽、連接不同的模型、模塊和參數(shù),形成高度定制和可復(fù)用的Workflow(AIGC工作流),而用戶無需編寫任何代碼。它可以幫助我們實現(xiàn)更加豐富和定制化的數(shù)據(jù)體驗。
另外,ComfyUI還有以下優(yōu)勢:
- 易于共享與協(xié)作:支持工作流的導(dǎo)出和分享,不僅加速了項目開發(fā),也為團(tuán)隊間的學(xué)習(xí)和交流創(chuàng)造了條件。
- 良好的性能優(yōu)化:其內(nèi)存管理和按需加載機制確保在資源受限的環(huán)境下,仍能加載大模型生成高質(zhì)量圖像。
- 可擴展性:用戶可以輕松添加自定義節(jié)點、插件和模型,社區(qū)已貢獻(xiàn)了200多個自定義節(jié)點,為工作流的設(shè)計和優(yōu)化提供了豐富的選擇。
ComfyUI本質(zhì)上是AIGC的Pipeline(數(shù)據(jù)處理管道)的可視化構(gòu)建工具,它將Stable Diffusion的運行機制顯性化的展示在我們面前。在圖形生成的過程中,ComfyUI能夠?qū)崟r為我們呈現(xiàn)數(shù)據(jù)處理的過程。讓我們在設(shè)計和調(diào)試的時候,可以快速定位和解決問題。
ComfyUI不僅僅是讓AIGC創(chuàng)作者可以更自由地創(chuàng)作,它的流程邏輯的可視化、可復(fù)用以及數(shù)據(jù)的實時可驗證,不就等同于產(chǎn)品原型構(gòu)建工具么?
在產(chǎn)品融圖、營銷海報和視頻素材等應(yīng)用場景中,AIGC正在發(fā)揮極大的價值。目前,一些前沿的團(tuán)隊已經(jīng)在使用ComfyUI改進(jìn)他們的工作方式,產(chǎn)品經(jīng)理將ComfyUI作為產(chǎn)品原型設(shè)計工具,深度參與到模型訓(xùn)練和AIGC工作流的構(gòu)建中,然后再交由開發(fā)人員和算法工程師進(jìn)一步優(yōu)化,最后轉(zhuǎn)化成可穩(wěn)定運行的Pipeline部署到正式環(huán)境中。
通過ComfyUI的可視化節(jié)點式工作流,產(chǎn)品經(jīng)理和開發(fā)團(tuán)隊的溝通與協(xié)作得到了促進(jìn),使項目團(tuán)隊能在早期快速搭建和驗證項目原型,縮短開發(fā)周期,降低試錯成本,確保產(chǎn)品需求和體驗?zāi)繕?biāo)的一致性,從而更好地實現(xiàn)端到端的產(chǎn)品體驗?zāi)繕?biāo)。
三、UE藍(lán)圖系統(tǒng)的啟示
拖拽式的節(jié)點編程并不是ComfyUI的獨創(chuàng),例如,Blender、Maya和Unreal Engine(虛幻引擎)也提供了類似的功能。
虛幻引擎的藍(lán)圖系統(tǒng)通過提供豐富的節(jié)點庫和強大的可視化編程環(huán)境,使用戶能夠在無需編寫代碼的情況下構(gòu)建復(fù)雜的游戲邏輯。
藍(lán)圖系統(tǒng)的高度可定制性和擴展性,允許用戶創(chuàng)建自定義節(jié)點,甚至可以與傳統(tǒng)的編程代碼無縫集成,直接打包成跨平臺的游戲,不僅為游戲開發(fā)提供了強大而靈活的解決方案,也縮短了從概念到可交付產(chǎn)品的時間周期。這種方式使游戲設(shè)計師、藝術(shù)家和小型工作室能快速地制作出可運行的游戲產(chǎn)品,極大地豐富了游戲創(chuàng)意的表達(dá)。
得益于虛幻引擎的強大表現(xiàn)力和無需編程的創(chuàng)作方式,使得其他行業(yè)的專家也可以使用虛幻引擎來實現(xiàn)想法。這也讓其成為一款貫通各行各業(yè)的三維擬真創(chuàng)作工具,從游戲行業(yè)跨足至建筑設(shè)計、工業(yè)設(shè)計、城市規(guī)劃和廠房規(guī)劃等眾多領(lǐng)域。
可視化的節(jié)點編程和模塊化設(shè)計極大地降低了編程門檻,促進(jìn)了不同背景的團(tuán)隊間的協(xié)作和交流,吸引了來自更多不同領(lǐng)域的創(chuàng)作者共同豐富產(chǎn)品應(yīng)用場景和生態(tài)。
這也為ComfyUI提供了啟示:強大的可視化和模塊化能力不僅降低了產(chǎn)品開發(fā)和發(fā)布的門檻,還拓寬了創(chuàng)意和協(xié)作的空間,使得想法可以快速轉(zhuǎn)化為實際可交付的產(chǎn)品成為可能,從而更好地滿足不同用戶和市場的需求。這就是“引擎”的魅力。
四、展望未來
目前,得益于ComfyUI的自定義節(jié)點的可擴展性,已有開發(fā)者創(chuàng)建了ChatGPT節(jié)點,為圖像生成工作流賦予了大語言模型的思考能力,能快速生成提示詞,可以方便快速創(chuàng)作大量的內(nèi)容。如下圖所示:
展望未來,隨著ComfyUI自定義節(jié)點的豐富化,它將不僅局限于Stable Diffusion的圖像生成能力,而會整合更多領(lǐng)域的AI模型,逐漸成為一個多模態(tài)的AIGC產(chǎn)品構(gòu)建工具。未來也可能會出現(xiàn)類似虛幻引擎的多模態(tài)AI引擎平臺,能直接將AIGC工作流打包成高可用和可交付的產(chǎn)品。
另外,由于企業(yè)級項目對硬件資源有較高要求,ComfyUI主要部署在團(tuán)隊的云端服務(wù)器上,這也將催生團(tuán)隊在線協(xié)同的需求,為創(chuàng)業(yè)者提供新的機會。我相信未來的ComfyUI在線版本可能會借鑒Figma的在線協(xié)同功能,讓團(tuán)隊成員能共同參與AIGC工作流的搭建,為AIGC產(chǎn)品開發(fā)帶來前所未有的在線協(xié)作體驗。
結(jié)語
十年前,許多產(chǎn)品經(jīng)理通過學(xué)習(xí)《網(wǎng)站藍(lán)圖:Axure RP高保真網(wǎng)頁原型制作》這本書,步入了互聯(lián)網(wǎng)產(chǎn)品領(lǐng)域。然而,在AIGC產(chǎn)品領(lǐng)域,Axure已無法滿足現(xiàn)今的需求。
正如“拿著舊地圖無法抵達(dá)新大陸”一樣,當(dāng)我們拿著舊“藍(lán)圖”時也難以創(chuàng)造新產(chǎn)品?,F(xiàn)在,AIGC工作流已成為我們需要學(xué)習(xí)和掌握的新“藍(lán)圖”的能力。
通過學(xué)習(xí)和應(yīng)用ComfyUI,產(chǎn)品經(jīng)理和創(chuàng)業(yè)者能更深入地理解AI原理和工作方式,獲得更為順暢技術(shù)溝通能力。同時,通過快速構(gòu)建和驗證AI模型,我們可以確保產(chǎn)品需求與體驗的一致性,大幅縮短產(chǎn)品開發(fā)周期。
掌握ComfyUI的AIGC工作流,產(chǎn)品經(jīng)理和創(chuàng)業(yè)者不僅能自信應(yīng)對AI產(chǎn)品開發(fā)的挑戰(zhàn),還能探索和實現(xiàn)創(chuàng)新的產(chǎn)品設(shè)計,樹立在AIGC領(lǐng)域的領(lǐng)導(dǎo)力。
AIGC掀起的熱潮也僅僅只有半年多的時間,技術(shù)正飛速發(fā)展和迭代,新事物層出不窮,在這個行業(yè)沒有多年經(jīng)驗的老師傅。不管你是創(chuàng)業(yè)者還是產(chǎn)品經(jīng)理,如果想轉(zhuǎn)行到AIGC領(lǐng)域,現(xiàn)在是學(xué)習(xí)的最佳時機,只要學(xué)習(xí)的速度夠快,你就可能成為該領(lǐng)域的專家。通過掌握ComfyUI,你能為未來的職業(yè)發(fā)展和團(tuán)隊協(xié)作打下堅實的基礎(chǔ),更好地適應(yīng)這個行業(yè)的發(fā)展和需求。
專欄作家
PM熊叔,微信公眾號:PM熊叔,人人都是產(chǎn)品經(jīng)理專欄作家。教育類產(chǎn)品產(chǎn)品經(jīng)理出身,學(xué)過設(shè)計,做過開發(fā),做過運營的產(chǎn)品經(jīng)理。
本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自Unsplash,基于 CC0 協(xié)議
該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。
寫得太好了!干貨滿滿的同時也很有啟發(fā)性!