Sora熱度背后,真正值得學(xué)習(xí)的是什么?

0 評論 3171 瀏覽 9 收藏 9 分鐘

在Sora發(fā)布的事件背后,值得我們真正去學(xué)習(xí)的東西,究竟是什么?這篇文章里,作者嘗試從另一個視角出發(fā),探討三點(diǎn)普通人在AI爆發(fā)大趨勢下所應(yīng)該學(xué)習(xí)的能力,一起來看看本文分享。

Sora發(fā)布有半個多月了,行業(yè)內(nèi)的討論熱度似乎有增無減。我自己也不間斷地在寫文章:如果你是Sora的產(chǎn)品經(jīng)理,你會如何設(shè)計(jì)這款產(chǎn)品?,做直播分享,還頻繁分享關(guān)于Sora的各種資料、文檔。

但隨著對這款“產(chǎn)品”(現(xiàn)在應(yīng)該還不算是產(chǎn)品)的思考越深,對它背后的原理了解的越透,越在思考一個反常識——Sora真值得我們普通人花大量時(shí)間“學(xué)習(xí)”么?

當(dāng)下圍繞著Sora的所謂“學(xué)習(xí)資料”,主要集中在幾個維度:

第一是技術(shù)層面,探討背后的實(shí)現(xiàn)原理。但無論技術(shù)屆大神、學(xué)術(shù)領(lǐng)域博士、還是科技圈自媒體,聊來聊去基本都圍繞著:“Diffusion Transformer +時(shí)空自編碼器 + SpaceTime patches + Scaling Law”這幾點(diǎn)展開。說淺了遭內(nèi)行鄙視,說深了又沒人看。關(guān)鍵是了解了這些原理,然后呢?

第二是哲學(xué)層面,探討世界模型是否已實(shí)現(xiàn)、現(xiàn)實(shí)世界是否會顛覆、我們離AGI時(shí)代是否又更近了一步?但這種開放式話題討論是沒邊的,幾方各執(zhí)一詞相互辯論,吃瓜群眾圍觀看熱鬧,又然后呢?

第三是蹭流量層面,教你怎么用Sora搞錢,哪里找Sora視頻,怎么借關(guān)鍵詞引流,怎么寫Sora提示詞,怎么申請Sora內(nèi)測資格。還有就是借Sora話題制造焦慮賣課、搞社群。但看了一圈,除了本來就會搞錢的“操盤手”,也沒聽過誰真正通過學(xué)Sora受益。

這篇文章討論的,并不是這些現(xiàn)象的對錯,我自己也在搞AI,同樣也蹭到了這個話題的熱度。但除此之外,我更想聊聊Sora熱點(diǎn)之外的視角,即:

以終為始地看,AI爆發(fā)的大趨勢下,普通人真正該學(xué)的是什么?

我覺得有三點(diǎn):講故事的能力、結(jié)構(gòu)化思考力和內(nèi)容專業(yè)力。

1. 講故事的能力

以文生視頻為例,先不說Sora,很多人連Pika、Runway都用不利索。

用文字描述一件事、一個觀點(diǎn)、一個訴求并不難,但描述一段畫面、一個場景、一則完整故事,對絕大多數(shù)人是極高的門檻。

很多人會擔(dān)心未來影視行業(yè)會被顛覆,任何人用Sora都能生成一部大片,于我是不信的。

做過多年內(nèi)容產(chǎn)品經(jīng)理的我,深信創(chuàng)作一部好作品,是要在寫作、繪畫、表達(dá)上進(jìn)行反復(fù)學(xué)習(xí)和大量訓(xùn)練的,想用好AI,先把《英雄之旅》、《救貓咪》熟讀于心,拉幾十部經(jīng)典片子才算入門。

Sora不會讓影視行業(yè)失業(yè),正相反,如果視頻生成的AI技術(shù)持續(xù)普及,會讓真正會寫故事的人發(fā)揮才能,而不是受限于影視行業(yè)的潛規(guī)則而灰心放棄。

2. 結(jié)構(gòu)化思考力

很多寫Sora的文章,都在講它在模型算法、算力涌現(xiàn)、物理模擬上的創(chuàng)新。對我而言,會更驚訝它在訓(xùn)練視頻數(shù)據(jù)時(shí),以一種結(jié)構(gòu)化提示詞方法,解決了視頻標(biāo)注問題:

“We first train a highly descriptive captioner model and then use it to produce text captions for all videos in our training set”

本質(zhì)上看,無論是B端訓(xùn)練數(shù)據(jù),還是C端和大模型對話,都用到了結(jié)構(gòu)化表達(dá)能力。包括那些所謂“Sora培訓(xùn)”,其實(shí)教你的也是怎么寫好提示詞。舉個例子,對這樣的場景:

該怎么描述呢?一個在沉思的老爺爺?一個戴眼鏡的老爺爺?一個在咖啡廳發(fā)呆的老爺爺?可能大部分人想到這兒就結(jié)束了。但更加結(jié)構(gòu)化的描述可以是:

  • 主體人物::一位 60 多歲留著胡須的白發(fā)老人
  • 鏡頭景別:臉部特寫
  • 背景環(huán)境:巴黎的一家咖啡館
  • 人物狀態(tài):注視著窗外行走的人們,一動不動陷入沉思,后又抿嘴微微一笑
  • 人物細(xì)節(jié):穿著一件羊毛大衣和一件紐扣襯衫、頭戴棕色貝雷帽,戴著眼鏡,像是個教授
  • 環(huán)境細(xì)節(jié):金色的燈光和背景中的巴黎街道和城市
  • 鏡頭技術(shù):景深、35 毫米電影膠片,有電影感

具備寫出上述提示詞的能力,才能真正發(fā)揮多模態(tài)技術(shù)的價(jià)值。這背后蘊(yùn)含著的,就是結(jié)構(gòu)化總結(jié)和思考能力。

有句話很形象,寫提示詞就像客戶講brief,能把需求說清楚,就離正確答案不遠(yuǎn)了。

3. 內(nèi)容專業(yè)力

這點(diǎn)又說回到創(chuàng)作者本身,我比較喜歡楊遠(yuǎn)騁老師(「躺島」和「新世相」聯(lián)合創(chuàng)始人)的一個觀點(diǎn):

最大的影響會是出現(xiàn)新的創(chuàng)作者,會出現(xiàn)完全不在人們視野里的新的內(nèi)容偶像,他們有非常好的品位、思維方式和世界觀,但受限于表達(dá)技術(shù),在過去卻連基本的視頻制作能力都不具備。

Koji,公眾號:十字路口CrossingSora 喧囂過后,理性浮現(xiàn) | 我問出了這 5 位頂級創(chuàng)作者的真實(shí)想法

是的,除了上文提到的講故事能力。如果你具備對“好內(nèi)容”的理解力,懂得怎樣更合理地設(shè)計(jì)腳本、做分鏡、上特效、畫故事板、運(yùn)鏡、調(diào)度、選角、布景、調(diào)光、配音、后期等等,AI就是你發(fā)揮想象力最好的幫手。能用好 AI 的人,一定能做出更好作品、獲得更多收入。

因此我堅(jiān)定地認(rèn)為,這波AI趨勢,對高潛力的作家、畫手、設(shè)計(jì)師、編劇等創(chuàng)作者,是絕對的利好。如果你也想從中獲益,先把“創(chuàng)作一部好內(nèi)容”作為目標(biāo)學(xué)起來吧。

總的來講,我認(rèn)為圍著Sora去追新聞沒啥必要。能跳出對Sora本身鋪天蓋地的宣傳,去思考這背后該真正掌握的技能是什么。用結(jié)構(gòu)化思維去訓(xùn)練講故事的能力,成為一名優(yōu)秀創(chuàng)作者,才是值得為此付出時(shí)間的。

專欄作家

申悅,微信公眾號:互聯(lián)網(wǎng)悅讀筆記(ID:pmboxs),人人都是產(chǎn)品經(jīng)理專欄作家,前360產(chǎn)品總監(jiān),起點(diǎn)學(xué)院優(yōu)秀導(dǎo)師。

本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于CC0協(xié)議。

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!