AI 視頻界的 GPT-3 時(shí)刻已來(lái) 面對(duì)Sora,張一鳴面臨新挑戰(zhàn)?

0 評(píng)論 483 瀏覽 0 收藏 15 分鐘

最近Sora的消息真的太多了,威爾·史密斯直接上場(chǎng)整活,興奮的同行直接拉升了相關(guān)的股價(jià)。但在另一些人眼里,就沒(méi)那么好過(guò)了:字節(jié)調(diào)整了人員安排,AI創(chuàng)業(yè)公司直接都哀鴻遍野了。

Sora的出現(xiàn),將剛過(guò)完春節(jié)的我們又拉到了一場(chǎng)新的“科技春晚”中。2 月 16 日,OpenAI 宣布推出首個(gè)文生視頻大模型——Sora,該模型可以“根據(jù)文本指令創(chuàng)建逼真且富有想象力的場(chǎng)景”,并且最長(zhǎng)可達(dá)一分鐘。

這一舉動(dòng)所帶來(lái)的影響絲毫不小于去年GPT-4問(wèn)世后的爆火,不論是同屬AI賽道的國(guó)內(nèi)外公司還是看熱鬧不嫌事大的明星,甚至還有企圖利用信息差賣(mài)課的騙子,都讓Sora的熱度居高不下。而Sora所帶來(lái)的影響還在持續(xù),可謂是有人歡喜有人愁。

一、威爾·史密斯本尊整活Sora

在Sora出現(xiàn)后,不少科技圈名人都發(fā)出了驚嘆,馬斯克甚至直接在社交平臺(tái)上發(fā)布短評(píng)“GG humans”。當(dāng)所有人都在震驚于Sora的強(qiáng)大能力,同時(shí)為人類今后所擔(dān)憂的時(shí)候,有人已經(jīng)看熱鬧不嫌事大的開(kāi)始“火上澆油”了。

大家還記得那個(gè)曾拍攝過(guò)《當(dāng)幸福來(lái)敲門(mén)》和《黑衣人》等眾多好萊塢大片的巨星威爾·史密斯嗎?今天,全體AI社區(qū)都被威爾·史密斯發(fā)出的這段視頻震驚了!

你以為,上面是一年前的AI視頻,下面是如今的Sora生成的AI視頻?但其實(shí)全網(wǎng)都被他騙到了,下方所謂的AI視頻并無(wú)OpenAI水印,同時(shí)還是由其本人官方賬號(hào)發(fā)出的。

所以這就是個(gè)由威爾·史密斯本人出鏡表演的視頻,并非Sora生成的AI視頻,有趣的是他還假裝很震驚,配上“形勢(shì)已經(jīng)失控了!”的文字,似乎在為人類的未來(lái)或是個(gè)人隱私所擔(dān)憂。只能說(shuō)不愧是好萊塢巨星,親自上陣,給大伙整了個(gè)大活,還結(jié)結(jié)實(shí)實(shí)騙過(guò)了不少網(wǎng)友。

這似乎也從側(cè)面體現(xiàn)了Sora的強(qiáng)大早已在短短幾天內(nèi)深入人心,因此一眾網(wǎng)友才會(huì)被威爾·史密斯的整活視頻所欺騙。但其實(shí)出于對(duì)生成真實(shí)人像安全問(wèn)題的顧慮,OpenAI從未回應(yīng)過(guò)這類請(qǐng)求。在已公開(kāi)的Sora視頻里,最接近可比的是“一個(gè)男人吃漢堡”。

可以看到,被咬了一口的漢堡正確出現(xiàn)咬痕,展示了Sora對(duì)人與食物互動(dòng)的理解。這種AI對(duì)于物理世界的深度理解還在各個(gè)方面有所體現(xiàn),也正是因?yàn)檫@點(diǎn)才會(huì)讓人們感到震驚,畢竟此前的Pika等同賽道產(chǎn)品可沒(méi)有如此強(qiáng)大的理解能力。

對(duì)于Sora的問(wèn)世,許多人不同于威爾·史密斯的整活,而是發(fā)現(xiàn)了一些不一樣的“商機(jī)”。

二、Sora的更多“商機(jī)”

很難想象,剛剛問(wèn)世的Sora能和蘋(píng)果Vision Pro進(jìn)行聯(lián)動(dòng)。有 github 網(wǎng)友@AndrewMayne將OpenAI案例視頻轉(zhuǎn)化成了適用 Vision Pro空間視頻。

AndrewMayne 創(chuàng)建了兩個(gè)視頻軌道,一個(gè)用于左眼,一個(gè)用于右眼,并根據(jù)視頻移動(dòng)的方向稍微改變了軌道的時(shí)間。這會(huì)創(chuàng)建模擬立體 3D 效果,并且僅適用于存在橫向運(yùn)動(dòng)的視頻。為了將視頻轉(zhuǎn)換為適用于 Vision Pro 的 Apple Spatial 視頻格式,其使用了 Mike Swansons 的空間視頻轉(zhuǎn)換工具

在蘋(píng)果Vision Pro 上的實(shí)際體驗(yàn)也相當(dāng)不錯(cuò),雙目視差帶來(lái)的立體感,在海浪的沖擊中帶來(lái)更加身臨其境的體驗(yàn)。在不追求非常細(xì)致的視覺(jué)效果下,憑借批量化、高效率的 Sora 生成的 AI 視頻可以有效填補(bǔ)空間視頻的空白市場(chǎng)。

而相比于發(fā)掘Sora和Vision Pro之間聯(lián)系的商機(jī),一些心術(shù)不正之人卻找到了利用Sora熱度的“商機(jī)”。

沒(méi)錯(cuò),這個(gè)所謂的“商機(jī)”就是賣(mài)999的限時(shí)特價(jià)的課程,這都不是普通的“割韭菜”了,這是直接利用信息差進(jìn)行詐騙了。眾所周知,Sora這個(gè)產(chǎn)品在AI視頻領(lǐng)域,說(shuō)是劃時(shí)代的產(chǎn)品也不為過(guò)。但是,它只是個(gè)”期貨”產(chǎn)品,只有官方、以及極少數(shù)的測(cè)試大佬,手握產(chǎn)品權(quán)限,可以試用到。而距離真正能向大眾開(kāi)放,至少還有2~3個(gè)月的時(shí)間。

畢竟,從他們的技術(shù)文檔還有整體的節(jié)奏看,離真正的產(chǎn)品化,包括做好安全對(duì)齊,還有一段不短的路要走。但是,產(chǎn)品都還沒(méi)見(jiàn)到,賣(mài)課的,就聞風(fēng)而動(dòng)了?!癝ora專屬提示詞教程”、“Sora內(nèi)容創(chuàng)作SOP”等等,這些騙子真是不放過(guò)任何一個(gè)賺錢(qián)的“商機(jī)”啊。

相比于個(gè)人對(duì)Sora的震驚或是“利用”,其實(shí)真正受到影響的還是AI同行們,只是這些同行中有人歡喜有人愁。

三、Sora發(fā)布后,同行很興奮

Pika Labs成立于2023年4月,同年11月發(fā)布首個(gè)產(chǎn)品Pika 1.0。Pika1.0能夠生成和編輯3D動(dòng)畫(huà)、動(dòng)漫、卡通和電影,并且普通用戶還可以對(duì)其進(jìn)行加工,被視為一款零門(mén)檻“視頻生成神器”。

在Sora發(fā)布之前,Runway和Pika都被認(rèn)為是視頻生成賽道的佼佼者。Sora發(fā)布之后,很多人認(rèn)為,它憑一己之力已經(jīng)輕松“吊打”且即將“干翻”這兩家新興獨(dú)角獸公司,并對(duì)創(chuàng)業(yè)者的命運(yùn)表示擔(dān)憂。

然而,他們自己對(duì)此卻似乎興奮更多于恐懼。Pika創(chuàng)始人郭文景獨(dú)家回應(yīng)稱,“我們覺(jué)得這是一個(gè)很振奮人心的消息,我們已經(jīng)在籌備直接沖,將直接對(duì)標(biāo)Sora?!惫木斑€透露,目前已經(jīng)在招人了,具體計(jì)劃暫時(shí)還不能對(duì)外透露。

除了Pika外,一些文生視頻的同行也吃到了一波紅利,文生視頻概念股集體漲停。AI相關(guān)投融資也迎來(lái)一波小高峰,國(guó)內(nèi)大模型創(chuàng)企月之暗面?zhèn)鞒鋈谫Y超10億美元,加拿大AI創(chuàng)企Cohere被曝正洽談5-10億美元新融資,Quora、Sakana等AI創(chuàng)企接連拿下數(shù)千萬(wàn)美元融資。

據(jù)不完全統(tǒng)計(jì),2023年11月-2024年1月全球共誕生4家AI獨(dú)角獸,包括美國(guó)AI語(yǔ)音合成公司ElevenLabs、印度AI模型創(chuàng)企Krutrim、法國(guó)開(kāi)源模型創(chuàng)企Mistral AI以及國(guó)內(nèi)大模型創(chuàng)企零一萬(wàn)物。隨著新融資塵埃落定,月之暗面等公司也有望立刻升級(jí)為新晉A1獨(dú)角獸。前天,ElevenLabs也憑借Al配音版Sora視頻出圈,再吸一波熱度。

除了一些國(guó)外同行們吃到了紅利外,其實(shí)更多的情況是眾多AI創(chuàng)企的騎虎難下,Sora的橫空出世,對(duì)張一鳴來(lái)說(shuō),亦喜亦憂。

四、Sora讓剪映何去何從?

面對(duì)來(lái)自Sora的“降維打擊”,AI視頻領(lǐng)域的創(chuàng)業(yè)者中,有的如Runway CEO克里斯托瓦爾·巴倫蘇埃拉一樣,做好了“Game On”的準(zhǔn)備,有的如Pika創(chuàng)始人郭文景一樣,開(kāi)始籌備對(duì)標(biāo)Sora的新產(chǎn)品,也有人如Stability AI CEO埃馬德·莫斯塔克一樣,不由感慨“阿爾特曼真是一個(gè)魔術(shù)師”,并將Sora視為AI視頻界的GPT-3時(shí)刻。

但對(duì)字節(jié)跳動(dòng)來(lái)說(shuō),這似乎是個(gè)喜憂參半的消息,因?yàn)?Sora所處的視頻生成賽道,正是眼下字節(jié)跳動(dòng)旗下剪映所瞄準(zhǔn)的AI創(chuàng)新方向。2月份從抖音轉(zhuǎn)崗剪映后,抖音前CEO張楠即將推出一個(gè)AI生圖和視頻的產(chǎn)品。

近日,據(jù)財(cái)聯(lián)社報(bào)道,在OpenAI發(fā)布Sora之前,字節(jié)跳動(dòng)就曾低調(diào)推出了一款視頻模型產(chǎn)品Boximator的消息并不屬實(shí)。Boximator可以通過(guò)文本控制生成視頻中人物或物體的動(dòng)作,但目前尚不完善且不支持產(chǎn)品落地。

字節(jié)跳動(dòng)相關(guān)人士回應(yīng)稱,Boximator是視頻生成領(lǐng)域控制對(duì)象運(yùn)動(dòng)的技術(shù)方法研究項(xiàng)目,目前還無(wú)法作為完善的產(chǎn)品落地,距離國(guó)外領(lǐng)先的視頻生成模型在畫(huà)面質(zhì)量、保真率、視頻時(shí)長(zhǎng)等方面還有很大差距。

正打算在AI生成視頻領(lǐng)域大干一番的張楠,還沒(méi)等到產(chǎn)品落地的那一刻,其內(nèi)部再創(chuàng)業(yè)的計(jì)劃,便率先遭遇了Sora的當(dāng)頭一擊。不過(guò)若是換一種思路呢?盡管在推出類似文生視頻產(chǎn)品方面落后一步,但對(duì)張楠來(lái)說(shuō),反過(guò)來(lái)也迎來(lái)了一個(gè)摸著Sora過(guò)河的機(jī)會(huì)。只是,留給張一鳴和張楠孵化下一個(gè)AI視頻生成獨(dú)角獸的時(shí)間,越發(fā)緊張了。

Sora打了所有人一個(gè)措手不及,Pika、剪映等部分同行或許還有追趕的機(jī)會(huì),但更多的AI創(chuàng)企則是愈發(fā)的開(kāi)始走下坡路了。

五、大廠入局讓AI創(chuàng)企再次“哀鴻遍野”

正如此前OpenAI推出GPT商店時(shí)引發(fā)AI創(chuàng)企“哀鴻遍野”一樣,此次OpenAI、谷歌、Meta幾乎同一時(shí)間接連發(fā)布重磅模型,再次引發(fā)業(yè)界爭(zhēng)論:AI創(chuàng)企還有出路嗎?

這個(gè)問(wèn)題的答案我們目前還不得而知,但能夠確認(rèn)的是,在一些AI創(chuàng)企砥礪前行的同時(shí),已經(jīng)有一些企業(yè)走上了下坡路。

首當(dāng)其沖的是明星獨(dú)角獸Stability AI,雖然其一直在不斷發(fā)布新模型,但持續(xù)的高管離職、投資者的質(zhì)疑體現(xiàn)了其內(nèi)部管理的混亂。

2023年11月,Stability AI被曝出由于財(cái)務(wù)狀況壓力巨大正在尋求出售。此外,其重要投資者美國(guó)對(duì)沖基金Coatue Management還在10月致信管理層,要求CEO埃馬德·莫斯塔克(Emad Mostaque)辭職。

Stability AI不是唯一被曝考慮出售的AI創(chuàng)企。據(jù)外媒The Information報(bào)道,近幾個(gè)月來(lái),AI搜索創(chuàng)企Perplexity至少與4家公司討論了收購(gòu)事宜,企業(yè)級(jí)AI助手Writer已與3家尋求收購(gòu)的公司接洽。

大比例的裁員也是AI創(chuàng)企泡沫破裂的跡象之一。生成式AI獨(dú)角獸Jasper、AI語(yǔ)音識(shí)別創(chuàng)企Deepgram等首批明星AI創(chuàng)企在近半年紛紛宣布裁員。

下坡路的盡頭是創(chuàng)企的墳?zāi)?。?jù)不完全統(tǒng)計(jì),2023年11月-2024年1月,有4家AI創(chuàng)企宣布關(guān)停。其中有大廠獨(dú)立出來(lái)的團(tuán)隊(duì),有明星產(chǎn)品創(chuàng)始人新成立的公司,也有已經(jīng)走過(guò)十余年的“老牌”企業(yè)。

六、寫(xiě)在最后

Apple Vision Pro 帶來(lái)了空間計(jì)算革命的全新愿景,將人們的現(xiàn)實(shí)體驗(yàn)提升到了一個(gè)全新的層次。通過(guò)結(jié)合 3D 空間場(chǎng)景與混合現(xiàn)實(shí)的內(nèi)容展示形式,它不斷地挑戰(zhàn)和刷新人們對(duì)于視覺(jué)認(rèn)知的界限。

從生成式人工智能文字對(duì)話工具 ChatGPT、圖像生成器 DALL-E,到視頻生成的王炸 Sora,OpenAI 正在重塑互聯(lián)網(wǎng)內(nèi)容生產(chǎn)形式。

2024注定是不平凡的一年,從硬件到軟件的革新,似乎在迎接更加科幻的時(shí)代。在科技飛速發(fā)展的浪潮下,不論是個(gè)人還是企業(yè),或許都將迎來(lái)天翻地覆的變化。

作者:孫浩南

來(lái)源公眾號(hào):元宇宙新聲

本文由 @元宇宙新聲 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來(lái)自 Unsplash,基于 CC0 協(xié)議。

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒(méi)評(píng)論,等你發(fā)揮!