一句話生成一分鐘視頻?元宇宙的救星果然是AI
今天凌晨Sora模型發(fā)布后,不光是AI圈子炸了,在元宇宙相關(guān)的圈子里也引起了大范圍的討論。AI,這次真的一夜之間成為了元宇宙世界的救星。
作為一個在公眾視野中起起落落的概念,元宇宙所承載的對未來虛擬世界無限的想象總讓人感覺若即若離:
構(gòu)建一個生動、豐富且充滿互動的虛擬環(huán)境是元宇宙概念誕生起就面臨的挑戰(zhàn),成本、技術(shù)、創(chuàng)意等諸多因素都在限制著元宇宙的發(fā)展。
雖然最近一年多以來AI技術(shù)突飛猛進(jìn),但在協(xié)助元宇宙虛擬世界的構(gòu)建上,一直沒有太大突破。
但OpenAI最新發(fā)布的視頻生成模型Sora展現(xiàn)出了前所未有的潛力,不論是構(gòu)建虛擬視頻還是虛擬空間,Sora都有了巨大飛躍。
AI,這次真的一夜之間成為了元宇宙世界的救星。
一、能視頻生成,就構(gòu)建元宇宙場景?
對于這樣一個顛覆性創(chuàng)新,先不做過多贅述,直接看療效:
這段視頻的提示詞為:“幾只巨大的猛犸象踏著白雪皚皚的草地走來,它們長長的毛毛在風(fēng)中輕輕飄動,遠(yuǎn)處覆蓋著白雪的樹木和引人注目的雪山,午后的陽光灑滿了縷縷云彩,遠(yuǎn)處的太陽發(fā)出溫暖的光芒,低相機視角令人驚嘆地捕捉到了大型毛茸茸的哺乳動物,并具有美麗的攝影和景深?!?/p>
這段視頻的提示詞為:“美麗的雪城東京很繁華。鏡頭穿過熙熙攘攘的城市街道,跟隨幾個人享受美麗的雪天并在附近的攤位購物。美麗的櫻花花瓣隨著雪花在風(fēng)中飛舞?!?/p>
這段視頻的提示詞為:“動畫場景的特寫是一個毛茸茸的小怪物跪在一根融化的紅色蠟燭旁邊。藝術(shù)風(fēng)格是 3D 和現(xiàn)實的,重點是燈光和紋理。這幅畫的氣氛是一種驚奇和好奇,怪物睜大眼睛、張開嘴巴凝視著火焰。它的姿勢和表情傳達(dá)出一種天真和俏皮的感覺,就好像它第一次探索周圍的世界一樣。暖色調(diào)和戲劇性燈光的使用進(jìn)一步增強了圖像的舒適氛圍?!?/p>
幾條視頻展示出的AI視頻能力已經(jīng)很明顯:
Sora能夠基于文本描述準(zhǔn)確生成高度逼真的場景,同時融入豐富的想象元素,打破了以往AI視頻內(nèi)容創(chuàng)造的限制。
首先是長時間、一鏡到底的視頻生成。與當(dāng)前市面上的其他AI視頻生成工具相比,Sora能夠生成長達(dá)一分鐘的視頻,且在整個視頻過程中保持高度的一致性和連貫性,克服了此前同類工具的最大缺陷。
同時Sora還能實現(xiàn)復(fù)雜場景和角色的準(zhǔn)確描繪。在創(chuàng)造包含多個角色復(fù)雜場景的同時,Sora能夠較為精確地描繪出動作類型、對象和背景的詳細(xì)信息,甚至一定程度上實現(xiàn)角色的情感表達(dá)。
去年,這些問題還是AI視頻內(nèi)容生成領(lǐng)域面臨的最大挑戰(zhàn)。然而,今年開年不到兩個月的時間,Sora就已經(jīng)證明了自己克服這些挑戰(zhàn)的能力。
此外,Sora還有許多令人頗感意外的亮點:
首先是其展示出了對電影拍攝語法的自發(fā)理解,能夠在不同鏡頭之間自然過渡,推進(jìn)故事的發(fā)展;同時,其對于動物毛發(fā)等細(xì)節(jié)的逼真表現(xiàn),也顯示出其在視頻生成技術(shù)上的細(xì)致入微。
既然Sora可以生成這么多風(fēng)格不同的連貫視頻,那么更進(jìn)一步的虛擬空間、虛擬世界構(gòu)建自然也存在可能。
事實也確實如此,而且AI生成虛擬世界這一天的到來,或許會比想象中更快——正如去年的許多人也不曾預(yù)想到AI視頻內(nèi)容生成的發(fā)展會如此迅速一樣。
二、元宇宙場景搭建 不再遙遠(yuǎn)
就在發(fā)布Sora的同一時間,OpenAI發(fā)表了一篇名為《Video generation models as world simulators》(視頻生成模型作為世界模擬器)的論文。
論文揭秘了有關(guān)Sora的更多關(guān)鍵信息,例如 Sora 可以生成任意分辨率和長寬比的視頻(高達(dá) 1080p)。此外Sora 還能夠執(zhí)行一系列圖像和視頻編輯任務(wù),從創(chuàng)建循環(huán)視頻到及時向前或向后延伸視頻,再到更改現(xiàn)有視頻中的背景。
其中Sora的“模擬數(shù)字世界”能力對于元宇宙的發(fā)展將起到關(guān)鍵性作用。
目前,Sora已經(jīng)能夠在像《我的世界》這樣的游戲中渲染世界及其動態(tài),并控制玩家角色,在此類虛擬空間構(gòu)建平臺中,Sora幾乎像一個數(shù)據(jù)驅(qū)動的物理引擎,而非僅僅是一個創(chuàng)意生成工具。
這表明,通過Sora驅(qū)動虛擬空間的全自動搭建已經(jīng)在逐步成為現(xiàn)實。
從目前的情況來看,Sora對元宇宙的顛覆性影響主要體現(xiàn)在兩個方面:首先,它能夠直接根據(jù)需求生成虛擬視頻,迅速構(gòu)建元宇宙所需的場景;其次,它展現(xiàn)出生成可供深入探索的虛擬空間的潛力。另一方面,其有望直接生成可以深入探索的虛擬空間。
這意味著不論從技術(shù)層面、社會層面還是文化層面,元宇宙都將進(jìn)入全新的發(fā)展階段。
在技術(shù)層面,對于元宇宙的建設(shè)者來說,快速搭建豐富多樣的虛擬場景變得前所未有地容易。傳統(tǒng)上,創(chuàng)建逼真的虛擬環(huán)境需要大量的時間、人力和資源投入,而Sora的技術(shù)可以大大簡化這一過程,使得元宇宙的擴展和多樣化成為可能。
這不僅能夠加速元宇宙的構(gòu)建進(jìn)程,還能夠降低進(jìn)入門檻,讓更多的創(chuàng)作者和開發(fā)者有機會參與到元宇宙的構(gòu)建中來。
同時,在未來此類技術(shù)將不僅能夠生成靜態(tài)的虛擬場景,還有望直接生成可深入探索的動態(tài)虛擬空間。這些空間不僅僅是視覺上的呈現(xiàn),而是可以與之互動、探索和體驗的完整虛擬世界。
元宇宙中的空間將不再是簡單的背景或設(shè)置,而是充滿了物理規(guī)則、動態(tài)事件和互動元素的生動世界。這將極大地豐富用戶在元宇宙中的體驗,使其不僅僅是觀察者,而是能夠?qū)嶋H參與和影響虛擬世界的發(fā)展。
社會層面,AI技術(shù)的進(jìn)步將使元宇宙能夠提供高度個性化的體驗,根據(jù)每個用戶的偏好、歷史行為和社交互動來定制內(nèi)容和互動。這種個性化不僅限于內(nèi)容推薦,也擴展到元宇宙中的角色、環(huán)境和故事情節(jié)的定制。
同時這樣的變化還會催生出新的社交互動形式,如AI驅(qū)動的虛擬角色與人類用戶之間的互動,或者通過如在線演唱會、教育課程、社交聚會等虛擬活動連接全球用戶。
文化層面,就像自媒體、短視頻時代對傳統(tǒng)傳媒形成沖擊一樣,虛擬內(nèi)容創(chuàng)作門檻的降低,無疑會進(jìn)一步?jīng)_擊傳統(tǒng)影視業(yè)的發(fā)展,同時,更多個體和文化背景的人們能夠創(chuàng)作和分享自己的故事,促進(jìn)全球文化的多樣性和交流。
此外,元宇宙社群的真正興起也會帶動全新的虛擬文化興起,這種文化將完全從元宇宙中誕生、發(fā)展和傳播,形成獨特的文化標(biāo)識和社區(qū)歸屬感。
三、未來已來 但挑戰(zhàn)依然
當(dāng)然,在關(guān)于未來的暢想越來越具體的同時,對于AI構(gòu)建元宇宙時要面臨的種種問題與挑戰(zhàn),也到了亟待解決的時刻。
首先是技術(shù)準(zhǔn)確性的問題,Sora在渲染復(fù)雜場景和細(xì)節(jié)(如食物的咬痕或玻璃破碎的細(xì)節(jié))時依然存在局限。這種局限性不僅影響生成內(nèi)容的真實性,也可能限制其在某些應(yīng)用場景(如法醫(yī)分析或科學(xué)研究)中的有效性。
此外模擬現(xiàn)實世界中的物理規(guī)則對于AI來說仍然是一個挑戰(zhàn),這反映了當(dāng)前AI技術(shù)在理解和模擬復(fù)雜自然現(xiàn)象方面的限制。
而除了技術(shù)上的問題外,個人形象濫用對肖像權(quán)、隱私權(quán)的侵犯;現(xiàn)實與虛構(gòu)界限的模糊,逐步侵蝕公眾對信息真實性的信任;傳統(tǒng)的安全防護(hù)和欺詐檢測方難以應(yīng)對更加精細(xì)和逼真的虛假內(nèi)容,從而導(dǎo)致詐騙等案件更加頻發(fā)等,都要求政府、教育機構(gòu)和技術(shù)公司共同努力,提高公眾對這類技術(shù)的理解和鑒別能力。
這些問題雖然已經(jīng)是老生常談,但面對技術(shù)的突飛猛進(jìn),如何更好地用規(guī)則來規(guī)范技術(shù)的發(fā)展,已經(jīng)變得迫在眉睫。
該如何面對這些進(jìn)步對社會、文化和倫理帶來的深刻影響?如何吸取上一輪元宇宙發(fā)展的失敗教訓(xùn),借助AI真正營造一個開放、包容且充滿多樣性的虛擬世界?
這都需要元宇宙的各個相關(guān)主體負(fù)責(zé)任地探索與創(chuàng)新,以確保共同打造出一個既豐富又充滿互動,同時安全的元宇宙,賦予其更深層的意義。
AI,這次確實成為了元宇宙的救星,但元宇宙發(fā)展中要解決的問題,卻并沒有減少。
作者:高樂
本文由 @元宇宙新聲 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自 Unsplash,基于 CC0 協(xié)議。
該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。
- 目前還沒評論,等你發(fā)揮!