當Vision Pro+AI Sora,將碰撞出什么火花?

0 評論 1117 瀏覽 1 收藏 12 分鐘

Vision Pro 的出現(xiàn),搭建起了虛擬世界和現(xiàn)實世界的橋梁,而 Sora 模型的出現(xiàn),則又為 Vision Pro 的落地可能性添加了更多火花。怎么看待Vision Pro + Sora 的結(jié)合?一起來看看本文的解讀與分享。

今年2月份兩個產(chǎn)品的發(fā)布,在2024新年一開年扔出了王炸,一個是2024年2月2日的 蘋果公司 Vision pro頭顯發(fā)布,另外一個是同年2月16日 Open AI 發(fā)布的Sora 文生視頻的虛擬世界模擬器生成模型,我們來看下兩個王炸產(chǎn)品碰撞在一起,會激發(fā)出什么樣的火花?

一、Vision pro——新時代的空間計算機

蘋果Vision pro剛剛發(fā)布,一躍成為迄今最先進的虛擬現(xiàn)實和增強現(xiàn)實眼鏡,蘋果公司將其稱為“空間計算機”,OpenAI的創(chuàng)始人兼首席執(zhí)行官山姆·奧特曼評價:蘋果Vision pro是自iPhone以后第二驚艷的技術。 實際上手體驗時,當你帶上眼睛后,沉浸式呈現(xiàn)眼前是一個虛擬空間,它以高分辨率屏幕,支持重放事件和人物的三維視頻錄像,看起來就像置身其中,只需要通過簡單的眼神和隔空手勢操作。

1. Vision pro 定位:打通虛擬世界與現(xiàn)實世界的橋梁,呈現(xiàn)虛擬世界的載體

Vision pro出現(xiàn)讓空間計算這個詞得到現(xiàn)實中完美呈現(xiàn),簡單說將我們周圍的現(xiàn)實物理世界和虛擬世界無縫整合,同時讓人類可以實現(xiàn)毫無違和感地操控物體和空間,提供了一種全新的互動體驗。

再夸張一些,在Vision pro搭建世界中,將虛擬和物理世界融為一體了,不論是一輛汽車還是一臺電視,都將成為空間計算設備。

通過Vision pro強大的空間計算能力,可以用戶提供高清晰度、強互動性的沉浸式風景展現(xiàn):置身于月球登陸,探索南極洲冰川。

2. Vision pro現(xiàn)階段瓶頸——沉浸式體驗資源生產(chǎn)匱乏

雖然Vision pro在技術和體驗上實現(xiàn)了重大突破,但仍存在諸多不足,需要進一步完善和優(yōu)化。比如在于虛擬世界的搭建上和3D電影 沉浸式影片照片體驗,現(xiàn)階段都是基于VisionPro頭顯專用流媒體資源(至今為止可以訪問僅150 深度的3D娛樂項目),且需要依賴于強大的虛擬世界搭建引擎和海量可支持3D的視頻模型資源,哪怕是內(nèi)置的3D攝像頭可以拍攝照片或視頻,但也需要用戶自主去捕捉拍攝,才能實現(xiàn)進一步呈現(xiàn)。

而這一切的資源限制,隨著OpenAI Sora近期發(fā)布,讓一切限制有了突破的可能性。

二、Sora 發(fā)布——虛擬新世界的創(chuàng)造引擎

如果說Vision pro 頭顯是開啟新世界大門的鑰匙,那么Sora可以理解為虛擬新世界的創(chuàng)造引擎,所有呈現(xiàn)的內(nèi)容在未來都可以由Sora來制作且呈現(xiàn)在使用者眼前。

眾所周知,視頻是不能P的這個定律,也隨著sora的發(fā)布被打破了。

Sora 不僅僅是一個文生視頻的軟件,而是 作為世界模擬器的視頻生成模型”,“他并不是僅僅對于現(xiàn)實世界的鏡像,而是基于你的描述,構建新的一個符合現(xiàn)實世界物理規(guī)律和運轉(zhuǎn)虛擬世界,第一次AI可以理解這個世界的定義,并且基于這些世界運轉(zhuǎn)規(guī)律再進行二次創(chuàng)造。

1. Vision pro 與sora 結(jié)合——創(chuàng)造一個更加有趣的虛擬世界

Vision pro 頭顯顯示技術呈現(xiàn)的是一個與現(xiàn)實結(jié)合的虛擬空間,背后是基于現(xiàn)有的流媒體素材進行3D化改造,但當虛擬3D流媒體素材視頻不再是拘泥于現(xiàn)有的視頻素材,是可以通過你的描述由Sora 自定義生成新的視頻呢?

過去Vision pro 里搭建的3D媒體資源可以理解為是在一片魚塘里尋找合適的魚來匹配呈現(xiàn),Sora的出現(xiàn)將整個魚塘規(guī)模成幾何倍擴大,可能是一整個海洋,甚至超越整個海洋的容量,通過這樣大的資源庫進行快速生成,不再受限于已有資源的限制,對于Vision pro來講,用戶使用和發(fā)揮的空間被放大到最大化。

大膽想象下,你可以通過自己的口述,讓Sora 虛擬世界技術在Vision pro里搭建自己的新世界。甚至可以將夢中的畫面口述出來,讓sora幫你還原夢中1:1虛擬景象 ,通過Vision pro 呈現(xiàn)出來夢中的景象,在沉浸式技術的加持下,你自己就真實置身于自己搭建的虛幻世界中,參與其中,你還能分清虛擬和現(xiàn)實世界的差異性嗎?

2. Vision pro 與sora結(jié)合不僅在于3D視頻資源供給,而是打破了信息傳遞的介質(zhì)

過去我們希望將腦海中的想法表達出來,需要通過自己將大腦中想法轉(zhuǎn)化為其他人可理解的文字,圖片,形狀,盡可能降低折損傳遞,但無論如何都很難完美的呈現(xiàn)。

但通過Vision pro 與sora結(jié)合,你可以將你的想法通過口述方式傳遞給sora,由sora去生產(chǎn)還原你腦海中的想法,并支持可視化的在線編輯修改,最后由Vision pro 完美無損呈現(xiàn)你的可視化想法,完全不需要進行更多折損的轉(zhuǎn)化路徑。

3. 顛覆未來工作方式和生活方式

未來在公司宣講或者講課,開會等場景,大家可以想象下,呈現(xiàn)在我們面前的不再在是一個枯燥單調(diào)的word/ppt方案,而是一個通過聲音和畫面以及感知觸摸方式進行交互的虛擬可視化方案,你不再是方案的旁觀者,而是作為方案中的參與者去呈現(xiàn),直接顛覆了未來的工作和生活方式。

如果再結(jié)合未來馬斯克腦接口的神經(jīng)連接實現(xiàn),甚至省去口述的步驟,所想及所得,阿凡達的虛擬世界在未來真的有望實現(xiàn)。

未來每個人都可以擁有一個像科幻電影鋼鐵俠中屬于自己賈維斯。

其實openAI已經(jīng)為蘋果Vision pro帶來了ChatGPT,允許用戶直接在應用程序中提出問題,獲得答案,獲得建議,甚至生成圖像和文本。在不久的將來,我們將不再需要在聊天界面中輸入信息,而是更頻繁地通過與AI助手應用對話來表達我們的需求。

未來引入Sora的助力后,Vision pro呈現(xiàn)回答的方式會更加立體直觀,比如遇到一個比較棘手的問題,如汽車引擎無法啟動的故障,sora會自動生成一個汽車的拆解3D影響。一步步教你如何解決問題。

三、總結(jié)

雖然現(xiàn)階段無論是Vision pro還是Sora仍有很多不足,包括被大家詬病的Vision pro尿袋設計,以及頭顯的太重的問題,Sora生成視頻中也有一些違背自然規(guī)律翻車內(nèi)容,也還未實現(xiàn)3D 顯式建模。但隨著科技的快速發(fā)展,按照目前迭代速度和算法持續(xù)優(yōu)化,這些問題在不久將來一定可以解決。

我們要將眼光放長遠一些,未來10年,甚至3-5年后再看這些產(chǎn)品,會發(fā)展的非常成熟和完善。不要忘了僅1年時間,Open AI就已經(jīng)從GPT3-GPT4-迭代到Sora,放在過去完全不敢想象的進步, 技術的突飛猛進速度已遠超出我們的預期和想象 ,所以科幻走進現(xiàn)實,只是早晚的事情。

Sora生成的視頻截圖。提示詞:打印一個人跑步的場景,35 毫米電影膠片。

庫克對Vision pro的希望是“定義下一個十年”,而生成式AI恰巧會在接下來的10年時間內(nèi)快速發(fā)展。據(jù)彭博社最新報告顯示,預計生成式AI市場規(guī)模將會在2032年擴大至1.3萬億美元。需要知道,2022年生成式AI的市場規(guī)模不過400億美元,連1.3萬億美元的零頭都不到。

如果說Vision pro能夠搭上生成式AI這輛車,那么在接下來的10年時間里必定會成為蘋果又一劃時代的產(chǎn)品,而Sora和Vision pro的結(jié)合對于雙方都是很好的補充,在虛擬和現(xiàn)實世界之間已經(jīng)建立了一個鏈接,這讓無論是頭號玩家式的虛擬世界,還是機器人更像人類,都充滿了更大的可能性。

本文由 @黑人阿貍 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載

題圖來自蘋果官網(wǎng)截圖

該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務。

更多精彩內(nèi)容,請關注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!