99日韩2020国产色国，无码在线视频亚洲色图，国产秘一区二区三区，91久久精品日日躁夜夜躁，av三级网站免费观看，人妻就是紧21p，亚洲欧美国产精品久久，亚洲一级免费观看高清无码

搜索

APP

起點(diǎn)課堂會(huì)員權(quán)益

職業(yè)體系課特權(quán)

線(xiàn)下行業(yè)大會(huì)特權(quán)

個(gè)人IP打造特權(quán)

30+門(mén)專(zhuān)項(xiàng)技能課

1300+專(zhuān)題課程

12場(chǎng)職場(chǎng)軟技能直播

12場(chǎng)求職輔導(dǎo)直播

12場(chǎng)專(zhuān)業(yè)技能直播

會(huì)員專(zhuān)屬社群

榮耀標(biāo)識(shí)

發(fā)布

注冊(cè) | 登錄

效果炸裂！OpenAI首個(gè)視頻生成模型發(fā)布，1分鐘流暢高清，網(wǎng)友：整個(gè)行業(yè)RIP

量子位

2024-02-16

2 評(píng)論 4091 瀏覽 3 收藏

8 分鐘

昨天，OpenAI公布了一種新的人工智能系統(tǒng)，該系統(tǒng)可以根據(jù)用戶(hù)的文本提示創(chuàng)建逼真的視頻，使其成為最新一家采用生成視頻技術(shù)的人工智能公司。這個(gè)新模型的效果咋樣？我們來(lái)看看作者的分析。

剛剛，奧特曼發(fā)布OpenAI首個(gè)視頻生成模型Sora。

完美繼承DALL·E 3的畫(huà)質(zhì)和遵循指令能力，能生成長(zhǎng)達(dá)1分鐘的高清視頻。

AI想象中的龍年春節(jié)，紅旗招展人山人海。

有緊跟舞龍隊(duì)伍抬頭好奇官網(wǎng)的兒童，還有不少人掏出手機(jī)邊跟邊拍，海量人物角色各有各的行為。

雨后東京街頭，潮濕地面反射霓虹燈光影效果堪比RTX ON。

行駛中的列車(chē)窗外偶遇遮擋，車(chē)內(nèi)人物倒影短暫出現(xiàn)非常驚艷。

也可以來(lái)一段好萊塢大片質(zhì)感的電影預(yù)告片：

豎屏超近景視角下，這只蜥蜴細(xì)節(jié)拉滿(mǎn)：

網(wǎng)友直呼game over，工作要丟了：

甚至有人已經(jīng)開(kāi)始“悼念”一整個(gè)行業(yè)：

一、AI理解運(yùn)動(dòng)中的物理世界

OpenAI表示，正在教AI理解和模擬運(yùn)動(dòng)中的物理世界，目標(biāo)是訓(xùn)練模型來(lái)幫助人們解決需要現(xiàn)實(shí)世界交互的問(wèn)題

根據(jù)文本提示生成視頻，僅僅是整個(gè)計(jì)劃其中的一步。

目前Sora已經(jīng)能生成具有多個(gè)角色、包含特定運(yùn)動(dòng)的復(fù)雜場(chǎng)景，不僅能理解用戶(hù)在提示中提出的要求，還了解這些物體在物理世界中的存在方式。

比如一大群紙飛機(jī)在樹(shù)林中飛過(guò)，Sora知道碰撞后會(huì)發(fā)生什么，并表現(xiàn)其中的光影變化。

一群紙飛機(jī)在茂密的叢林中翩翩起舞，在樹(shù)林中穿梭，就像候鳥(niǎo)一樣。

Sora還可以在單個(gè)視頻中創(chuàng)建多個(gè)鏡頭，并依靠對(duì)語(yǔ)言的深入理解準(zhǔn)確地解釋提示詞，保留角色和視覺(jué)風(fēng)格。

美麗、白雪皚皚的東京熙熙攘攘。鏡頭穿過(guò)熙熙攘攘的城市街道，跟隨幾個(gè)人享受美麗的雪天并在附近的攤位購(gòu)物。絢麗的櫻花花瓣隨著雪花隨風(fēng)飄揚(yáng)。

對(duì)于Sora當(dāng)前存在的弱點(diǎn)，OpenAI也不避諱，指出它可能難以準(zhǔn)確模擬復(fù)雜場(chǎng)景的物理原理，并且可能無(wú)法理解因果關(guān)系。

例如“五只灰狼幼崽在一條偏僻的碎石路上互相嬉戲、追逐”，狼的數(shù)量會(huì)變化，一些憑空出現(xiàn)或消失。

該模型還可能混淆提示的空間細(xì)節(jié)，例如混淆左右，并且可能難以精確描述隨著時(shí)間推移發(fā)生的事件，例如遵循特定的相機(jī)軌跡。

如提示詞“籃球穿過(guò)籃筐然后爆炸”中，籃球沒(méi)有正確被籃筐阻擋。

技術(shù)方面，目前OpenAI透露的不多，簡(jiǎn)單介紹如下：

Sora是一種擴(kuò)散模型，從噪聲開(kāi)始，能夠一次生成整個(gè)視頻或擴(kuò)展視頻的長(zhǎng)度，

關(guān)鍵之處在于一次生成多幀的預(yù)測(cè)，確保畫(huà)面主體即使暫時(shí)離開(kāi)視野也能保持不變。

與GPT模型類(lèi)似，Sora使用了Transformer架構(gòu)，有很強(qiáng)的擴(kuò)展性。

在數(shù)據(jù)方面，OpenAI將視頻和圖像表示為patch，類(lèi)似于GPT中的token。

通過(guò)這種統(tǒng)一的數(shù)據(jù)表示方式，可以在比以前更廣泛的視覺(jué)數(shù)據(jù)上訓(xùn)練模型，涵蓋不同的持續(xù)時(shí)間、分辨率和縱橫比。

Sora建立在過(guò)去對(duì)DALL·E和GPT模型的研究之上。它使用DALL·E 3的重述提示詞技術(shù)，為視覺(jué)訓(xùn)練數(shù)據(jù)生成高度描述性的標(biāo)注，因此能夠更忠實(shí)地遵循用戶(hù)的文本指令。

除了能夠僅根據(jù)文本指令生成視頻之外，該模型還能夠獲取現(xiàn)有的靜態(tài)圖像并從中生成視頻，準(zhǔn)確地讓圖像內(nèi)容動(dòng)起來(lái)并關(guān)注小細(xì)節(jié)。

該模型還可以獲取現(xiàn)有視頻并對(duì)其進(jìn)行擴(kuò)展或填充缺失的幀，請(qǐng)參閱技術(shù)論文了解更多信息（晚些時(shí)候發(fā)布）。

Sora 是能夠理解和模擬現(xiàn)實(shí)世界的模型的基礎(chǔ)，OpenAI相信這一功能將成為實(shí)現(xiàn)AGI的重要里程碑。

二、奧特曼在線(xiàn)接單

目前已有一些視覺(jué)藝術(shù)家、設(shè)計(jì)師和電影制作人（以及OpenAI員工）獲得了Sora訪(fǎng)問(wèn)權(quán)限。

他們開(kāi)始不斷po出新的作品，奧特曼也開(kāi)始了在線(xiàn)接單模式。

帶上你的提示詞@sama，就有可能收到生成好的視頻回復(fù)。

參考鏈接：[1]https://openai.com/sora

作者：夢(mèng)晨西風(fēng) 發(fā)自凹非寺

來(lái)源公眾號(hào)：量子位（ID：QbitAI），追蹤人工智能新趨勢(shì)，關(guān)注科技行業(yè)新突破

本文由人人都是產(chǎn)品經(jīng)理合作媒體 @量子位授權(quán)發(fā)布，未經(jīng)許可，禁止轉(zhuǎn)載。

題圖來(lái)自 Unsplash，基于 CC0 協(xié)議

該文觀點(diǎn)僅代表作者本人，人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。

更多精彩內(nèi)容，請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App

量子位

追蹤人工智能新趨勢(shì)，關(guān)注科技行業(yè)新突破

71篇作品 186170總閱讀量

商業(yè)目標(biāo)和用戶(hù)價(jià)值沖突，怎么平衡？

09-261829 瀏覽

當(dāng)代觸覺(jué)XR技術(shù)研究與應(yīng)用探索 ?

11-073897 瀏覽

高德也來(lái)卷跑腿市場(chǎng)，網(wǎng)約車(chē)的生意這么不好做了？

12-202672 瀏覽

一文讀懂電商平臺(tái)之優(yōu)惠券設(shè)計(jì)

10-234945 瀏覽

CRM3.0架構(gòu)下，智慧服務(wù)3.0的產(chǎn)品構(gòu)成和功能

04-065284 瀏覽

評(píng)論

旺旺旺旺旺仔

這是個(gè)好消息

最近來(lái)自廣東回復(fù)
兔斯基大長(zhǎng)腿

王者來(lái)了，其他都是弟弟

最近來(lái)自廣東回復(fù)

復(fù)盤(pán)拼多多：為什么能持續(xù)低價(jià)且盈利

07-206723 瀏覽
一夜之間，字節(jié)跳動(dòng)海外失控

06-125365 瀏覽
私域業(yè)務(wù)怎么和ChatGPT結(jié)合

03-247602 瀏覽

效果炸裂！OpenAI首個(gè)視頻生成模型發(fā)布，1分鐘流暢高清，網(wǎng)友：整個(gè)行業(yè)RIP

一、AI理解運(yùn)動(dòng)中的物理世界

二、奧特曼在線(xiàn)接單

二、奧特曼在線(xiàn)接單