您的位置: 首頁 >互聯(lián)網(wǎng) >

Sora理解物理世界嗎(關于Sora的簡介)

2024-02-23 14:10:01 編輯:宰荷榮 來源:
導讀 Sora模型發(fā)布已經(jīng)有一段時間,最初它對世界的理解能力讓人驚嘆,但有業(yè)內(nèi)人士認為,Sora對于世界的理解還停留在比較初級的階段,對物理世界...

Sora模型發(fā)布已經(jīng)有一段時間,最初它對世界的理解能力讓人驚嘆,但有業(yè)內(nèi)人士認為,Sora對于世界的理解還停留在比較初級的階段,對物理世界并沒有特別深的理解。

1.相比于以前的視頻生成模型,Sora對于物理世界有一定的理解能力,但并不能算很高明,在一個中國舞龍視頻當中,Sora生成的中國字其實并不是中國字,只是比較像中國字的一個圖形,這是計算機的特性決定的,它具備很強的學習能力和圖像生成能力,但對于現(xiàn)象背后的物理意義和文化意義并不如ChatGPT一樣具備深刻的理解。

2.Sora在視頻的生成能力、連續(xù)性和真實世界模擬方面都具有巨大的優(yōu)勢,它生成的視頻默認為1080P,還具備視頻連接、數(shù)字世界模擬、不同世界交互、運動相機模擬等功能,這些功能在其他的視頻模型當中被提及較少。

3.Open AI發(fā)布的Sora可以生成尺寸更加自由的視頻,用戶可以選擇1920*1080的橫屏、豎屏模式,介于兩者之間的所有尺寸視頻用戶都可以自由選擇,相比之下比如Runway Gen2視頻生成模型,只能選擇16:9、1:1、4:3等長寬比的模型,清晰度則為1408*768px。

4.Sora能將兩個視頻揉合起來,生成一個看起來沒有絲毫違和感的視頻,在官方演示視頻中,先為模型給出一個無人機穿越古羅馬的視頻,再給一個蝴蝶在海底飛行的視頻,Sora能將無人機變成蝴蝶,為古羅馬建筑加入珊瑚風格。

5.生成的視頻中如果鏡頭中物體被其他物體遮住,鏡頭移動到下一階段,這一物體重新出現(xiàn)時仍然能保持之前的存在狀態(tài),這種連續(xù)性是視頻生成模型的一大突破,可以預見未來Sora將會有廣泛的應用前景。


免責聲明:本文由用戶上傳,如有侵權請聯(lián)系刪除!

最新文章

點擊排行

2016-2022 All Rights Reserved.平安財經(jīng)網(wǎng).復制必究 聯(lián)系QQ   備案號:

本站除標明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權歸原作者所有。

郵箱:toplearningteam#gmail.com (請將#換成@)