近日,OpenAI推出的視頻生成模型Sora引起了廣泛關注。雖然Sora功能強大, 但也引發(fā)了人們的猜想,Sora到底懂不懂物理世界?
Sora在生成復雜場景時面臨了諸多物理挑戰(zhàn)。例如,在生成“海盜船在咖啡杯中纏斗”的場景時,Sora需要調(diào)整海盜船和咖啡杯的尺寸比例,模擬液體動力學效果,處理光線和陰影,以及確保海盜船的運動符合物理規(guī)律。這些都對AI模型提出了更高的要求。
然而,圖靈獎得主Yann LeCun對Sora的能力持保留意見。他認為,僅僅根據(jù)Prompt生成逼真的視頻并不能證明模型真正理解了物理世界。相反,他認為更理想的做法是生成視頻后續(xù)內(nèi)容的抽象表達,并消除與可能采取的動作無關的場景細節(jié)。
Keras之父Fran?ois Chollet也表達了對Sora模型的關注。他認為,盡管Sora嵌入了物理模型,但該模型是否準確、能否泛化到新的情況仍是未知數(shù)。這些問題將決定生成圖像的應用范圍,是僅限于媒體生產(chǎn)還是可以用作現(xiàn)實世界的模擬。
總之,Sora模型的出現(xiàn)為視頻生成領域帶來了新的挑戰(zhàn)和機遇。未來,我們期待看到更多關于該模型的研究和改進,以及其在現(xiàn)實世界中的應用潛力。
原創(chuàng)文章,作者:秋秋,如若轉載,請注明出處:http://rponds.cn/article/631128.html