谷歌Google Gemini 1.5剖析OpenAI Sora視頻生成技術(shù):雖視覺吸引但存多處不合理

谷歌Google Gemini 1.5剖析OpenAI Sora視頻生成技術(shù):雖視覺吸引但存多處不合理

近日,谷歌的先進AI模型Gemini 1.5OpenAI新推出的視頻生成工具Sora進行了深度評價。盡管Sora生成的視頻在視覺上頗具吸引力,但Gemini 1.5指出其中存在多處不符合常理的細節(jié)。

以Sora生成的一段日本街道視頻為例,畫面中大雪紛飛與櫻花盛開同時出現(xiàn),這在現(xiàn)實中是不可能發(fā)生的,因為櫻花通常在溫暖的春季盛開,不會伴有降雪。此外,視頻中的降雪方式顯得過于均勻,與現(xiàn)實中的降雪模式存在明顯差異。更令人矚目的是,視頻中的人物雖然置身于大雪中,卻未穿著任何冬裝,這種矛盾之處讓人一眼就能看出視頻的非現(xiàn)實性。

Gemini 1.5的分析師表示:“雖然Sora生成的視頻在視覺上頗具吸引力,但其中的不合邏輯之處明顯,表明這些場景并非來自現(xiàn)實生活?!边@一評價凸顯了當前AI生成技術(shù)在真實性和邏輯性方面仍存在的挑戰(zhàn)。

與此同時,谷歌的Gemini 1.5模型在處理能力上也展現(xiàn)出了其強大實力。它擁有驚人的100萬詞條上下文窗口,遠超其他競爭對手,這意味著它能夠一次處理大量信息,包括長達1小時的視頻和超過30,000行的代碼。

隨著AI技術(shù)的不斷進步,我們期待未來能夠看到更加真實、生動的視頻生成效果。

原創(chuàng)文章,作者:happy,如若轉(zhuǎn)載,請注明出處:http://rponds.cn/article/630941.html

happy的頭像happy管理團隊

相關(guān)推薦

發(fā)表回復(fù)

登錄后才能評論