谷歌DeepMind團隊近日發(fā)布了一款名為Genie的基礎(chǔ)世界模型,其擁有110億參數(shù),能夠從一張圖片創(chuàng)造出可玩的虛擬世界。這一突破性的技術(shù)引起了網(wǎng)友的廣泛關(guān)注,標志著AI已經(jīng)正式涉足視頻游戲領(lǐng)域。
不同于之前的模型,Google Genie通過學習20萬小時的未標注互聯(lián)網(wǎng)視頻,無需監(jiān)督訓練即可生成豐富多樣的場景。更令人驚嘆的是,它無需任何動作標注,就能確定場景中的主角,并允許用戶與之互動。這一特性使得Genie在創(chuàng)造虛擬世界方面具有巨大的潛力。
Google Genie通過三大核心組件實現(xiàn)其功能:潛動作模型、視頻分詞器以及自回歸動態(tài)模型。這些組件共同工作,生成一個學習潛動作空間,不僅為用戶提供了交互式的體驗,還有助于訓練智能體模仿看不見的視頻中的行為。
此外,Genie的創(chuàng)新之處還在于它能夠應(yīng)用于人類設(shè)計的草圖或現(xiàn)實世界的圖像上。通過最先進的文本到圖像生成模型制作起始幀,Genie可以將其轉(zhuǎn)化為可交互的虛擬世界。這一功能為創(chuàng)建虛擬世界提供了新的途徑,極大地拓寬了Genie的應(yīng)用范圍。
Genie團隊的負責人Tim Rockt?schel表示,Genie作為世界模型,是人類邁向通用人工智能(AGI)的重要一步。它的出現(xiàn)將重塑交互式生成環(huán)境的格局,為未來的通才智能體的發(fā)展奠定基礎(chǔ)。
總之,谷歌DeepMind發(fā)布的Genie模型為視頻游戲領(lǐng)域帶來了革命性的變化。其從一張圖片創(chuàng)造出可玩虛擬世界的能力令人矚目,預(yù)示著AI在游戲領(lǐng)域的廣泛應(yīng)用即將到來。
原創(chuàng)文章,作者:若安丶,如若轉(zhuǎn)載,請注明出處:http://rponds.cn/article/633178.html