
Google DeepMind於周二(8/5)發表全新AI世界模型Genie 3,可根據文字提示即時生成互動式3D世界。相較於去年11月釋出、僅能維持10~20秒互動的Genie 2,Genie 3支援長達數分鐘的連續互動,還能記住場景以維持畫面及環境的連貫性。
Genie 3是DeepMind自2023年以來持續開發的世界模型系列第三代,可以每秒24幀與720p的解析度執行。它能夠模擬火山地形、水流或光影等真實世界的物理現象,亦可再現冰川或熱帶雨林等自然生態,還能以幻想及動畫風格創作,或是重建地理及歷史場景。
此外,Genie 3還支援「可提示的世界事件」(promptable world events),讓使用者得以即時透過文字變更世界條件,例如改變天氣、增加角色或新場景,讓生成世界不僅可互動,還能持續演變。
Genie系列與傳統的影片生成不同,它讓使用者進入一個由AI生成的世界,還能與場景互動,這種動態操控的能力,使其特別適合用於代理人訓練、自主系統模擬、教育模擬,以及創意應用。
世界模型被視為邁向通用人工智慧(AGI)的一個關鍵技術,允許AI不必依靠真實世界資料,便能於虛擬世界中進行各種練習與學習。DeepMind表示,他們已經利用Genie 3所創造的虛擬世界來測試自家的SIMA代理人,看看它在不同任務下能否學會解決問題。
SIMA(Scalable, Instructable, Multiworld Agent)是Google DeepMind所開發的一款通用型AI代理人,目標是讓它能在各種3D虛擬環境中完成多樣化任務。
目前Genie 3尚未開放一般大眾使用,而是以「限量研究預覽」方式提供少數學術研究人員與創作者試用,並蒐集回饋以評估潛在風險與負責任的使用方式。Google也坦承,該模型仍存在如互動範圍受限、無法完美模擬真實地點,以及文字生成效果不穩定等限制。
熱門新聞
2025-12-02
2025-12-01
2025-12-01
2025-11-30
2025-12-01
2025-12-04