DeepMind發表可以生成數分鐘3D虛擬世界的Genie 3

圖片來源:

Google

Google DeepMind於周二（8/5）發表全新AI世界模型Genie 3，可根據文字提示即時生成互動式3D世界。相較於去年11月釋出、僅能維持10~20秒互動的Genie 2，Genie 3支援長達數分鐘的連續互動，還能記住場景以維持畫面及環境的連貫性。

Genie 3是DeepMind自2023年以來持續開發的世界模型系列第三代，可以每秒24幀與720p的解析度執行。它能夠模擬火山地形、水流或光影等真實世界的物理現象，亦可再現冰川或熱帶雨林等自然生態，還能以幻想及動畫風格創作，或是重建地理及歷史場景。

此外，Genie 3還支援「可提示的世界事件」（promptable world events），讓使用者得以即時透過文字變更世界條件，例如改變天氣、增加角色或新場景，讓生成世界不僅可互動，還能持續演變。

Genie系列與傳統的影片生成不同，它讓使用者進入一個由AI生成的世界，還能與場景互動，這種動態操控的能力，使其特別適合用於代理人訓練、自主系統模擬、教育模擬，以及創意應用。

世界模型被視為邁向通用人工智慧（AGI）的一個關鍵技術，允許AI不必依靠真實世界資料，便能於虛擬世界中進行各種練習與學習。DeepMind表示，他們已經利用Genie 3所創造的虛擬世界來測試自家的SIMA代理人，看看它在不同任務下能否學會解決問題。

SIMA（Scalable, Instructable, Multiworld Agent）是Google DeepMind所開發的一款通用型AI代理人，目標是讓它能在各種3D虛擬環境中完成多樣化任務。

目前Genie 3尚未開放一般大眾使用，而是以「限量研究預覽」方式提供少數學術研究人員與創作者試用，並蒐集回饋以評估潛在風險與負責任的使用方式。Google也坦承，該模型仍存在如互動範圍受限、無法完美模擬真實地點，以及文字生成效果不穩定等限制。

熱門新聞