圖片來源: 

OpenAI

OpenAI周二(9/30)發表影片生成模型Sora 2,並開始預覽Sora程式及Sora網站,惟目前僅支援美國與加拿大市場。

OpenAI是在2024年2月首度揭露Sora,去年12月正式推出Sora的第一個版本,依照該公司的比喻,去年2月那個Sora原始模型的表現便如同GPT‑1,Sora 2就像是GPT‑3.5。最新的Sora 2已能完成傳統影片生成的困難任務,像是奧林匹克的體操動作,立槳衝浪板上的後空翻,或是貓咪的三周跳。

舊版Sora有時會出現一些詭異的錯誤,例如物體在鏡頭切換或移動時忽然消失,人物在作體操或動作時可能出現不合理的關節或姿勢,複雜的提示可能會讓場景錯誤或扭曲,並具備大量的偏差與刻板印象。

此外,過去的模型為了達成提示常常會作弊,例如投籃失誤時可能被瞬移進籃框。但Sora 2在投籃失誤時會反彈,遵守物理法則,該版大幅提升了物理一致性;Sora 2也能精準執行多個鏡頭與複雜指令,正確維持世界狀態;它也允許使用者將真實影片中的人物嵌入生成場景,準確呈現外貌與聲音,為虛實融合的一大突破。

這次OpenAI還特別替影片生成設計了一款同名的Sora社交程式,可用來建立或混搭彼此的世代,還能透過「客串」(Cameo)功能將自己或朋友融入既有的場景中。Cameo只需要一次性的影音錄製驗證,就能模擬使用者的外貌及聲音,並直接進入任何Sora場景,OpenAI表示,該功能於內部測試中深受喜愛,甚至促成同事間的新友誼。

Sora程式目前僅有iOS版,其它使用者則可透過sora.com測試新功能。

熱門新聞

Advertisement