| google | 視覺編碼器 | AI | 影片理解

Google開發視覺編碼器VideoPrism,在通用影片理解任務表現優異

Google新開發的VideoPrism,是一款可處理多種影片理解任務的先進視覺編碼器,在多項基準測試中打敗當前先進的基礎模型,而且與大型語言模型結合,在多個視覺語言基準測試中更設下新的技術水準

2024-02-27