| IT周報 | 蘋果 | 多模態模型 | 行動裝置 | UI | 諾貝爾物理獎 | Meta | 影片生成 | 微軟 | Copilot | Gemini Nano

AI趨勢周報第261期:UI螢幕互動成多模態模型新戰場,蘋果揭露新研究成果

蘋果揭露多模態模型MM1.5系列成果,還能處理行動裝置螢幕理解任務;兩位機器學習先鋒獲得諾貝爾物理獎;Meta預告影片生成AI模型Movie Gen;蘋果新模型1秒內將2D圖片轉為3D;可大幅改進AI模型運算效能!PyTorch釋出torchao函式庫

2024-10-11

| IT周報 | 國科會 | TAIDE | Nvidia | GPU | 微服務 | 3D | 影片生成 | 機器人

AI趨勢周報第247期: 國科會揭半導體AI人才策略、TAIDE進展和氣象AI規畫

國科會表示,TAIDE-7B將於4月中開源;Nvidia推生成式AI微服務;蘋果發表多模態大型語言模型MM1;Google公開皮膚病狀圖片資料集;Stability AI開源多視角影片生成模型SV3D;新一代高效能GPU來了,Nvidia發表Blackwell

2024-03-23

| Stability AI | 3D | 影片生成 | Stable Video 3D | SV3D

Stability AI開源新模型SV3D,可生成多視角且物體外觀一致的影片

Stability AI發布新的3D影片生成模型Stable Video 3D(SV3D),支援從任意角度生成高品質,且物體外觀一致的影片,無論是在影片品質還是多視角呈現,表現都較之前的模型更好

2024-03-20

| IT周報 | 繁中 | LLM | 群創光電 | Meta | 影片生成 | OpenAI | Sora | Stability AI | Gemini | google

AI趨勢周報第243期:群創光電開源70億參數的繁中語言模型白龍

群創光電團隊開源繁中優化的語言模型白龍;Meta發表新影片生成模型V-JEPA;OpenAI揭最新短影片生成AI模型Sora;.NET 9預覽版來了!聚焦雲原生和AI支援;Stability AI發表新一代圖像生成模型,比前一代更省16倍成本;開發者可在瀏覽器訓練模型!ONNX Runtime 1.17還支援聯合學習

2024-02-18

| google | 擴散模型 | 影片生成

Google展示可生成動作連貫且高品質影片的時空擴散模型Lumiere

Google發表新的文字轉影片擴散模型Lumiere,採用創新的時空U-Net(Space-Time U-Net,STUNet)基礎架構,能夠一次性生成高品質且動作連貫的短影片

2024-01-27

| IT周報 | 微軟 | 影片生成 | 機器人 | 史丹佛大學 | 晶創臺灣 | 半導體 | 生成式AI | GPT Store | BigQuery

AI趨勢周報第239期:微軟終於開源影片生成模型DragNUWA 1.5了

微軟開源更精準的影片生成模型DragNUWA;可靈活模仿人類雙手動作!史丹佛大學發表機器人系統Mobile ALOHA;晶創臺灣方案正式啟動,國科會揭4大布局;DeepMind用大型基礎模型自動控制機器人;OpenAI GPT Store正式上線

2024-01-12

| Stability AI | Stable Video Diffusion | 影片生成

Stability AI開發者平臺開始提供影片生成模型API服務

Stable Video Diffusion影片生成模型服務上架Stability AI開發者平臺,開發者能以API程式化存取模型,在平均41秒內生成2秒影片

2023-12-25

| IT周報 | 蘋果 | DRAM | LLM | google | 影片生成 | GAI | 微軟 | MaaS | 數位部

AI趨勢周報第237期:蘋果提出新方法,行動裝置可執行DRAM兩倍大的LLM

蘋果用2種技術,讓行動裝置也有辦法執行原本DRAM無法負荷的LLM應用;Google用LLM打造影片生成模型VideoPoet;微軟Azure AI再添新模型,Phi-2小語言模型也上架;瞄準GAI需求,Google要打造端到雲全套工具鏈

2023-12-22

| google | LLM | 影片生成

Google應用多模態大型語言模型解決影片生成任務

有別於當前影片生成模型多為擴散模型,Google的多模態大型語言模型VideoPoet,可完成各種影片生成任務產出高品質影片,單一模型就可生成影片與配樂

2023-12-22

| Stability AI | Stable Diffusion | 影片生成

Stability AI推出可生成影片的模型Stable Video Diffusion

Stability AI新模型Stable Video Diffusion能將文字指令轉成影片,生成每秒3到30影格的高品質影片,不過目前官方所釋出的兩版模型,最多僅可生成的影格數分別為14影格與25影格

2023-11-23

| 臉書 | 影片生成 | google | 模型優化 | MorphNet | 牛津大學 | 機器人 | Mozilla | Python直譯器 | 小馬智行 | 自駕車 | AWS | IT周報

AI趨勢周報第82期:臉書發表影片生成AI,可擷取真實影片中人物來設計遊戲

臉書AI研究院的影片生成AI,靠2套類神經網路模型從真實影片中擷取人物,再根據搖桿訊號來產生相應的人物動作姿勢,最後結合新場景,產生出新短片。另一方面,牛津大學設計新「行走」AI,幫4腳機器人在崎嶇路面走得更穩妥。在亞洲,中國自駕車新創利用動態尋路演算法,來優化自駕車道路測試。

2019-04-25