圖片來源: 

群創光電

重點新聞(0209~0215)

  群創光電     LLM     白龍  

群創光電開源繁中LLM和基準測試資料集

2月初,群創光電智能推進處Text&AIGC研發團隊揭露一款自行打造的繁中語言模型Bailong-instruct 7B和基準測試資料集,要推動繁中LLM的發展。進一步來說,該模型中文名為白龍,具70億參數,以壓縮方法QLoRA和團隊自行研發的束帶嵌入(Zip-tie embedding)技術,來大幅降低訓練所需的算力,同時強化模型在繁體中文任務的表現。

Bailong-instruct 7B以Llama 2 7B為基礎,透過詞表擴充進行二次預訓練和指令精調而成,是一款類似ChatGPT的指令理解模型,支援繁中和英文。團隊表示,該模型在寫信、摘要生成、閱讀理解等任務的表現良好,此外,根據他們在Hugging Face上公開的資料,白龍模型還可處理多輪對話、開放式問答等多種任務。

同時,團隊還釋出一套自建的測試基準資料集Bailong-bench,提供14個中英應用場景來測試模型表現。如同主流評估方法,他們的原理是選定一套LLM(如GPT模型)作為裁判,來評估不同模型回答不同問題的表現,但特別的是,這款Bailong-bench基準測試還添加了模型回答語言與使用者語言一致的考量。經該資料集測試,Bailong-instruct 7B的得分接近ChatGPT(gpt-3.5-turbo-1106),還優於其他開源的繁中LLM,比如在一般場景中,白龍得分為9.2、ChatGPT則是9.9,其餘則是Taiwan-LLM-7B-v2.1-chat的7.7分、Taiwan-LLM-13B-v2.0-chat的8.1分。(詳全文)

  影片生成     Meta     V-JEPA  

Meta公開新影片生成模型V-JEPA

科技巨頭Meta人工智慧研究團隊,最近揭露用於影片預測的非生成式AI模型V-JEPA,透過預測影片中缺失或被遮蔽的部分,來提高AI對這個世界的理解。V-JEPA的靈感來源,是來自Meta AI首席科學家Yann LeCun在2022年提出的JEPA架構,Meta曾在去年以JEPA架構開發電腦視覺模型I-JEPA,能預測畫面缺失的資訊,來生成圖像。

現在,Meta進一步擴展JEPA,發展出能處理影片的V-JEPA。就訓練方法來說,團隊讓模型觀看一系列影片,並將這些影片遮蔽處理,來要求預測器在只有一小部分影片內容的上下文中,填充缺失的內容。這麼做的好處是,讓模型專注於影片的高層次概念,而非鑽牛角尖於對下游任務不重要的細節。V-JEPA採自監督學習方法,使用未標記的資料進行預訓練,只在要模型適應特定任務時,才會使用標籤。V-JEPA還能丟棄不可預測的資訊,提高訓練和採樣效率達1.5到6倍。

V-JEPA特點之一是凍結評估(Frozen Evaluations),也就是模型在預訓練後,核心部分不會再改變,只需添加小型專門層即可適應新任務,免除傳統模型對新任務需要全面微調的麻煩。目前,Meta以CC BY-NC授權釋出V-JEPA模型。(詳全文)

  影片生成    OpenAI      Sora  

OpenAI揭最新短影片生成AI模型Sora,品質更高了

OpenAI最近揭露最新生成式AI模型Sora,輸入文字就能產生高品質、最長1分鐘的短影片。進一步來說,Sora是一個擴散模型,能生成多個角色、特定動作和精準主題細節與背景的複雜場景影片,,能從一個看似靜態噪音的影格開始,逐步透過去除噪音生成一則影片。

Sora以DALL-E和GPT模型為基礎,使用DALL-E 3的重描述技術,能根據視覺訓練資料產生細緻的描述文字,因此也能貼近用戶的文字指令,來產生影片。同時,該模型也能將靜態圖片動態化。也就是說,Sora能從無到有生成全新影片,也能延長現有影片,或將遺失的影格補上。OpenAI點出,Sora是能理解和模擬真實世界的模型基礎,是實現通用AI的重要里程碑。目前,OpenAI正對Sora進行安全和功能測試。(詳全文)

  .NET     微軟     雲原生  

.NET 9預覽版來了!聚焦雲原生和AI支援

微軟才發布.NET 8不久,.NET 9預覽版已經來了!.NET 9的重點仍是效能提升、雲端原生與AI開發支援。首先,微軟在第9版改善了Visual Studio和VS Code,加入.NET Aspire技術框架新的開發和部署功能,如元件配置、除錯支援、全面整合開發者儀表板,來讓開發者更輕鬆管理和監控應用程式。開發者也可從Visual Studio、VS Code,結合使用Azure Developer CLI,將應用程式快速部署到Azure容器,讓應用程式更快上雲。

此外,.NET 9還持續改進Native AOT(Ahead-of-Time Compilation),來提高應用程式的啟動速度和執行效率,減少資源消耗。至於.NET 9對AI開發的支援,則是要讓開發者更容易使用新AI技術和OpenAI服務,亦即提供更多函式庫和文件,協助開發者使用OpenAI服務和其他開源模型,包括本地端和雲端模型的支援。微軟也會持續投資跨平臺機器學習框架ML.NET,強化向量資料庫和AI工作負載的支援,讓開發者更容易將AI功能整合到應用程式中。目前,微軟已開放.NET 9預覽版供開發者下載測試。(詳全文)

  Gemini     Google     多模態  

Google發表Gemini 1.5,可支援百萬個Token上下文

日前,Google發表最新的Gemini 1.5模型,最多可支援長達100萬個Token的脈絡,也就是能一次處理大量資訊,如1小時的影片、11小時的音訊、超過3萬行的程式碼,或70多萬字的內容。

這款Gemini 1.5模型主要採用Transformer和新的專家混合(MoE)架構,前者為一大型神經網路,後者則由眾多小型的專家神經網路所組成。MoE模型可根據使用者所輸入的資料類型,選擇性地在神經網路上啟動最相關的專家路徑,因此大幅提高模型效能。根據Google計畫,他們將在原本的Gemini 1.5 Pro服務中採用Gemini 1.5模型,將基本版支援的12.8萬個Token擴大到100萬個。(詳全文)

  圖像生成     Stability AI     Stable Cascade  

Stability AI發表新一代圖像生成模型,比前一代更省16倍成本

Stability AI日前發表新一代文字轉圖像模型Stable Cascade,可簡單地在消費級硬體上訓練和微調。就流程來說,Stable Cascade有3步驟將文字轉換為圖像,包括潛在解碼階段的步驟A與步驟B,以及潛在生成階段的步驟C。

其中,步驟C是將用戶的指令,轉換成一張小型且簡化的圖像草稿,只包含重要資訊,再將草稿輸入至步驟A和步驟B,同時加入更多細節並放大,形成一張詳細且高解析度的圖片。由於步驟C與步驟A、B分離,因此可單獨對步驟C額外訓練和微調,包括ControlNet和LoRA的訓練。這種設計,讓新模型與訓練一個類似大小的Stable Diffusion模型相比,節省了16倍成本。

經測試,Stable Cascade不只效能更好,產生的結果也比前一代模型SDXL更好。目前,Stability AI開源步驟C和步驟B各兩種模型,步驟C有10億參數和36億參數版本,步驟B則有7億和15億參數版本。不只如此,團隊也同時開源用於訓練、微調、ControlNet和LoRA的所有程式碼,但這些開源資料只限非商業使用。(詳全文)

  LLM     Slack     摘要  

Slack發表Slack AI服務,可摘要各種訊息

主打企業溝通軟體的Slack最近發表Slack AI服務,提供多項LLM驅動的個人化功能。首先是個人化搜尋,能在使用者搜尋問題時,根據使用者企業的公開通訊內容和個人對話來客製化答案,涵蓋行銷專案、公司政策、過去決策、尋找主題專家到定義特定的縮寫等領域。再來是頻道回顧功能,能總結任何頻道重點,包括未讀訊息、過去7天的重點,還能統整自訂的日期期間。另一個功能是對話串摘要,可整理長期對話的重點摘要,每個摘要也會附上來源。

Slack強調,Slack AI運作於Slack的基礎設施上,所使用的各種LLM都由Slack代管,並不會與LLM供應商分享客戶資料,也不會利用客戶資料來訓練LLM。據Slack統計,在Slack AI出現前,該平臺的使用者已打造可整合Slack使用的13,400種AI工具,合作夥伴亦已將AI整合到眾多的Slack應用中。該服務初期支援英文和Enterprise Grid方案客戶。(詳全文)

  瀏覽器     ONNX Runtime     模型訓練  

開發者可在瀏覽器訓練模型!ONNX Runtime 1.17還支援聯合學習

微軟更新AI推論與訓練加速引擎ONNX Runtime(ORT),加入網頁訓練功能,讓開發者在瀏覽器中啟用模型訓練功能,如此裝置上的資料就能透過瀏覽器,進行聯合學習和個人化應用。

從1.8版本開始,ORT Web提供瀏覽器內推論功能,讓開發者可部署跨平臺、可移植的AI模型,並支援模型在CPU和GPU推論。在最新的ONNX Runtime 1.17中,進一步支援在瀏覽器訓練機器學習模型,該功能主要由2部分組成,分別是WebAssembly二進位檔案和JavaScript套件。由於要讓開發者可以在瀏覽器用CPU來訓練模型,ONNX Runtime提供訓練功能應用程式介面C API,但瀏覽器不能直接執行C語言程式碼,所以需要使用低階語言WebAssembly協助。(詳全文)

圖片來源/Meta、OpenAI、Stability AI、Slack

  AI近期新聞 

1. OpenAI更新ChatGPT增加記憶能力,能記住更多對話內容

2. Nvidia推出Chat with RTX應用程式,供用戶在本地端自訂AI聊天機器人

3. Nvidia揭露世界第9名AI超級電腦Eos更多細節

資料來源:iThome整理,2024年2月

熱門新聞

Advertisement