在微軟發布.NET 8之後,緊接著推出跨平臺機器學習框架ML.NET 3.0,這個新版本更新強化深度學習功能,並且改進ML.NET資料處理能力,還加入Intel oneDAL硬體訓練加速,以及自動機器學習等新功能,這些更新讓開發者在編寫機器學習應用程式能夠更加方便且靈活。

ML.NET 3.0深度學習功能更完整,包含物體偵測、命名實體辨識和問答處理。物體偵測能夠在圖像中定位並分類不同類型的實體,官方指出,物體偵測是一項電腦視覺任務,和圖像分類關係密切,但是會執行更精細的圖像分類,因此當影像中包含不同類型的物體時,官方建議使用物體偵測功能。

ML.NET 3.0模型生成器中的新物體偵測功能,建構在新添加的TorchSharp物體偵測API基礎之上。TorchSharp是一個.NET函式庫,提供PyTorch函式庫存取支援,而TorchSharp物體偵測API則結合微軟研究院的新技術,以及TorchSharp中Transformer神經網路架構建置而成。命名實體辨識和問答處理,是自然語言處理的兩項任務,ML.NET 3.0透過現有TorchSharp RoBERTa文字分類功能基礎,實現了這兩個功能。而這些功能都包含在Microsoft.ML.TorchSharp 3.0.0套件中。

之前微軟在發布ML.NET 2.0不久後,便宣布要支援Intel oneDAL硬體訓練加速,而這項功能在ML.NET 3.0預覽版中登場。Intel oneDAL(oneAPI Data Analytics Library)是一個擁有高度最佳化演算法建構模塊的函式庫,能夠加速資料分析和機器學習過程。

微軟還更新ML.NET 3.0自動機器學習(AutoML)功能。自動機器學習功能使用可自動化搜尋最佳機器學習模型和參數的AutoML Sweeper元件,在新版本中新增支援語句相似性、問答處理和物體偵測等功能。自動機器學習簡單來說,是一種自動對資料應用機器學習技術的過程,能夠協助選擇最適合的模型和參數,使得開發者在建置機器學習模型時更簡單。

在新版本中,ML.NET現在具有連續資源監控能力,可以透過AutoML.IMonitor監控記憶體和磁碟空間,如此開發者便能夠控制長期運作的實驗,避免程式崩潰和失敗,改善ML.NET在機器學習應用的穩定性。

ML.NET資料結構DataFrame在3.0上也有更新,加入對String和VBuffer欄位類型的支援,並且強化IDataView與DataFrame的轉換。現在欄位可以儲存超過2 GB的資料,還支援Apache Arrow Date64欄位資料。ML.NET 3.0也能夠更好地支援SQL資料庫匯入和匯出功能,最佳化算數操作的空值處理。這些更新都會顯著提升DataFrame的功能和效能。

ML.NET 3.0還有一項重要更新是Tensor Primitives整合。Tensor Primitives為一套專門用於張量運算的新API,能夠進一步推進.NET在人工智慧數值運算的應用。該API不僅運用硬體內部指令來加速運算效率,還結合泛型數學(Generic Math)的概念,提供開發者處理複雜數學和資料操作的強大工具。

熱門新聞

Advertisement