微軟的.NET機器學習框架ML.NET現推出0.9版本,這次更新的重點加入了特徵貢獻計算(Feature Contribution Calculation,FCC)以加強模型的可解釋性,還為ONNX模型增加GPU支援,另外也對一些API進行改善。

ML.NET可讓使用者創建常用的機器學習模型,執行諸如分類、回歸、排名、推薦和異常檢測等應用,並且還整合熱門的深度學習框架TensorFlow,以及強化與ONNX實作的互通性,廣泛支援機器學習的開源生態系。 ML.NET常見的使用案例包括情感分析、建議、圖像分類、銷售預測等。

ML.NET加入了FCC,幫助使用者計算資料樣本中,每個特徵對模型得分的貢獻量,以找出應用特定和單一資料樣本的模型預測,其影響最大的特徵。微軟提到,FCC對於包含許多特徵和屬性的歷史資料特別有用,因為在模型中同時使用太多特徵,反而會降低效能與準確性。使用者可以利用FCC,從初始屬性集中,找出最具正面或是負面影響力的屬性。

特徵貢獻計算可以被用在ML.NET工作管線中,當作其中的一個步驟,能夠補充ML.NET 模型可解釋工具置換特徵重要性(Permutation Feature Importance,PFI)的不足,置換特徵重要性是ML.NET 0.8中加入的技術,可以對整體特徵進行重要性評估。而這次微軟也對PFI做出更新,PFI現在可以支援大多數的學習任務,包括回歸、二元分類、多類分類和排名,PFI也支援使用者計算特徵重要性分數的信賴區間,方便評估分數平均值。

在API改進方面,ML.NET 0.9簡化載入文字資料的方式,當使用TextLoader時,除了像之前一樣直接指定文件屬性,現在也能以資料模型類別指定欄位屬性。而當使用者評估模型品質時,除了分數欄位,現在還可以多取得可信度。ML.NET 0.9加入新的鍵值映射估計器,而這個新功能將取代原本的TermLookupTransform,為指定兩個值間的映射關係提供新方法。

ML.NET 0.9現支援CUDA 10.0的GPU,以提高ONNX模型執行的能力,但以GPU執行ONNX模型,目前只能在64位元Windows上運作,Linux和Mac版本的支援將在之後加入。另外,微軟也為Visual Studio加入ML.NET專案樣板,其使用情境包括ML.NET控制台應用程式以及ML.NET模型函式庫,使用者可以透過範例了解,如何在應用程式中使用機器學習模型,還有創建新的機器學習模型函式庫,並在應用程式中使用的方法。


Advertisement

更多 iThome相關內容