微軟釋出機器學習函式庫ML.NET 0.9，計算特徵貢獻以強化模型可解釋性

微軟的.NET機器學習框架ML.NET現推出0.9版本，這次更新的重點加入了特徵貢獻計算（Feature Contribution Calculation，FCC）以加強模型的可解釋性，還為ONNX模型增加GPU支援，另外也對一些API進行改善。

ML.NET可讓使用者創建常用的機器學習模型，執行諸如分類、回歸、排名、推薦和異常檢測等應用，並且還整合熱門的深度學習框架TensorFlow，以及強化與ONNX實作的互通性，廣泛支援機器學習的開源生態系。 ML.NET常見的使用案例包括情感分析、建議、圖像分類、銷售預測等。

ML.NET加入了FCC，幫助使用者計算資料樣本中，每個特徵對模型得分的貢獻量，以找出應用特定和單一資料樣本的模型預測，其影響最大的特徵。微軟提到，FCC對於包含許多特徵和屬性的歷史資料特別有用，因為在模型中同時使用太多特徵，反而會降低效能與準確性。使用者可以利用FCC，從初始屬性集中，找出最具正面或是負面影響力的屬性。

特徵貢獻計算可以被用在ML.NET工作管線中，當作其中的一個步驟，能夠補充ML.NET 模型可解釋工具置換特徵重要性（Permutation Feature Importance，PFI）的不足，置換特徵重要性是ML.NET 0.8中加入的技術，可以對整體特徵進行重要性評估。而這次微軟也對PFI做出更新，PFI現在可以支援大多數的學習任務，包括回歸、二元分類、多類分類和排名，PFI也支援使用者計算特徵重要性分數的信賴區間，方便評估分數平均值。

在API改進方面，ML.NET 0.9簡化載入文字資料的方式，當使用TextLoader時，除了像之前一樣直接指定文件屬性，現在也能以資料模型類別指定欄位屬性。而當使用者評估模型品質時，除了分數欄位，現在還可以多取得可信度。ML.NET 0.9加入新的鍵值映射估計器，而這個新功能將取代原本的TermLookupTransform，為指定兩個值間的映射關係提供新方法。

ML.NET 0.9現支援CUDA 10.0的GPU，以提高ONNX模型執行的能力，但以GPU執行ONNX模型，目前只能在64位元Windows上運作，Linux和Mac版本的支援將在之後加入。另外，微軟也為Visual Studio加入ML.NET專案樣板，其使用情境包括ML.NET控制台應用程式以及ML.NET模型函式庫，使用者可以透過範例了解，如何在應用程式中使用機器學習模型，還有創建新的機器學習模型函式庫，並在應用程式中使用的方法。

熱門新聞