Google現在於GitHub開源可配置推薦系統模擬平臺RecSim,讓用戶編寫與使用者進行順序互動的推薦系統模擬環境,突破當前增強學習應用於推薦系統,在順序互動式推薦的障礙。

Google提到,機器學習、語音辨識和自然語言處理等技術,正改變使用者與推薦系統互動的方法,在線上服務加入協同互動式推薦器(Collaborative Interactive Recommenders,CIRs),已經成為提升用戶滿意度的重要方法,不過,到目前為止,CIR系統的部署仍不普及。

雖然增強學習是解決順序決策問題的標準機器學習方法,但是CIR的研究與實作仍在發展中,Google指出,主要的障礙在於缺乏用於順序推薦器的通用模擬平臺,因為模擬是要將增強學習演算法用於諸如機器人等實際應用的主要方法。

為此,Google開發了可配置平臺RecSim,讓使用者能夠編寫模擬環境,促進像是CIR等推薦系統的增強學習演算法研究。RecSim可讓研究人員合成推薦設定,測試現存增強學習演算法的限制。Google提到,RecSim的目標是要來模擬真實推薦系統中用戶的特定行為,並作為一個受控的環境,讓開發者開發、評估和比較推薦模型和演算法。

由於RecSim是一個開源平臺,Google期望能夠藉此促進增強學習和推薦系統的交叉研究,鼓勵研究的重現與模型共享,也能讓使用者在模擬環境快速測試並修正模型與演算法,省去真正對終端使用者進行試驗的潛在成本。另外,RecSim還能在不洩漏使用者隱私的情況下,以真實的用戶行為作為學術與產業合作的資源。

Google仍在持續開發數項RecSim重要的擴充套件,包括讓程式化使用者模型(Stylized User Model)應用實際使用日誌,解決模擬到真實環境的差異,以及應用TensorFlow加速器和分散式運算,來擴大模擬與推測演算法執行。Google希望透過RecSim彌補推薦系統和增強學習研究的差距。

熱門新聞

Advertisement