圖片來源: 

Slack

Slack位於紐約的搜尋、學習與智慧部門(Search, Learning & Intelligence,SLI)近日公布一項新功能Highlights,能夠自動幫助使用者挑出10則重要的未讀訊息,透過分析使用者與他人的互動和使用習慣,預測使用者最可能點擊的對話訊息或是較困難的技術問題,不過這項功能只提供給付費的使用者。

2013年創立的Slack原本是一家遊戲公司在打造遊戲時所使用的內部通訊工具,該款遊戲已淡出市場,而Slack卻造成無心插柳柳成蔭的結果,成為市場上最受歡迎的企業協作工具。

根據麥肯錫的預測,知識型的工作者每天花費大約28%的時間在處理數位訊息,因此,Slack企圖協助使用者在工作上,能夠更快速跟上未讀取的訊息,且有效率地掌握最重要的資訊,推出一系列的新功能,Highlights只是Slack的第一步,未來還會從使用者不常讀取的群組中,挑選中重要的訊息和摘要內容較長訊息。

在所有未讀的訊息中,Slack會依照每位使用者平時使用Slack的習慣,略過一些使用者有一段時間未讀的群組,初步挑選出較重要的訊息,由於對每位使用者重要的訊息不同,Slack採用個人化的預測模型,預測哪一則訊息是該使用者比較有可能點擊、分享和回覆的訊息。

為了要做這些預測,SLI團隊在Slack中建立將網路溝通高度結構化的工作關聯圖(Work Graph),可以擷取使用者與他人重要的關聯,像是使用者最常對話的群組、使用的檔案和應用程式。這樣的作法和Google記錄網路關聯圖(Web Graph)來強化搜尋、Facebook記錄社群關聯圖(Social Graph)來增強動態消息一樣,Slack建立使用者與團隊之間知識的連結,透過Log檔了解每則訊息的關聯。另外,Slack也強調,收集這些資訊只會用來強化Highlights的功能,並不會將資料用在廣告行銷,或是賣給第三方的廠商。

為了方便理解和容易解釋,Slack認為,機器學習還在較早期的階段,而傾向於使用簡單的模型來產生分析結果,使用者的關聯問題,Slack採用邏輯迴歸的分析方法(Logistic Regression)來分析使用者和訊息之間的關聯,在關聯式資料庫的設計中,將每位使用者所包含的特定類型資訊列為一列(Tuple),像是上百個從訊息的發送者、內容、群組、回覆和互動等擷取出來的統計資訊屬性,迴歸的結果是各屬性權重的陣列,就能透過邏輯函數產生介於0到1的值,再將產生的值轉譯為一個特定使用者可能會回覆特定訊息的機率。

這個問題其實非常複雜,最大的困難在於要在使用者點進去訊息前預測才有用,由於大多數的使用者在Slack中,只參與一小部分的訊息,導致原本使用迴歸的模型產生類別不平衡問題(Class Imbalance Problems),會使得分類器在訓練時產生偏差,Slack表示,分類的結果Negative的數量遠遠超過Positive,而不重要訊息的模型則是將每則訊息預測為No,為了解決這樣的問題,達到高度準確率評估真實的值(Ground Truth),Slack採用許多驗證的技術,像是用分層抽樣的方式當作訓練集。

個人化模型的部分,Slack則是挑選出每位使用者在一個團隊中,不同的屬性權重,事實上,Slack表示,要訓練這麼多的模型,他們擁有的數據太少,因此,Slack將相同行為的使用者歸為同一類,加入從工作圖中得到的每位使用者特定的屬性,來訓練每個團隊中整合的模型。

為了預測使用者回覆特定訊息的可能性,Slack還預測訊息傳送者和接收者的人際關係,來當作幫助使用者接收到訊息時,挑選重要訊息的依據。除此之外,也因為人際關係的預測模式,若是與使用者關係較親近的同事已經回覆某個特定群組,Slack也會將此訊息視為重要訊息。


Advertisement

更多 iThome相關內容