AI趨勢雙周報第15期：TensorFlow發布1.3版，新增多項內建分類器

圖片來源:

GitHub

重點新聞(0819~0901)

深度學習框架　版本更新

TensorFlow發布1.3版，新增多項內建分類器

Google近日又推出TensorFlow 1.3版，新增了多個內建分類器，包含DNNClassifier、DNNRegressor、LinearClassifier、LinearRegressor、DNNLinearCombinedClassifier、DNNLinearCombinedRegressor，另外，內建的封裝檔都改為用深度神經網路函式庫cuDNN 6 ，預計在1.4版更新到cuDNN 7。

TensorFlow從今年正式進入1.0後，改版速度相當快，距離上次更新1.2版才過了不到3個月的時間。Google自2015年底開源釋出自家開發的深度學習框架TensorFlow後，不到半年的時間，TensorFlow就已經成為GiHub上最受歡迎的機器學習專案，目前貢獻者將近千人。Google以Apache 2.0授權模式開放TensorFlow函式庫、相關開發工具、說明文件、範例等資源，並邀請開發人員透過TensorFlow.org參與計畫。

神經網路演算法　深度學習工具

Sony也加入AI大戰！釋出免費深度學習分析軟體，免寫程式用滑鼠拖曳就能完成建模

Sony繼今年6月開源釋出神經網路函式庫之後，近日免費推出Windows版神經網路開發工具（Neural Network Console），讓使用者提高開發深度學習應用的效率。

Sony認為，這是一套適合入門深度學習技術的工具，Sony提供了大量的示範專案，讓使用者可以更快上手深度學習技術，影像、信號和其他可以用向量表示的資料格式，都能夠成為訓練樣本，建構神經網路的演算法，只需要用滑鼠拖曳欲選擇的函式，就能完成一層層的神經網路演算法，設計演算法的過程更容易，還可以透過拖曳和複製貼上的簡易方式，快速設計出大量的神經網路演算法。

設計完神經網路之後，這個工具也提供自建神經網路函式庫，讓使用者可以縮短訓練的過程，最後，評估神經網路的效能，也提供使用者查看每次訓練過程的歷史紀錄，為了優化神經網路演算法，這套神經網路開發工具還可以自動幫使用者挑選出輕量級、高效能的神經網路架構。不過，目前這套工具只有Windows版本，尚未公開Mac OS和Linux版本的發布時間。

圖片來源：Sony

語音辨識技術　深度學習框架

微軟語音辨識技術再突破！辨識能力超越專業聽打記錄員

微軟語音和對話研究團隊近日宣布，該語音辨識技術的錯誤率已經降至5.1%，正式超越專業的聽打記錄人員。微軟在去年10月宣布，運用業界常用的電話錄音測試集Switchboard，微軟語音辨識技術錯誤率為5.9%，與去年發布的正確率相比，微軟用一系列的工具來改善類神經網路聲學和語言模型，來改善此系統的錯誤率，像是，增加了一項結合卷積式網路和雙向的長短期記憶演算法的CNN-BLSTM，雙向的長短期記憶演算法是一種時間遞歸神經網絡（RNN），來改善聲學模型。

此外，微軟還透過聲音的辨識單元Senone、Frame，以及單詞，結合多個聲學模型的預測，作為語音辨識的方法，並利用過去歷史對話紀錄，增強語音辨識的語言模型，來預測對話接下來會講的字詞，藉此讓模型能有效地判斷對話的主題和內容。這項語音辨識使用了微軟自家的深度學習框架CNTK 2.1版，並利用微軟Azure雲端服務，特別是Azure GPU，大幅地提升訓練模型的效率，也能快速地測試新設計的演算法。

圖片來源：微軟

對話機器人　稅務諮詢

中區國稅局將推出Chatbot，首波提供民眾遺產稅及贈與稅諮詢服務

中區國稅局近日宣布，將在今年9月20日正式推出線上文字客服「AI小吉」，提供民眾24小時的稅務諮詢服務。這也是臺灣政府機關第一個推出的Chatbot。中區國稅局表示，由於每年的5月、年初和年底，都會有大量的民眾，打電話詢問綜合所得稅、遺產稅及贈與稅等問題，為了分散諮詢工作，確保民眾都可以獲得資訊，中區國稅局推出線上文字客服「AI小吉」，讓民眾享有24小時的諮詢服務。

中區國稅局服務科陳敏慧表示，第一階段先從較多民眾詢問，且稅目較小的項目開始提供諮詢服務，像是遺產稅和贈與稅，且因為稅法規定較少，在設計的Chatbot的流程較為簡單，之後還會陸陸續續提供更多稅務的諮詢服務。其中，建置的Chatbot的過程中，陳敏慧表示，最困難的是要模擬民眾可能詢問問題的方式，因為稅務機關會以標準的方式表達，但是民眾會以自己的語言來表達問題，這是目前Chatbot還需要經過與民眾互動，慢慢學習的部分。

圖片來源：中區國稅局

迪士尼　語意理解

迪士尼教AI評斷短篇故事的品質，還能預測故事的熱門程度

迪士尼旗下的Disney Research研究實驗室近日教AI學會評斷短篇故事的品質，與美國麻州大學波事頓分校合作，共同開發AI神經網路系統，來分析短篇故事的品質優劣與熱門程度。這套AI系統不需要像專業文學評論專家來評斷文章，而是預測哪些短篇故事會廣受歡迎。不過，要開發出自動評斷故事品質的AI系統，Disney Research面臨的最大挑戰之一就是，缺乏用來訓練AI系統的龐大故事資料庫。

Disney Research採用在社群媒體獲得讀者好評的文章作為評斷故事熱門程度及品質的衡量指標，且從群眾問答網站Quora蒐集了54,484筆資料，並建立一個分類器，標註出28,320筆平均字數達369個字的資料為故事形式。Disney Research解釋，選擇採用Quora網站為資料來源，是因為在Quora網站上，許多答案都是故事的形式。另外，Disney Research為了要能評斷和預測大量的故事品質和熱門程度，開發了不同的神經網路，一個用來分析故事中不同但有關聯性的段落，另一個神經網路則用來分析故事整體的意涵，而AI系統則能藉此預測哪些文本能夠造成讀者的好評。

圖片來源：迪士尼

語音辨識　Alexa

Amazon免費釋出Alexa語音服務硬體開發套件

為了加速Alexa個人助理服務的普及，Amazon已多次向裝置製造商釋出技能及語音服務開發套件。Amazon近日再宣佈提供Alexa語音服務裝置開發套件（Voice Service Device SDK），讓硬體製造商更容易自己的系統軟體中整合Alexa語音辨識及人工智慧能力。 AVS Device SDK包括C++函式庫可使裝置能處理音訊輸入、和Amazon語音服務（AVS）建立連接，及處理Alexa所有互動。此外，它還具備技能代理程式可以結合AVS API處理語音辨識和合成等核心Alexa功能，以及串流媒體、計時與提示、通知、天氣預告等數千種技能。

在此之前Amazon已經邀請了50多家商用裝置廠商試用AVS Device SDK，包括法國電視機上盒廠商Technicolor及德國智慧家庭助理新創公司Senic。現在該SDK連同教學手冊、文件及示範app都將在Github上免費釋出給所有裝置開發商。在語音助理起步較早的Amazon Alexa甚受第三方軟、硬體開發商的歡迎。根據一項統計，截至6月底為止，Alexa技能光是在美國已經超過1.5萬項，大幅超越Google的378項及微軟的65項。

AI趨勢近期新聞

※Google和Walmart合作推出語音購物服務

※微軟揭露深度學習加速平臺專案Brainwave，用FPGA架構加速AI運算效能

※三星語音助理服務Bixby於全球200多國正式上市

※Google利用機器學習追蹤網路上的仇恨言論，並建立美國仇恨言論記錄資料庫

※資料來源：iThome整理，2017年9月。

重點新聞(0819~0901)

TensorFlow發布1.3版，新增多項內建分類器

神經網路演算法 深度學習工具

Sony也加入AI大戰！釋出免費深度學習分析軟體，免寫程式用滑鼠拖曳就能完成建模

語音辨識技術 深度學習框架