Seeing AI結合影像辨識、自然語言等技術,只要以手機上的相機對準人物,就會以語音描述眼前戴著眼鏡看起來很開心的28歲女性。

圖片來源: 

Microsoft

微軟本周三(7/12)釋出了基於人工智慧(AI)的 Seeing AI行動程式,它可利用行動裝置的攝影鏡頭拍攝周遭的人、事、物,並透過朗讀功能以語音向視障人士描述圍繞著他們的世界。

Seeing AI專案源自於微軟內部在2015年舉行的Oneweek Hackathon黑客松競賽,並在去年成為由Microsoft Research負責培育的專案之一,它運用了廣泛的AI技術,包括電腦視覺/影像/語音辨識技術、自然語言處理技術、機器學習技術,以及微軟的文件辨識技術Office Lens等,因此,它能即時唸出攝影機所拍攝的文字,能夠藉由掃描產品條碼而以語音說明,還能幫使用者辨識人臉,或是描述周遭環境。

Seeing AI介紹影片(來源:微軟):

 

微軟無障礙部門的技術傳道者Daniel Hubbell表示,Seeing AI並非企圖取代導盲犬或手杖,而是為了讓視障人士能存取更多的資訊,透過技術改善他們的日常生活。

在盲人廣播節目Main Menu中負責評論行動程式與技術的Jenine Stanley表示,Seeing AI的速度及好用程度讓她印象非常深刻,光是能夠即時讀取號誌、標籤或文字片段的功能就值得下載該程式。

不過,目前Seeing AI只支援iOS平台,已於美國、加拿大、印度、香港、紐西蘭與新加坡等6個市場的App Store上架。

 

熱門新聞

Advertisement