語音辨識 | iThome

女媧創造推出可以分眾行銷和會員經營的服務機器人，企業用戶還能用No-code開發工具設計專屬服務內容

這款服務機器人，不只能用於送餐收餐、行銷內容播放，還搭載AI語音及影像辨識功能，結合No-code開發工具，可以開發多種進階機器人應用，包括AI語音客服、實體消費數據蒐集、自動化分眾行銷、會員再行銷等，使機器人可以支援更多種形態的服務。

2023-10-25

| Meta | 語音辨識 | TTS

Meta運用聖經譯本與錄音改進語音模型，現可支援超過千種語言

Meta新的多語言語音辨識模型MMS能夠處理1,107種語言，在語音和文字間轉換，同時還能辨識超過4,000種的口說語言

2023-05-23

| 國民法官法庭 | 語音辨識 | 司法院 | AI

法庭語音辨識應用大圖解

司法院在國民法官法庭首次引進AI語音辨識技術，打造出專用於支援法律專業詞彙的語辨引擎

2023-05-05

| 德州 | google | 隱私 | 人臉 | 語音辨識 | 生物特徵

Google擅自蒐集人臉及語音辨識資料，遭德州控告

德州檢察長認為Google Photos、Google Assistant與Nest Hub Max等服務或裝置，因濫用使用者的生物特徵資料而違反《取得或使用生物識別法令》

2022-10-21

Google及微軟等五大科技業者加入語音無障礙專案

Amazon、蘋果、Google、Meta與微軟承諾支援美國伊利諾大學香檳分校的語音無障礙專案（Speech Accessibility Project），該專案目的是提高語音辨識技術對各種身心障礙族群的支援度

2022-10-04

| Whisper | Open AI | 語音辨識 | ASR | 翻譯 | 開源 | 神經網路

Open AI開源自動語音辨識系統Whisper

Open AI強調Whisper神經網路的英文語音辨識能力，已達到人類水準

2022-09-22

零售IT雙周報第7期：統一超商開始測試短程機器人外送及偏鄉無人機外送服務

本周零售IT雙周報重點：統一超商將測試兩種型態的無人外送服務；美國連鎖餐廳在店內設置無人收銀商品區；印度連鎖超市將完整購物旅程整合進通訊軟體Whatsapp；美國零售巨頭Walmart推出外送進顧客車庫內的新型服務

2022-09-02

| AI | 語音辨識 | 圖文生成 | Transformer | 自監督 | 抓臭蟲 | 微軟 | IT周報

AI趨勢周報第184期：會聽也會讀唇語！Meta AI研究院開源新模型讓語音辨識更精準

Meta AI研究院用Transformer打造出能聽又能讀唇語的語音辨識模型；百度推出中文界最大跨模態圖文生成預訓練模型「文心ERNIE-ViLG」；微軟用自監督AI抓程式碼臭蟲，效能提高3成；蘋果打造最大的室內3D場景AR資料集。

2022-01-13

Meta開發能邊聽邊看的語音辨識模型，語音轉文字錯誤率大幅下降

Meta新的語言模型AV-HuBERT，能夠連結語音和影像中說話者的嘴唇動作，提升語音辨識抗噪效果，使單字錯誤率大幅下降

2022-01-11

| MLCommons | 關鍵字 | 資料集 | 語音辨識 | Multilingual Spoken Words Corpus | 開源 | 語音助理

MLCommons釋出多語言口語大型語音辨識資料集

這個以CC-BY 4.0授權釋出的MSWC資料庫，包含50種語言的音訊資料，而MSWC是其中46種語言第一個開源口語資料集。

2021-12-17

AI趨勢周報第181期：Meta開源懂128種語言的語音辨識預訓練模型

Meta旗下臉書AI研究院開源XLS-R，是一套具20億參數、跨128種語言的語音辨識預訓練模型；AWS在re:Invent年會上發表機器人管理服務IoT RoboRunner；GCP新增AI對話新功能，中小企業不必寫程式也能打造好用的Chatbot；字節跳動以BERT架構打造SOTA等級影像辨識新模型。

2021-12-02