| Meta | BERT | 語音轉文字 | 語音辨識 | AV-HuBERT

Meta開發能邊聽邊看的語音辨識模型,語音轉文字錯誤率大幅下降

Meta新的語言模型AV-HuBERT,能夠連結語音和影像中說話者的嘴唇動作,提升語音辨識抗噪效果,使單字錯誤率大幅下降

2022-01-11