大數據時代下,「資料探勘」技術在結構性較差的文本數據有許多應用,其分析加值工作涉及資訊擷取(information retrieval)、自然語言處理(natural language processing)與資料探勘等跨學科領域,終極任務是對文件或詞項進行分類、集群與概念提取等工作。簡言之,文字資料探勘(Text Mining)是從非結構化的文字中,萃取出有用的重要資訊或知識,可說是自然語言處理(Natural Language Processing)的應用。傳統媒體與網路新媒體中大部分的資訊皆以文字儲存,透過文字探勘技術,能挖掘出潛在商業價值!

資策會「R語言-文字資料探勘實作班」,課程涵蓋文字資料分析與探勘的主要技術,著重於自然語言處理的統計基礎。從單字、語法到語義逐步處理的實作方式,以自然語言處理流程貫穿中英文文字案例的講解,期能讓學員運用R,挖掘潛藏於組織內外部文字資料中的價值。

2019/4/27-4/28台北週末班開課,2019/4/19前報名享早鳥優惠,兩人同行再享團報優惠,快揪同事一起進修。課程詳情:https://www.iiiedu.org.tw/TEXT(資策會廣告)


Advertisement

更多 iThome相關內容