在網際網路媒體出現後,不但提供了更多小眾化的資訊,更有不少網站針對每個人不同的特質,推出所謂的個人化行銷;該如何利用資料探勘技術,由複雜無序的資訊中,找出上網者個人的喜好,也成為學界競相研究的主題。
台灣科技大學電機系副教授卓政宏目前正在進行資料探勘的研究,其研究領域主要著重在資料庫,並承接了國科會虛擬半導體廠整合型計劃中,有關資料庫探勘的子計劃,利用生產資料及結果來找出生產機件及良率之間的關係。
卓政宏表示,最近網路上有愈來愈多的網站利用資料探勘技術來找出上網者的特性,以配合網站所進行的個人化行銷,也使得許多教授投入資料探勘研究。
卓政宏指出,一般在網路上分析上網者的特性其實可用統計的方法來進行,不過,必須事先知道資料中誰與誰可能有關係,而資料探勘更可能尋找出無法依直覺判斷出來的特性,使用者通常不曉得究竟由資料中可以發現什麼,卻能藉由資料探勘發現某些規則。
一般而言,由資料探勘技術於資料庫中發現的規則,並無所謂的對錯可言,而是由資料數量的多寡來決定得出規則的可信程度。
卓政宏將由資料探勘可得的規則分為三類,分別是分類、分群及關係。以台灣搜尋引擎所做的網頁分類為例,卓政宏認為,當搜尋網站利用人工所進行的分類達到某一數量時,便可用資料探勘技術以產生出個人分類的規則,未來程式的分類即可取代人工分類,節省人力成本。
在分群的部份,對一目標資料庫進行分組,每一組將依特性自動分類,並描述出每一組別的特性。而關係則是資料探勘最早被運用的領域,尋找資料庫中物品的相互關係,例如在商品買賣的資料庫中,可以發現某些物品常同時被購買等直覺上無法感受到的關係皆能用資料探勘技術來取得。
卓政宏定義資料探勘,是藉由隱涵於資料庫中的資訊,找出原來不知道的資訊及關係,這些資訊及關係必須是有用的資訊或規則。
熱門新聞
2026-01-16
2026-01-16
2026-01-18
2026-01-16
2026-01-18
2026-01-16