挪威瀏覽器開發業者Opera在周三(10/15)發表了一項新計畫,指出該公司正開發一個稱為元資料分析及採礦應用(Metadata Analysis and Mining Application,MAMA)的搜尋引擎,專門蒐蘿並分析全球網站的網頁及結構,協助瀏覽器開發業者及標準組織打造更標準化及相容的全球網路。新的MAMA搜尋引擎預計在未來幾個月內公開發表。

Opera開發人員Brian Wilson表示,網路搜尋引擎通常只關心網頁上的文字內容,但很少人關心網頁的架構,像是想知道哪些網頁擁有100個以上的連結,或是有多少網頁採用CSS。

而MAM則是檢視全球的網頁,同時傳回網頁所使用的HTML、CSS及script等相關資訊,或是網頁是否經過W3C的HTML認證等,可以協助網路開發人員找到某些功能的使用範例,或是觀察網路趨勢,以及判斷是否要引進新技術等。同時可以讓標準組織理解新技術或標準的採用率,並藉以了解實際的全球網路,最終將能提昇全球網路及瀏覽器的品質及互動。Opera表示。

Opera已經過濾了全球350萬個網頁,以蒐集及分析其結構資訊,透過MAMA可以查詢各種議題;Opera初步列出了透過MAMA所發現的重要資訊,例如在網路伺服器的使用上,Apache仍以67.72%的市佔率高過微軟的IIS(25.91%);在文件架構及大小上,發現網路上的文件平均有1.65萬字元,使用HTML格式的文件凌駕使用XTML的文件,約為2:1。

此外,MAMA透過W3C的標記驗證服務分析每一個獨立的網址,以檢驗網頁上諸如HTML、XHTML、SMIL及MathML等網頁文件的有效性,發現只有4.13%的網頁通過認證,而且,那些陳列出W3C驗證標的網站中,只有50%實際通過驗證。

MAMA也可用來尋找特定應用的普及,例如分析發現使用Flash外掛程式的網站比例達33.5%,其中中國網站使用Flash的比例最高,佔67%,土耳其居次,佔60%。MAMA亦確認串接樣式表(Cascading Style Sheets,CSS)為主要的網路技術,總計有80.39%的網站採用CSS。(編譯/陳曉莉)

熱門新聞

Advertisement