英國開放資料研究院創辦人Nigel Shadbolt指出,網路崛起引發不少資料隱私糾紛,未來網路走向,應朝去中心化發展,比如WWW發明人Tim Berners-Lee與MIT正在進行的Solid專案。

圖片來源: 

Nigel Shadbolt

1990年,英國電腦科學家Tim Berners-Lee發明了影響全人類的WWW,揭開數位革命序幕,各地網站自此爆炸式成長,去年甚至衝破了數十億個。

同是英國著名電腦科學家、與Tim Berners-Lee共同創辦英國開放資料研究院(Open Data Institute)的Nigel Shadbolt,在本屆Web Conference大會主題演講中提倡開放資料,更強調AI時代需要發展資料基礎建設。不過,伴隨而來也出現資料隱私問題。放眼未來,「Web應朝去中心化發展,」他說。

20年前,Nigel Shadbolt剛到英國南安普敦大學任教,與提出語意網(Semantic Web)的Tim Berners-Lee成為同事。那時,正值語意網研究熱潮,要在全球資訊網上的文件中,加入電腦可理解的語意(即Metadata),讓網際網路成為通用的資訊交換媒介。

Nigel Shadbolt與同事展開了為期7年的高階知識技術(AKT)專案,利用語意網技術,來收集、整合各種資訊。成果之一是一套電腦科學資訊搜索應用程式CS AKTive Space。

這套程式整合了英國境內與電腦科學社群相關的資料,由上千萬個資源描述框架RDF triples組成內容,也設計了容易上手的UI,讓使用者能以地圖或不同欄位,來查詢英國境內的電腦科學資訊。

這個專案引起了英國政府的注意。「他們好奇,這個方法是否能整合地方政府和中央政府的資料。」Nigel Shadbolt接著說,2009年時,各國開始重視開放資料,當時的英國也不落人後,首相更欽點他和Tim Berners-Lee,來推動政府開放資料。

期間,兩人不斷遇到資料難以取得、資料形式非機器可讀等挑戰,即使如此,他們還是排除萬難,建立了英國政府開放資料網站data.gov.uk,彙整各式資料如犯罪率、回收率、環境資料、醫院和學校概況,甚至是公車動態等。這些公共資料,也儲存於中央政府和地方政府的網站上。

開放資料加重API戲份,資料基礎建設是AI基本功

「在開放資料的過程中,會看見API的重要性。」Nigel Shadbolt以臺灣口罩地圖為例,政府開放了口罩存量資料,民間才得以透過API來打造各種應用。或像英國開放資料研究院疫情開放資料專案,以API提供疫調、確診數、死亡病例、病床數和醫療資源等相關資料。

話鋒一轉,他指出,AI熱浪來襲的今日,開放資料不但重要,「資料基礎建設(Data Infrastructure)更是一大關鍵。」因為,唯有確保資料可用性,才能快速開發AI應用。

他所說的資料基礎建設,包括資料設計,使資料具備高質量、可再現、可互相操作、可保存等特性,此外,還要擬定一套資料治理方法。為推廣這個觀念,他也與Tim Berners-Lee在英國開放資料研究院上,宣導「開放資料即資產」(Open data as an asset)理念。

算力造就網路爆炸式成長,但資料去哪了?

「數位革命帶來許多新資源,這些資源因算力而存在。」Nigel Shadbolt舉例,2000年英特爾處理器的電晶體才2,100萬個,而前年問世的蘋果A12仿生處理器,就擁有近70億個。

硬體革新大力加速了數位化程度,不只全球網路人口連年增長,手機滲透率也日益遽增。但是,手機使用網路所產生的資料,到底去哪了?

為找出答案,2年前,Nigel Shadbolt在任教的牛津大學帶領團隊,進行手機第三方追蹤研究,來找出資料流向。他們從美國和英國的Google Play商店中,下載了100多萬個App,從中分析使用者的資料流。

團隊發現,多數App會將使用者資料,如地理位置、個人資訊、手機特徵、手機ID等,分流給不同對象,像是App功能端、App業者、行銷端和第三方追蹤器等。

舉例來說,使用Airbnb時,使用者部分個資會分流至Google、蘋果、微軟和臉書廣告等App功能端和行銷端。

為進一步了解整體資料流,團隊也設計了一個模擬器X-Ray Refine,可同時模擬多款App,透過調整參數,從視覺化圖表了解每個App的資料流向,以及流向的地理位置等。這個模擬技術,也為資料隱私追蹤打下基礎。

網路技術下一步:去中心化網路

為制衡網路資料使用亂象,近年許多政府透過法規,要求網路科技業者遵守資料使用規範。就連非政府組織也加入行列,要幫助大眾了解個人資料的使用。

還有一種做法,可根本地改善資料隱私問題,Nigel Shadbolt指出,現行的集中式網路架構,資料散落於不同服務提供商,「假設網路本身去中心化,即便使用過程中會接觸到不同服務提供商,使用者資料依然能留在自己的裝置上」,來保護個人資料。

網路去中心化,正是Tim Berners-Lee與美國麻省理工學院正在鑽研的題目。他們展開了Solid專案,要打造一個去中心化的網路平臺,來執行鏈結資料(Linked Data)應用程式,讓使用者完全掌握自己的資料。目標是在保護隱私的前提下共享資料。

架構上,Solid可提供不同的個人線上資料儲存器(POD),讓使用者來存放自己的資料。使用者可授權應用程式,來存取特定POD中的資訊,而且能完全控制每個POD的資料、儲存位置,或是檢查那些應用程式獲授權。

如此一來,使用者不僅能掌握自己的資料,也能在不同裝置和應用程式間,保有相同的資料。Nigel Shadbolt認為,網路去中心化,就是網路技術的新方向。文⊙王若樸


Advertisement

更多 iThome相關內容