四十三歲的摩根是個開朗的中年人,頭髮梳向一邊,彷彿自從小時候他媽媽把梳子沾了水,幫他把頭髮往旁邊梳以後,那撮頭髮就一直留在那兒沒動。他在賓州西部的克立菲德鎮長大,那裡離龐蘇塔尼鎮車程很短。每年二月的第二天,也正是冬至和春分之間,小鎮民眾都會聚集在一起,圍觀籠子裡剛從冬眠中醒來、還昏昏沉沉的土撥鼠,研究這隻土撥鼠看到自己的影子時,有什麼反應。根據克爾特人的古老傳說,這一點點資訊就能告訴他們春天的腳步是否近了,還是一直要等到三月,天氣才會變暖。

摩根的方法比這種小鎮民眾的預測方法進步多了。他在紐約創辦的塔科達公司(Tacoda),僱用統計學家來追蹤我們在網路上漫遊的足跡,並且設法預測我們的下一步。摩根是網路廣告的先驅,他在網路熱期間,創辦了一家叫「24/7 Real Media」的廣告公司。網路泡沫破滅後,他就創辦了塔科達,幾乎毫無縫隙地銜接上他心目中的下一波新浪潮:協助廣告商聚焦於最有可為、最能被廣告訊息打動的上網人口。

塔科達的業務需要大量資料。他們和幾千家線上刊物簽約,其中包括《紐約時報》和《商業周刊》。這些線上刊物的網站容許塔科達將名叫「cookie」的一小段電腦編碼丟進我們的電腦中,塔科達因此可以追蹤我們從一個網站漫遊到另一個網站的路徑。塔科達關注的是我們的行為,並無意探究我們姓啥名誰或掌握其他個人資訊(否則可能會引起反彈,被視為侵犯隱私權)。但塔科達仍然獲得很多資訊。假定你造訪《波士頓環球報》(Boston Globe)的網站,閱讀了一篇關於豐田新車Prius的專欄文章,然後你又瀏覽了美國線上網站(AOL)的汽車相關資訊,很可能你是在尋找市場上有關輪胎的訊息。所以塔科達趁你在網路漫遊的時候,插進一則汽車廣告。你點進去,塔科達就可以從廣告商那兒分到一筆錢——而且又蒐集到更多有關你上網習慣的點點滴滴。塔科達每天都收集到二百億筆這類的網路行為線索。

有時候,摩根的團隊會發現有些在網路漫遊的人同時移動。要找出他們集體移動的原因是一大挑戰,不過一旦弄清楚箇中緣由,廣告商就能預期使用者的線上漫遊行為,而且在他們的漫遊路徑上放置適當的廣告。但要做到這點,需要花心思作研究。

就拿愛情電影迷和租車廣告之間耐人尋味的關係為例,摩根和他的同事為了要了解其中的奧秘,必須深入挖掘手中的數據。是否看完某種型態愛情電影的人,尤其是在某些奇特地點看電影的人,會大批湧去租車?這些人是否還常逛其他相同的網站?答案都藏在我們電腦送出的一連串0與1訊號當中。或許統計數字顯示,電影迷和租車者之間出現的明顯關聯,其實只是統計上的奇怪變化罷了。摩根的團隊也可能因此發掘出更大的趨勢,找出羅曼史和旅行、性慾和流浪癖之間的關係,並因而激發出各種廣告上的創見。無論是哪一種狀況,摩根都能安排數百種測試,從每一次測試中,他都對我們多了一些了解,並且能更準確地針對目標對象作廣告。廣告商過去都只能憑直覺來臆測他所作的這些分析,如今他卻以科學方法取而代之。我們就是他的天竺鼠或土撥鼠,而且我們無休無止地為他工作。

這一切全都是由電腦晶片開的頭
無論是我們的行動電話、汽車控制器、數位相機、當然還有電腦,都要仰仗晶片。每逢節慶,我們打開禮物包裝時,就會有更多晶片進入我們的生活之中。這些晶片能記錄它們接收到的每一個指令和執行的每一項工作。它們是吹毛求疵的記錄者,會記下我們生活中的所有細節。如果單獨拿出來看,每個片段資訊幾乎都毫無意義。但把點點滴滴的資訊組合在一起,呈現出來的型態卻能勾勒出我們的品味和特徵、我們的工作習慣,以及我們在大賣場和超市中購物時走的路徑。

這些資訊流環繞著地球流動。你用行動電話發送笑臉給朋友,你這個小小的動作立刻和數十億其他訊息一起,透過光纖網路快速竄流,發射到衛星上,然後又回到地面,你還沒來得及把手機放回口袋中,這個訊息就已經抵達新加坡的某個伺服器。由於四周有這麼多位元在到處飛舞,我們呼吸的空氣中充斥著各種資訊的微粒。

如果有人能夠好好收集和組織這些四處瀰漫的電子訊息,我們的生活面貌會突然清晰起來,創造出不斷變化、隨時更新的人類行為拼貼圖。這樣的前景已足以令行銷人員興奮不已。一旦他們有辦法分析和我們相關的數據,就能解讀我們的慾望、恐懼和需求,然後精準地向我們推銷我們渴望獲得的東西。

但是,實際狀況沒有這麼簡單。要翻攪這片包含了電子郵件、下載的色情圖片和購物收據等各種數據的汪洋大海,將掀起混亂的波濤。根據comScore研究公司二○○八年的調查,雅虎網站(Yahoo !)單單在一個月內就可以收集到一千一百億筆顧客相關資料。任何人只要造訪過雅虎廣告商的網站,平均都會留下二千五百二十個線索。你可能以為,只要把這些細節拼湊起來,就可以立刻呈現出我們身為購物者、旅行者和工作者的樣貌。但要描繪出如此清晰的樣貌並不容易。

我拜訪雅虎的研究主管普拉赫卡.雷格海文(Prabhakar Raghavan),他告訴我,他們收藏的大部分數據都是數位垃圾,他稱之為「噪音」,這些垃圾很容易就可以淹沒雅虎的電腦。如果雅虎的科學家在搜尋資料庫時,下達了不精確的電腦指令,可能會讓公司的伺服器瘋狂地掃描過龐大的「噪音」達數天之久。但及時修改一下指令,就可以加快搜尋速度高達三萬倍,把原先需要二十四小時的流程縮短為三秒鐘左右。

在數據汪洋中找意義
他的意思是,如果具備了適當的聰明才智,就能夠在幾乎深不可測的數據汪洋中解讀意義。雖然不容易,但仍然可以找出隱藏其中、與我們相關的種種資訊。

唯一能夠解讀這些數據的人是頂尖的數學家、電腦科學家和工程師,他們知道如何把我們生活中的點點滴滴轉化為符號。

為什麼需要這樣做呢?假設你想追蹤一整年中你吃下的每一樣東西。如果你是四年級的小學生,你會到文具店去買厚厚一疊索引卡,然後每一餐都把自己吃過的不同食物記在不同的卡片上。肉餅、菠菜、布丁……。幾天後,你的索引卡愈堆愈高。問題是,你沒有辦法計算或分析你記下來的資訊?卡片上只是一堆字罷了。當然,這些字也都是符號,每個字都代表某個東西或某個概念,但是你幾乎不可能拿這些字來加加減減,或根據這些字來畫出代表趨勢的曲線圖。把這些字堆在一起,結果只是形成專家所謂的「非結構化資料」(unstructured data),其實就是「一團混亂」的意思。比較好的做法是把所有的肉類都用英文字母M來標示,所有綠色蔬菜都以G代表,所有糖果都是C,以此類推。一旦這些文字被簡化為符號,你就可以把它們列在試算表上,計算出,比方說,在某個星期中,你吃了多少肉類或糖果。然後你可以畫一個曲線圖,描述你的飲食內容和體重變化或臉上冒出的青春痘之間的關係。

整個過程的關鍵在於,必須找出相似處、規律和型態。人類本能就懂得這樣做,古早以前,我們就是這樣弄清楚哪些植物可以吃,以及如何說話。但當許多人把心力放在應付特定的挑戰時,其他一些人則偏向象徵性的思考。我可以想像遠古的人類圍坐在火堆旁,有的人正在爭奪更大塊的肉,有的人則忙著求偶儀式。但旁邊有千中選一的寥寥數人卻把玩著石頭,思考著:「如果每個小石頭都代表一頭長毛象,那麼這個小石頭……」托拜斯.丹齊格(Tobias Dantzig)在《數字:科學的語言》中指出,後來羅馬人用「calcula」(小石頭)這個字來代表這樣的思考過程,但這只是起步而已。計算的本質漸漸從數實體的小石頭提升到更高層次的抽象推理過程。

這門科學就此發展了許多世紀,現在有很多專家習於處理數以億計或兆計的龐大數字,那是其他人難以想像或在我們眼中毫無意義的數字。這門科學將我們的日常現實轉變為符號,而這群精於數據運算的專家就是傳遞薪火的人。

隨著人類資訊爆炸,電腦威力愈來愈強,這群大師的權力也愈來愈大。其中有兩個人在一九九○年代後期創辦了Google網站,激起巨大的浪花。Google網站幾乎完全奠基於數學,目的是協助我們找資料。Google把簡單的搜尋引擎轉變為媒體巨擘,它的突破在於發現我們的疑問——我們搜尋網頁時輸入的字——對廣告商而言有莫大的價值。他們找到了把我們的資料變成金錢的方法。其他許多公司也希望能做同樣的事,無論生物界、醫療業、廣告業、體育界或政界都大量僱用數學奇才,他們不斷計算和我們有關的各種數據,於是我們每個人都在不知不覺中被量化了。

半個世紀之前這個流程剛啟動時,電腦是個粗糙的大盒子,體積就和垃圾車差不多大小。對一般人而言,電腦遙不可及,關在有空調的房間裡嗚嗚運轉著。對早期的電腦而言,人類實在太過複雜了,甚至在對弈時,電腦都沒有辦法贏我們。但在某些數字相關領域,它們卻展現出無窮的潛力。

早期有個和消費者信用相關的試驗就是個好例子。一九五六年,兩個史丹佛大學畢業生,數學家比爾.費爾(Bill Fair)和他的工程師朋友厄爾.艾薩克(Earl Issac)想到可以用電腦取代放款人員。銀行放款部門對於鎮上每個家族都有鉅細靡遺的了解,如果他們有意的話,簡直可以為此寫一篇社會學論文,但是銀行業者缺乏科學化的系統來分析所有的資料,因此主要憑直覺來作決定。

相反的,電腦分析把焦點放在一組數字上,主要是申請人的銀行帳戶結餘、債務和利息支付及還款紀錄。費爾和艾薩克創辦了一家公司,專門分析這些數字的型態。他們開發的方法能判定每位顧客無法如期還款的機率,給每個人打個分數,結果證明這些風險評分比人類直覺可靠多了。大多數拿到高信用分數的借款人後來都如期還款,而且有資格貸款的人數也比過去多。畢竟機器完全看數字來判斷,不會有任何歧視,所以人人機會均等,而且和很多分析系統一樣,比較公平。弔詭的是,狹窄的格局換來了寬宏大量的結果,而且許多借款人的表現比放款人員的預期好很多,信用市場因此逐漸擴張。

不過,電腦一直謹守分寸,它從數字的世界起家,也一直待在數字的世界,從事文字、音樂和影像工作的人幾乎沒有察覺到電腦的存在。但未來數十年,電腦的威力將愈來愈強大,每毫秒(千分之一秒)都狼吞虎嚥下更多的0與1。電腦愈來愈便宜,也愈來愈小,而且會和散佈在世界各角落的其他電腦相連結。在我們學人文藝術的人眼中,電腦吞噬了所有的科技,取代了打字機以後,繼續往前推進,如大軍壓境般,一舉擊潰了錄音機和傳統相機,併吞了偉大的電話。我們這些人長期視電腦為來自地下室的異形,是科技怪胎世界中的產物,但到了一九九○年代,連我們都開始在家裡和辦公室為電腦空出位置,因為我們知道,我們可以使用這些機器和世界分享文字和影像。

事實上,我們也別無選擇,因為傳統方法慢如牛步。但有一個條件:我們必須把我們傳送出去的所有訊息、以及和我們生活相關的種種細節,全都轉換為0與1。我們就這樣逐漸將我們的寶貴資產——在地球上與別人溝通和通訊的鑰匙,交到一群精通符號式語言的大師手上。現在這群數學家和電腦科學家各就各位,控制著有關我們生活的種種資訊,我稱他們為「數字搜客」(numerati)。

一個酷熱的夏天午後,摩根告訴我過去一個世代以來行銷方式的轉變。

他說,過去行銷人員都集中心力向大眾市場促銷。從他們的角度看來,我們這些人和通用汽車的生產線沒有太大差別:凱迪拉克和別克汽車屬於有錢人和拚命往上爬的人,中產階級喜歡雪佛蘭,龐狄亞克為喜歡炫耀的年輕人而設計,農民則買貨車。他們只需要知道這些就夠了,因為二十世紀中葉的美國工廠,不管生產的是牛仔褲或花生醬,都採用大量生產的方式。針對特定族群的小量生產成本實在太高了。

摩根說,在這樣的工業時代裡,廣告宣傳是很簡單的事情。你把所有人根據收入、性別和居住地區,區分為五、六類,然後你在他們閱讀的雜誌或觀賞的電視節目上打廣告。在產品幾乎都大同小異的年代,品牌變得非常重要。但如今,這一切都改變了。摩根說:「五十年內,我們會從指揮控制型

消費者為王的年代來臨
為什麼呢?因為今天電腦長驅直入工廠,製造商因此擁有更大的彈性,更容易在早餐食品中加入更多核果,或讓汽水多一些檸檬味。只要一個簡單的指令,就可以讓織布機從織條紋圖案改為織格子圖案。這表示產業界可以推出數以千計的不同產品。全球化早已把全世界的貨品都送到我們家門口,今天,我們幾乎有無窮的選擇。要在擁擠的市場上勝出,需要的不只是工業效率,而是以適當的價格提供我們想要的口味、質地和顏色。摩根說,如今是消費者為王的年代,「市場不再受制於製造商或通路。」

這表示,行銷人員必須把每個人當成不同的個人。其中一個方法是雇大批主修心理學和文學的大學畢業生,手臂下夾著筆記本,挨家挨戶敲門作調查。但是這個做法太不實際了。比較合理的研究方式是追蹤和分析我們不斷吐出的資訊。摩根又更進一步告訴我們,他的團隊正在發展一種實驗,希望可以監控人們注視線上廣告時的認知反應。他們的實驗把焦點放在一種叫「p300」的腦波(美國海軍曾經用類似的試驗,測試飛行員如何在空中分辨友軍和敵軍)。如果測試對象看到廣告後,在不到一秒的時間內就激起「p300」波,那麼塔科達團隊就認為這個人不只在注視廣告,而且還在腦子裡處理所看到的訊息。

下一步是找出哪一種人會對哪一類廣告起反應。摩根和不同產業中的眾多數字搜客一樣,仔細觀察不同的人,並且尋找其中隱藏的關聯性。他會問:我們做的哪些事情可能透露出我們下一步會做什麼?

我和別人提到本書的時候,他們往往感嘆:「我們全都變成一堆數字!」
今天,數字搜客想在我們身上進行的是更加野心勃勃的計畫。忘掉個位數吧!他們希望為我們計算龐大複雜的數據和方程式,也就是建構數學模型。科學家一直運用數學模型來模擬從卡車到核彈的所有事物。他們收集了龐大數據後,建立模型,讓每個數字都代表一項事實或機率。每個模型必須以數字的形式反映物理上的真相:大小和重量、金屬和塑膠特性、對氣壓和溫度的改變有何反應。複雜的模型可能有數千種、甚至百萬種變數,而且在數學的世界中彼此交互作用,就像在真實世界中一樣。建立這些模型是很辛苦的工作,有時候也會失敗。比方說,二○○八年全球金融海嘯就起因於有瑕疵的模型未能忠實反映出房貸市場的複雜情勢和其中包含的風險。

儘管仍有缺失,數字搜客仍然繼續破浪前行,密切注意我們的一舉一動。他們已經把和我們有關的資料位元,編織到可預測的模型中。

當數字搜客把我們轉化為令人暈頭轉向的數字組合時,他們將對我們有何了解呢?

首先,他們必須設法找到我們。無論你是什麼樣的人——即使我們每個人都有多重不同面貌——企業和政府都希望把你找出來,為你定位。想想看:Google因為協助我們找到正確的網頁,而膨脹為數十億美元的大企業。所以,在每一個你想像得到的產業中,如果你能把正確人選找出來,將具有何等的價值?類似這樣的資訊將是千金難買,所有我們扔掉的個人資料都將指出無數條直通我們家門口的路徑。即使你不透露自己的名字,要找到你仍然易如反掌。美國卡內基美崙大學的一項研究顯示,只要曉得美國人的性別、出生年月日和郵遞區號,就能找出其中八七%的人叫什麼名字。

數字搜客也希望改變我們的行為。如果我們正在購物,他們希望能讓我們買更多東西;如果我們是上班族,他們希望提升我們的生產力;如果我們是病人,他們希望能用更低的成本,讓我們更健康。IBM和亞馬遜網路書店等企業正在建構我們的初步模型,他們可以預測我們的行為,同時在我們身上作一些實驗。他們可以模擬商店和辦公室的變化,看看我們如何反應,然後設法利用數學運算,找出提升績效的方法。數字搜客會把我們的模型放在各式各樣的可能情境中,在我們身上嘗試各種不同的處方或廣告方式。他們會看看我們嘗試新運動或調職到遠地後,可能會有什麼反應。我們不需要參與其中,我們甚至渾然不覺我們的數學分身彷彿實驗室白老鼠般,日以繼夜地辛勤操練。我們看到的只是研究的結果——有用的建議、處方或訂單。

這個資訊爆炸的世界是個巨大的人類行為實驗室,是經濟行為和心理學等社會科學的測試場。微軟和雅虎等公司的研究人員忙著聘請從醫學到語言學等各個領域的科學家,協助他們掌握從我們生活點滴中湧出的龐大資訊。這些數位化的資訊流完全不受古老疆界的限制,它們都透過演算法來定義,而非根據學門來分類,因此很容易就可以相互滋養。這表示心理學家、經濟學家、生物學家和電腦科學家可以用前所未有的方式密切合作,大家都過濾無數關於我們生活的種種細節後,從中找出答案。

紐約新媒體公司Inform Technologies的首席科學家傑克.艾荷恩(Jack Einhorn)預測,二十一世紀的偉大發現將來自於從龐大數據中找出型態。「下一個如沙克(註:小兒麻痺症沙克疫苗的發明人)般對世界造成巨大影響力的人,將是數學家。」(摘錄整理自前言)


當我們變成一堆數字
(The Numerati)
史蒂芬.貝克(Stephen Baker)/著;齊若蘭/譯
遠流出版
售價:350元

《作者簡介》
史蒂芬.貝克(Stephen Baker)

© Jalaire Craver
美國資深媒體觀察家與部落客。為美國《商業周刊》撰稿超過二十年,同時也在《華爾街日報》、《洛杉磯時報》與《波士頓環球報》發表文章。曾以墨西哥汽車產業興起專題報導榮獲海外記者協會獎。
他與友人共同經營的部落格〈Blogspotting.net〉被《紐約時報》評為五十個最值得關注的部落格之一。

 

熱門新聞

Advertisement