全站文章
iT邦幫忙
首 頁
新 聞
技 術
IT管理
研討會
iT邦幫忙
iT邦部落格
小7聚樂部
│
訂閱電子報
│
加入會員
│
RSS訂閱
│
新 聞
新 聞 專 題
即 時 新 聞
新 聞 簡 訊
技 術
產 品 報 導
技 術 專 題
IT 書 訊
IT管理
CIO
IT 人 物
專 欄
新 聞 總 覽
業 界 動 態
iThome Online提供免費電子報,現在就訂,最新IT訊息每日寄達。
iThome 每日新聞報
iThome 產品技術報
加入iThome Online會員,立即使用討論區、Blog等服務。
•
免費加入會員
•
登入
/
登出
•
管理會員帳號
•
忘記帳號密碼
•
聯絡客服
•
訂閱周刊
•
讀者服務
•
09'e政府專刊No.2 (35)
•
09'e教育專刊(34)
•
09'e政府專刊(33)
•
08'企業資安專刊-端點安全防護(32)
•
08'企業採購情報誌(31)
•
07'資訊安全技術應用專刊(30)
•
07' 新世代資料中心專刊(29)
•
07'企業資安技術應用專刊(28)
•
企業採購情報誌'06冬季號(27)
•
企業軟體技術應用專刊(25)
•
企業資安技術應用專刊(24)
書摘─「數字搜客」時代已經來臨
文/
iThome
(記者) 2009-06-12
隨著資訊爆炸,電腦威力愈來愈強,數字搜客的權力也愈來愈大。他們能把我們使用行動電話、瀏覽網頁、信用卡等點點滴滴的資訊組合在一起,進一步勾勒出我們的品味、特徵……
全球智匯
當我們變成一堆數字
(The Numerati)
史蒂芬.貝克(Stephen Baker)/著;齊若蘭/譯
遠流出版
售價:350元
四十三歲的摩根是個開朗的中年人,頭髮梳向一邊,彷彿自從小時候他媽媽把梳子沾了水,幫他把頭髮往旁邊梳以後,那撮頭髮就一直留在那兒沒動。他在賓州西部的克立菲德鎮長大,那裡離龐蘇塔尼鎮車程很短。每年二月的第二天,也正是冬至和春分之間,小鎮民眾都會聚集在一起,圍觀籠子裡剛從冬眠中醒來、還昏昏沉沉的土撥鼠,研究這隻土撥鼠看到自己的影子時,有什麼反應。根據克爾特人的古老傳說,這一點點資訊就能告訴他們春天的腳步是否近了,還是一直要等到三月,天氣才會變暖。
摩根的方法比這種小鎮民眾的預測方法進步多了。他在紐約創辦的塔科達公司(Tacoda),僱用統計學家來追蹤我們在網路上漫遊的足跡,並且設法預測我們的下一步。摩根是網路廣告的先驅,他在網路熱期間,創辦了一家叫「24/7 Real Media」的廣告公司。網路泡沫破滅後,他就創辦了塔科達,幾乎毫無縫隙地銜接上他心目中的下一波新浪潮:協助廣告商聚焦於最有可為、最能被廣告訊息打動的上網人口。
塔科達的業務需要大量資料。他們和幾千家線上刊物簽約,其中包括《紐約時報》和《商業周刊》。這些線上刊物的網站容許塔科達將名叫「cookie」的一小段電腦編碼丟進我們的電腦中,塔科達因此可以追蹤我們從一個網站漫遊到另一個網站的路徑。塔科達關注的是我們的行為,並無意探究我們姓啥名誰或掌握其他個人資訊(否則可能會引起反彈,被視為侵犯隱私權)。但塔科達仍然獲得很多資訊。假定你造訪《波士頓環球報》(Boston Globe)的網站,閱讀了一篇關於豐田新車Prius的專欄文章,然後你又瀏覽了美國線上網站(AOL)的汽車相關資訊,很可能你是在尋找市場上有關輪胎的訊息。所以塔科達趁你在網路漫遊的時候,插進一則汽車廣告。你點進去,塔科達就可以從廣告商那兒分到一筆錢——而且又蒐集到更多有關你上網習慣的點點滴滴。塔科達每天都收集到二百億筆這類的網路行為線索。
有時候,摩根的團隊會發現有些在網路漫遊的人同時移動。要找出他們集體移動的原因是一大挑戰,不過一旦弄清楚箇中緣由,廣告商就能預期使用者的線上漫遊行為,而且在他們的漫遊路徑上放置適當的廣告。但要做到這點,需要花心思作研究。
就拿愛情電影迷和租車廣告之間耐人尋味的關係為例,摩根和他的同事為了要了解其中的奧秘,必須深入挖掘手中的數據。是否看完某種型態愛情電影的人,尤其是在某些奇特地點看電影的人,會大批湧去租車?這些人是否還常逛其他相同的網站?答案都藏在我們電腦送出的一連串0與1訊號當中。或許統計數字顯示,電影迷和租車者之間出現的明顯關聯,其實只是統計上的奇怪變化罷了。摩根的團隊也可能因此發掘出更大的趨勢,找出羅曼史和旅行、性慾和流浪癖之間的關係,並因而激發出各種廣告上的創見。無論是哪一種狀況,摩根都能安排數百種測試,從每一次測試中,他都對我們多了一些了解,並且能更準確地針對目標對象作廣告。廣告商過去都只能憑直覺來臆測他所作的這些分析,如今他卻以科學方法取而代之。我們就是他的天竺鼠或土撥鼠,而且我們無休無止地為他工作。
這一切全都是由電腦晶片開的頭
無論是我們的行動電話、汽車控制器、數位相機、當然還有電腦,都要仰仗晶片。每逢節慶,我們打開禮物包裝時,就會有更多晶片進入我們的生活之中。這些晶片能記錄它們接收到的每一個指令和執行的每一項工作。它們是吹毛求疵的記錄者,會記下我們生活中的所有細節。如果單獨拿出來看,每個片段資訊幾乎都毫無意義。但把點點滴滴的資訊組合在一起,呈現出來的型態卻能勾勒出我們的品味和特徵、我們的工作習慣,以及我們在大賣場和超市中購物時走的路徑。
這些資訊流環繞著地球流動。你用行動電話發送笑臉給朋友,你這個小小的動作立刻和數十億其他訊息一起,透過光纖網路快速竄流,發射到衛星上,然後又回到地面,你還沒來得及把手機放回口袋中,這個訊息就已經抵達新加坡的某個伺服器。由於四周有這麼多位元在到處飛舞,我們呼吸的空氣中充斥著各種資訊的微粒。
如果有人能夠好好收集和組織這些四處瀰漫的電子訊息,我們的生活面貌會突然清晰起來,創造出不斷變化、隨時更新的人類行為拼貼圖。這樣的前景已足以令行銷人員興奮不已。一旦他們有辦法分析和我們相關的數據,就能解讀我們的慾望、恐懼和需求,然後精準地向我們推銷我們渴望獲得的東西。
但是,實際狀況沒有這麼簡單。要翻攪這片包含了電子郵件、下載的色情圖片和購物收據等各種數據的汪洋大海,將掀起混亂的波濤。根據comScore研究公司二○○八年的調查,雅虎網站(Yahoo !)單單在一個月內就可以收集到一千一百億筆顧客相關資料。任何人只要造訪過雅虎廣告商的網站,平均都會留下二千五百二十個線索。你可能以為,只要把這些細節拼湊起來,就可以立刻呈現出我們身為購物者、旅行者和工作者的樣貌。但要描繪出如此清晰的樣貌並不容易。
我拜訪雅虎的研究主管普拉赫卡.雷格海文(Prabhakar Raghavan),他告訴我,他們收藏的大部分數據都是數位垃圾,他稱之為「噪音」,這些垃圾很容易就可以淹沒雅虎的電腦。如果雅虎的科學家在搜尋資料庫時,下達了不精確的電腦指令,可能會讓公司的伺服器瘋狂地掃描過龐大的「噪音」達數天之久。但及時修改一下指令,就可以加快搜尋速度高達三萬倍,把原先需要二十四小時的流程縮短為三秒鐘左右。
在數據汪洋中找意義
他的意思是,如果具備了適當的聰明才智,就能夠在幾乎深不可測的數據汪洋中解讀意義。雖然不容易,但仍然可以找出隱藏其中、與我們相關的種種資訊。
唯一能夠解讀這些數據的人是頂尖的數學家、電腦科學家和工程師,他們知道如何把我們生活中的點點滴滴轉化為符號。
為什麼需要這樣做呢?假設你想追蹤一整年中你吃下的每一樣東西。如果你是四年級的小學生,你會到文具店去買厚厚一疊索引卡,然後每一餐都把自己吃過的不同食物記在不同的卡片上。肉餅、菠菜、布丁……。幾天後,你的索引卡愈堆愈高。問題是,你沒有辦法計算或分析你記下來的資訊?卡片上只是一堆字罷了。當然,這些字也都是符號,每個字都代表某個東西或某個概念,但是你幾乎不可能拿這些字來加加減減,或根據這些字來畫出代表趨勢的曲線圖。把這些字堆在一起,結果只是形成專家所謂的「非結構化資料」(unstructured data),其實就是「一團混亂」的意思。比較好的做法是把所有的肉類都用英文字母M來標示,所有綠色蔬菜都以G代表,所有糖果都是C,以此類推。一旦這些文字被簡化為符號,你就可以把它們列在試算表上,計算出,比方說,在某個星期中,你吃了多少肉類或糖果。然後你可以畫一個曲線圖,描述你的飲食內容和體重變化或臉上冒出的青春痘之間的關係。
整個過程的關鍵在於,必須找出相似處、規律和型態。人類本能就懂得這樣做,古早以前,我們就是這樣弄清楚哪些植物可以吃,以及如何說話。但當許多人把心力放在應付特定的挑戰時,其他一些人則偏向象徵性的思考。我可以想像遠古的人類圍坐在火堆旁,有的人正在爭奪更大塊的肉,有的人則忙著求偶儀式。但旁邊有千中選一的寥寥數人卻把玩著石頭,思考著:「如果每個小石頭都代表一頭長毛象,那麼這個小石頭……」托拜斯.丹齊格(Tobias Dantzig)在《數字:科學的語言》中指出,後來羅馬人用「calcula」(小石頭)這個字來代表這樣的思考過程,但這只是起步而已。計算的本質漸漸從數實體的小石頭提升到更高層次的抽象推理過程。
這門科學就此發展了許多世紀,現在有很多專家習於處理數以億計或兆計的龐大數字,那是其他人難以想像或在我們眼中毫無意義的數字。這門科學將我們的日常現實轉變為符號,而這群精於數據運算的專家就是傳遞薪火的人。
隨著人類資訊爆炸,電腦威力愈來愈強,這群大師的權力也愈來愈大。其中有兩個人在一九九○年代後期創辦了Google網站,激起巨大的浪花。Google網站幾乎完全奠基於數學,目的是協助我們找資料。Google把簡單的搜尋引擎轉變為媒體巨擘,它的突破在於發現我們的疑問——我們搜尋網頁時輸入的字——對廣告商而言有莫大的價值。他們找到了把我們的資料變成金錢的方法。其他許多公司也希望能做同樣的事,無論生物界、醫療業、廣告業、體育界或政界都大量僱用數學奇才,他們不斷計算和我們有關的各種數據,於是我們每個人都在不知不覺中被量化了。
半個世紀之前這個流程剛啟動時,電腦是個粗糙的大盒子,體積就和垃圾車差不多大小。對一般人而言,電腦遙不可及,關在有空調的房間裡嗚嗚運轉著。對早期的電腦而言,人類實在太過複雜了,甚至在對弈時,電腦都沒有辦法贏我們。但在某些數字相關領域,它們卻展現出無窮的潛力。
早期有個和消費者信用相關的試驗就是個好例子。一九五六年,兩個史丹佛大學畢業生,數學家比爾.費爾(Bill Fair)和他的工程師朋友厄爾.艾薩克(Earl Issac)想到可以用電腦取代放款人員。銀行放款部門對於鎮上每個家族都有鉅細靡遺的了解,如果他們有意的話,簡直可以為此寫一篇社會學論文,但是銀行業者缺乏科學化的系統來分析所有的資料,因此主要憑直覺來作決定。
相反的,電腦分析把焦點放在一組數字上,主要是申請人的銀行帳戶結餘、債務和利息支付及還款紀錄。費爾和艾薩克創辦了一家公司,專門分析這些數字的型態。他們開發的方法能判定每位顧客無法如期還款的機率,給每個人打個分數,結果證明這些風險評分比人類直覺可靠多了。大多數拿到高信用分數的借款人後來都如期還款,而且有資格貸款的人數也比過去多。畢竟機器完全看數字來判斷,不會有任何歧視,所以人人機會均等,而且和很多分析系統一樣,比較公平。弔詭的是,狹窄的格局換來了寬宏大量的結果,而且許多借款人的表現比放款人員的預期好很多,信用市場因此逐漸擴張。
不過,電腦一直謹守分寸,它從數字的世界起家,也一直待在數字的世界,從事文字、音樂和影像工作的人幾乎沒有察覺到電腦的存在。但未來數十年,電腦的威力將愈來愈強大,每毫秒(千分之一秒)都狼吞虎嚥下更多的0與1。電腦愈來愈便宜,也愈來愈小,而且會和散佈在世界各角落的其他電腦相連結。在我們學人文藝術的人眼中,電腦吞噬了所有的科技,取代了打字機以後,繼續往前推進,如大軍壓境般,一舉擊潰了錄音機和傳統相機,併吞了偉大的電話。我們這些人長期視電腦為來自地下室的異形,是科技怪胎世界中的產物,但到了一九九○年代,連我們都開始在家裡和辦公室為電腦空出位置,因為我們知道,我們可以使用這些機器和世界分享文字和影像。
事實上,我們也別無選擇,因為傳統方法慢如牛步。但有一個條件:我們必須把我們傳送出去的所有訊息、以及和我們生活相關的種種細節,全都轉換為0與1。我們就這樣逐漸將我們的寶貴資產——在地球上與別人溝通和通訊的鑰匙,交到一群精通符號式語言的大師手上。現在這群數學家和電腦科學家各就各位,控制著有關我們生活的種種資訊,我稱他們為「數字搜客」(numerati)。
一個酷熱的夏天午後,摩根告訴我過去一個世代以來行銷方式的轉變。
他說,過去行銷人員都集中心力向大眾市場促銷。從他們的角度看來,我們這些人和通用汽車的生產線沒有太大差別:凱迪拉克和別克汽車屬於有錢人和拚命往上爬的人,中產階級喜歡雪佛蘭,龐狄亞克為喜歡炫耀的年輕人而設計,農民則買貨車。他們只需要知道這些就夠了,因為二十世紀中葉的美國工廠,不管生產的是牛仔褲或花生醬,都採用大量生產的方式。針對特定族群的小量生產成本實在太高了。
摩根說,在這樣的工業時代裡,廣告宣傳是很簡單的事情。你把所有人根據收入、性別和居住地區,區分為五、六類,然後你在他們閱讀的雜誌或觀賞的電視節目上打廣告。在產品幾乎都大同小異的年代,品牌變得非常重要。但如今,這一切都改變了。摩根說:「五十年內,我們會從指揮控制型
1
/
2
▼ ADVERTISEMENT ▼
▲ ADVERTISEMENT ▲
最新問答
[轉] 加退保資料遭駭客入侵 健保局提高資安監控
(shunyuan)
架VPN 中國網通與中國電信的問題
(wgsp)
如何記錄Oracle report 實際輸出時間
(agogo3391)
WSUS 用戶端回報問題
(takaki)
提供購物車系統的公司這麼多,哪一家比較好?
(celia812)
可以自動指定各種文件的列印格式嗎??
(yansan)
請問如何在windows7下執行C語言的編譯程式及程式何處可以下載
(jemy)
型男把妹必備--折凳
(cafequeen)
進不去外國網站
(hune75711)
三論專案的價格與成本
(franklintmc)
關於 IE7 的網址列
(koyoco)
[有話大聲說]Facebook好八卦啊∼
(cafequeen)
Office EXCEL,WORD無法存檔
(klm2242)
收到這樣的mail 是 什麼意思?還是病毒?
(kolom)
DNS錯誤,事件代碼4515
(lobo)
譯:Android 被 Linux kernel 社群開除
(shunyuan)
區域網路中毒影響主機遠端速度?如何解決
(allenhaw)
請推薦 Windows Server 2008 參考書籍
(arrigi)
側錄並備份
(bin89)
Excel 存檔/另存新檔時,無故變成異常很大?
(pcgo7)
熱門主題
我收了Google送的大紅包
(bluejack)
預測 G.ho.st 雲端服務的下一步
(superstanwu)
* 雲端運算安全趨勢*Google 攻擊並非雲端攻擊
(domynews)
趨勢科技成立子公司騰雲計算 全力開發雲端技術超歐趕美(含開放職缺一覽表)
(domynews)
"不花一毛錢,就擁有上頓粉絲"微網誌的社交工程陷阱
(domynews)
危機處理差 豐田神話恐幻滅
(atlantischiu)
賈伯斯的『重新定義』和『全面進化』
(atlantischiu)
木馬散播強尼.戴普Johnny Depp假死訊
(domynews)
投資訊息 2010-02-03 瑞儀上月營收增逾10%,左擁蘋果,供應iPad背光模組30萬台;右抱三星,增加第二條LCM產線
(atlantischiu)
春節出國旅遊 線上訂票 當心還沒走透透 隱私偷光光?!
(domynews)
一個好用的軟體安裝下載網站:Ninite
(atlantischiu)
投資訊息 2010-02-02 郭台銘將續掌舵十年,鴻海艦隊成型,談景氣,上半年沒問題,下半年要看各國政策;談股價,今年有機會衝上200元
(atlantischiu)
使用 WebDAV 方式連接 G.ho.st 雲端空間
(superstanwu)
Universal Extractor
(bigcandy)
企業必修「蘋果學」低利潤、低售價、低門檻、缺軟體四大危機
(atlantischiu)
情人節禮物:維多利亞內衣給的秘密禮物,真是毒一無二
(domynews)
[分享不分大小事]台灣熊的讀友的福利不要錯過∼送技嘉主機板的機會喔!
(gric)
WMI語法:E-Mail主機系統資源記錄檔
(jojochen)
投資訊息 2010-02-04 LED廠元月大放光芒,一詮營收年增近二倍,創海嘯來新高,華興攻頂,晶電、億光也成長
(atlantischiu)
賓果遊戲券產生器
(jamesjan)
電週文化事業版權所有、轉載必究 •Copyright © iThome |
刊登廣告
|
授權服務
|
服務信箱
|
隱私權聲明與會員使用條款
|
關於iThome
|
|