年度百大
【2013年度之最│書籍館】我們過去留下的資料軌跡,將成為我們認識未來世界的最好起點──《大數據》
作者:陶比獅 / 2013-12-16 瀏覽次數(8713)
從你閱讀的第一眼開始,你的網頁瀏覽時間、IP位置、網頁點擊數、搜尋過的字眼、手機耗電量、信用卡消費記錄,甚至今天是否去看牙醫、公司大樓的電梯運轉情況,所有沒發生或在發生的事件都正被記錄更新著;而且對於許多想了解你的他人或企業而言,你所留下的資料軌跡比起你本人,更能代表你。
千禧年之後,我們的資訊社會開始了天翻地覆的巨變。當經濟走到停滯之際,網路科技,卻持續出現不停進化的機會與價值;如今要面對未來,個人與社會都不再處於被動與等待的姿態,很幸運地我們走到了這個時代,足以見證「巨量資料」對於「預測未來」的廣泛影響,其中有樂觀的想像與預期的討論,也有反思與限制的深究;不一定要具科技專業背景或身處大規模企業,透過這一本《大數據》俐落踏實的解釋與探討,輕易地就喚起我們對自身處境一點一滴的敏感度;而今年同事們在選書會議桌上所激起的各種意見與討論,都表達出了我們確實深切地感受,數據知識與我們生活的連動性與新轉變。
把時間轉回2000年,當時全球資訊有3/4仍是以紙張、膠卷與黑膠唱片等有形類比方式儲存,其餘1/4屬於數位形式儲存的資料;然而進展到2007年,全世界大約只剩下7%資料為類比形式,其他全為數位化資料!資料成長速度與轉換之快,宣示全球正式邁入巨量資料的時代,我們不得不重新分析看待這些資訊,資訊量已從「量」發生「質」的改變,像是重獲新生般,成為新商業生產原料、以及重要的經濟資源投入,進而創造出新形式的經濟價值──當這些資料開始說話時,可以告訴我們的事情包羅萬象,像是:
.可以知道機票何時買最划算。(出國旅行)
.亞馬遜比你更早知道你喜歡哪本書。(網路購物)
.從汽車烤漆的顏色就知道這輛車的故障率高低。(買二手車)
.教師可以從某節課程被點閱的次數了解學生的問題所在。(網路教學)
.從Twitter上訊息的情感傾向來預測未來盤勢。(投資操盤)
.Google將比公家衛生機關更早預測流感的爆發時間與地點。(掌握疫情)
.從追蹤早產兒的生命徵象,預測是否會爆發感染。(新生兒健康)
事實就是,我們早已深陷在緊密交織的網狀資訊世界中。
開始擁抱雜亂、拋下成見,我們理解與探索世界的方式,將一步步改變
要坦然面對巨量資訊的潮流,從資訊提煉有意義的效用,首要就是必須拋下一些舊有的執著。從《大數據》書中第二章起,開宗明義就為讀者說明及溫習三種新思維:「樣本等於母體」、「不求精準」,以及「不求因果」。前兩項思維意味著,資料多比起品質好更重要。當能夠擁有的資料已極大化,抽樣的確就不再必要,更毋需錙銖計算精準,而有錯過全貌的風險!一旦我們容忍且擁抱雜亂的資料,就會發現在西洋棋、文法校正上的電腦技術之所以有更多進展,是因為系統裡有了更多殘局應對與棋步分析的資料、及高達十億的字彙輸入量,這些資料遠遠勝過晶片技術或演算方法上的調整。
最後,也更為重要的思考邏輯,就是一切改由「相關性」來觀察或作決策。以往「打破砂鍋問到底」的堅持,也許不再那麼合乎時宜,比如想知道機票票價,毋須想像航空公司定價策略;想知道什麼商品會賣,也不用知道顧客口味喜好,只要將巨量資料交付相關分析,就能知道哪些指標能顯示機票將上漲、顧客會買單。我們不需對某現象先提出具體假說,只要靠著相關性,能讓研究結果減少偏見,我們對事物的觀察也能更快、更清楚。
藉由預測模型與巨量資料的輔助,要成功不再困難
一旦改為資料導向來作決策,影響會非常深遠,那些多半摻雜直覺、主觀或個人猜測的理念想法,將可以藉由預測模型與巨量資料的輔助,預測究竟是否可行;如同電影《魔球》故事裡比利跳脫出傳統球探的評價方式,放膽改用充滿數據分析新觀點來經營球隊,這些都指明了,想在職場上成功,需要的技能正在改變。如果需借助更多知識或經驗進行判斷,我們將多了數據作為最有驗證力的老師,就算跨領域,照樣可以提出最好的建議!世界出現越來越多公開分享的資訊,其中蘊藏了不少價值金礦;如書中所闡述,從免費的政府的氣象數據,結合企業航班資料,就能發現航班延誤的相關天氣資訊,與直覺相反地,比起下雪航班更容易受到起霧影響而停飛!有想法的企業、組織、個人或是政府,只要願意透過巨量資料思維來與世界互動,都更容易預見並掌握價值,創造出能呼應人性的創新;那些過去曾被認為是效率或既定的方式,也可能全面翻轉。
然而,自由意志與資料獨裁,究竟孰輕孰重?
眺望巨量資料的發展,似乎勾勒出科技統治一切的萬能預示,這是否等於否定了人性的自由意志與人類潛能?本書最後揭示了巨量資料的黑暗面─那些我們可能遭遇到許多道德相關的議題,像是應該完全接受與個人意見相左的統計裁定嗎?成功可預測,那麼犯罪機率也可以喊賊先抓人嗎?人永遠是過去行為的囚徒嗎?雖聽來駭人,但預先思索有其必要性,畢竟時間不會停止,科技與資訊發展仍繼續無聲的前進,現在並沒有簡單的方法,讓所有人能夠完全準備好迎接巨量資料世界;我們確實需要新的準則,讓社會熟悉並準備,要如何使用這項科技,將決定了人類的種種機制與自身將朝哪個方向改變。只要心態與思維正確,我們依然能夠巧妙的重複運用這些資料,不斷帶來創新和不同的服務。
巨量資料在這個時代誕生,是極為強大一種工具與資源,然而,它代表的是通知並非解釋,是相關非因果。這本《大數據》簡明的導引了巨量資料的脈絡與對社會、經濟、科學與個人無所不在的影響,沒有一廂情願的樂觀迷戀或盲目信仰,而是為我們目前處境解釋、回溯過去我們所走的路,並針對前方種種危機與轉機,提供指引。數位時代下,人類自主掌握的空間與能力,因為科技而寬廣深入,今年,我們肯定這本書《大數據》揭示的重要價值,以年度之最的位置向讀者引薦,進而認識巨量資料的視角觀點,或多或少地將我們生活、工作、思考與行動裡可能有意義、有趣的交會點顯影出來!這是場新挑戰,更是個好機會,去作足準備、以最好的方式迎接未來。
回文章列表