大數(shù)據(jù)已被提升到國(guó)家戰(zhàn)略高度。美國(guó)啟動(dòng)了“大數(shù)據(jù)研究和發(fā)展計(jì)劃”,動(dòng)用美國(guó)國(guó)家科學(xué)基金、國(guó)家衛(wèi)生研究院、能源部、國(guó)防部、國(guó)防部高級(jí)研究計(jì)劃局和美國(guó)地質(zhì)勘探局等6個(gè)聯(lián)邦政府部門(mén)的資源,大力推動(dòng)大數(shù)據(jù)相關(guān)收集、組織和分析工具及技術(shù)的研發(fā),致力于開(kāi)放型、共享型政府建設(shè)。
大數(shù)據(jù)已被定義為科學(xué)探索的第四范式。繼幾千年前的實(shí)驗(yàn)科學(xué)、數(shù)百年前的理論科學(xué)和數(shù)十年前的計(jì)算科學(xué)之后,當(dāng)今的數(shù)據(jù)爆炸孕育了數(shù)據(jù)密集型科學(xué),將理論、實(shí)驗(yàn)和計(jì)算仿真等范式統(tǒng)一起來(lái)。大數(shù)據(jù)已被譽(yù)為“非競(jìng)爭(zhēng)性”生產(chǎn)要素。
大數(shù)據(jù)具有“取之不盡,用之不竭”的特性,在不斷的再利用、重組和擴(kuò)展中持續(xù)釋放其潛在價(jià)值,在廣泛的公開(kāi)、共享中不斷創(chuàng)造著新的財(cái)富。
然而,大數(shù)據(jù)的3V特征也好,4V特征也罷,仍然沒(méi)有撇清與海量數(shù)據(jù)、超大規(guī)模數(shù)據(jù)的關(guān)系;為數(shù)不多的應(yīng)用案例,依然難逃傳統(tǒng)數(shù)據(jù)分析和數(shù)據(jù)挖掘的嫌疑;大數(shù)據(jù)的實(shí)時(shí)分析、產(chǎn)品的關(guān)聯(lián)度分析,很難抹去精準(zhǔn)營(yíng)銷(xiāo)、精益管理的傳統(tǒng)思維定式。這更像是一種“新瓶裝舊酒”的困局,一種“唐·吉訶德式”的悖論——越是強(qiáng)調(diào)大數(shù)據(jù)的實(shí)踐應(yīng)用,就越扼殺大數(shù)據(jù)的潛在價(jià)值。
為何如此?根源在于,大數(shù)據(jù)的價(jià)值在于預(yù)測(cè)未知領(lǐng)域、非特定因素的未來(lái)趨勢(shì),在于破解長(zhǎng)期的、普遍的社會(huì)難題。而目前的大數(shù)據(jù)技術(shù)和應(yīng)用,依然局限于歷史和實(shí)時(shí)數(shù)據(jù)的關(guān)聯(lián)分析,局限于滿足短線的、特定的市場(chǎng)需求。
“解決我,不然我將吞掉你的體系”。正如當(dāng)年羅素悖論試圖顛覆現(xiàn)代數(shù)據(jù)基礎(chǔ)——集合論一樣,破解社會(huì)難題與茍安于市場(chǎng)需求的悖論正在向大數(shù)據(jù)宣戰(zhàn)。解決悖論的過(guò)程,恰恰是理論和方法應(yīng)運(yùn)而生的過(guò)程。而人們?cè)噲D解決悖論的努力,正好是大數(shù)據(jù)落地生根的推動(dòng)力。
方法論缺位
大數(shù)據(jù)與海量數(shù)據(jù)、超大規(guī)模數(shù)據(jù)有何不同?如何跨越學(xué)術(shù)與產(chǎn)業(yè)、技術(shù)與應(yīng)用的鴻溝?
自2008年《自然》雜志推出“大數(shù)據(jù)”專(zhuān)刊以來(lái),大數(shù)據(jù)概念就從學(xué)術(shù)大討論,轉(zhuǎn)向了企業(yè)的數(shù)字化轉(zhuǎn)型,進(jìn)而上升到“開(kāi)放政府?dāng)?shù)據(jù)”的戰(zhàn)略布局。然而,單純的數(shù)量上的規(guī)模龐大,并不能輕易地將大數(shù)據(jù)與以往的“海量數(shù)據(jù)”、“超大規(guī)模數(shù)據(jù)”等區(qū)別開(kāi),因?yàn)槿呔鶝](méi)有設(shè)置數(shù)量級(jí)等門(mén)檻。
概念的模糊,沒(méi)有影響到大數(shù)據(jù)概念的炒作,卻著實(shí)影響到了大數(shù)據(jù)應(yīng)用的推廣。IBM對(duì)全球95個(gè)國(guó)家和地區(qū)、26個(gè)行業(yè)的144名業(yè)務(wù)人員或IT專(zhuān)業(yè)人士做了調(diào)研,該調(diào)研發(fā)現(xiàn),大多數(shù)企業(yè)已經(jīng)認(rèn)識(shí)到大數(shù)據(jù)的決策價(jià)值和業(yè)務(wù)優(yōu)化的潛能,但是他們對(duì)布局企業(yè)數(shù)據(jù)戰(zhàn)略卻束手無(wú)策,甚至多數(shù)企業(yè)不確定如何推進(jìn)大數(shù)據(jù)應(yīng)用。這一現(xiàn)象可以歸因于企業(yè)管理者對(duì)于大規(guī)模投資大數(shù)據(jù)和高級(jí)分析工具,特別是對(duì)數(shù)據(jù)科學(xué)家等人才的需求,表示懷疑。因?yàn)樗麄冞沒(méi)有認(rèn)識(shí)到從哪里獲取數(shù)據(jù),一些企業(yè)還沒(méi)有抹去數(shù)據(jù)倉(cāng)庫(kù)與業(yè)務(wù)無(wú)法融合的陰影。
老生常談的大數(shù)據(jù)3V或4V特征,更是讓CEO們望而生畏。“大數(shù)據(jù)是指利用廣泛信息源來(lái)推動(dòng)實(shí)時(shí)決策的做法。”哈佛商學(xué)院客座教授托馬斯·達(dá)文波特在接受媒體采訪時(shí)的闡述可能曾讓企業(yè)家們怦然心動(dòng),但他接下來(lái)的解釋卻與IT企業(yè)的說(shuō)辭沒(méi)太大區(qū)別。在達(dá)文波特看來(lái),大數(shù)據(jù)的特征可以用3個(gè)'V'來(lái)描述:數(shù)量(Volume,大量數(shù)據(jù))、速度(Velocity,數(shù)據(jù)變化很快)以及多樣性(Variety,數(shù)據(jù)源內(nèi)部的和外部的,系統(tǒng)的和散亂的)。有時(shí)還有第4個(gè)V:真實(shí)性(Veracity,反映數(shù)據(jù)質(zhì)量)。加上IDC和Teradata給出的另一個(gè)V——價(jià)值性(Value,數(shù)據(jù)的使用價(jià)值和潛在價(jià)值),這些概念和定義均沒(méi)有回答大數(shù)據(jù)與業(yè)務(wù)融合的問(wèn)題。
方法論缺位是最大的障礙。大數(shù)據(jù)發(fā)展的核心動(dòng)力源于人們測(cè)量、記錄和分析世界的渴望,滿足這些渴望需要數(shù)據(jù)、技術(shù)和思維三大要素。在計(jì)算技術(shù)、通信技術(shù)日益成熟的今天,在廉價(jià)的、便捷的數(shù)字化存儲(chǔ)普及的當(dāng)下,數(shù)據(jù)無(wú)處不在,技術(shù)正以標(biāo)準(zhǔn)化、商品化的方式提供,事實(shí)上思維和方法論才是決定大數(shù)據(jù)成敗的關(guān)鍵。但目前來(lái)看,跨越學(xué)術(shù)與產(chǎn)業(yè)、技術(shù)與應(yīng)用之間鴻溝的方法論依然不完善,以至于被大數(shù)據(jù)暢銷(xiāo)書(shū)和大數(shù)據(jù)技術(shù)服務(wù)公司反復(fù)借用的大數(shù)據(jù)應(yīng)用案例,均是一些蹩腳的例證。
預(yù)測(cè)能力待考
憑什么說(shuō)大數(shù)據(jù)預(yù)測(cè)是準(zhǔn)確的?有什么依據(jù)證明數(shù)據(jù)推動(dòng)型戰(zhàn)略有利于提升企業(yè)業(yè)績(jī)?
“運(yùn)用大數(shù)據(jù)做決策的那些行業(yè)前三名企業(yè),比其競(jìng)爭(zhēng)對(duì)手在產(chǎn)能上高5%,在利潤(rùn)上高6%。”這是麻省理工學(xué)院的數(shù)字商業(yè)中心最近完成的一個(gè)調(diào)查的數(shù)據(jù)。該調(diào)研還發(fā)現(xiàn):越是自定義為數(shù)據(jù)驅(qū)動(dòng)型的公司,越會(huì)客觀地衡量公司的財(cái)務(wù)與運(yùn)營(yíng)結(jié)果。
的確,被譽(yù)為大數(shù)據(jù)應(yīng)用楷模的谷歌、亞馬遜等數(shù)據(jù)型公司在2013年第一季度確實(shí)取得了不俗的業(yè)績(jī)。其中谷歌營(yíng)業(yè)收入增長(zhǎng)了31%,亞馬遜增長(zhǎng)了22%。但是,一些大數(shù)據(jù)技術(shù)和解決方案服務(wù)的公司并沒(méi)有取得如此的業(yè)績(jī)。比如IBM第一季度營(yíng)業(yè)收入下滑5.1%,凈利潤(rùn)下滑1.1%;微軟第一季度營(yíng)業(yè)收入下滑8%,凈利潤(rùn)下滑22%;英特爾營(yíng)業(yè)收入下滑2%,利潤(rùn)下滑25%。
“幾家歡樂(lè)幾家愁”的業(yè)績(jī)表現(xiàn),與大數(shù)據(jù)有關(guān)還是無(wú)關(guān)呢?這與大數(shù)據(jù)預(yù)測(cè)是否精準(zhǔn)的問(wèn)題同樣難以回答。學(xué)術(shù)界、企業(yè)界都不會(huì)質(zhì)疑大數(shù)據(jù)的預(yù)測(cè)功能!洞髷(shù)據(jù)時(shí)代》一書(shū)的作者維克托·邁爾-舍恩伯格說(shuō),大數(shù)據(jù)的核心就是預(yù)測(cè)。它通常被視為人工智能的一部分,或者更確切地說(shuō),被視為一種機(jī)器學(xué)習(xí)。他認(rèn)為,大數(shù)據(jù)大大解放了人們的分析能力。一是可以分析更多的數(shù)據(jù),甚至是相關(guān)的所有數(shù)據(jù),而不再依賴于隨機(jī)抽樣;二是研究數(shù)據(jù)如此之多,以至于我們不再熱衷于追求精確度;三是不必拘泥于對(duì)因果關(guān)系的探究,而可以在相關(guān)關(guān)系中發(fā)現(xiàn)大數(shù)據(jù)的潛在價(jià)值。因此,當(dāng)人們可以放棄尋找因果關(guān)系的傳統(tǒng)偏好,開(kāi)始挖掘相關(guān)關(guān)系的好處時(shí),一個(gè)用數(shù)據(jù)預(yù)測(cè)的時(shí)代才會(huì)到來(lái)。
遺憾的是,無(wú)論是IBM的大數(shù)據(jù)接受程度調(diào)研,還是麻省理工學(xué)院的大數(shù)據(jù)戰(zhàn)略效果評(píng)估,都是傳統(tǒng)的隨機(jī)抽樣,甚至是結(jié)構(gòu)性訪談,而非大數(shù)據(jù)的全體數(shù)據(jù)、模糊數(shù)據(jù)采集。被廣泛引用的谷歌預(yù)測(cè)H1N1流感傳播軌跡、沃爾瑪將啤酒和尿布擺放在一起的故事,無(wú)非是產(chǎn)品和詞匯的關(guān)聯(lián)性分析。同樣,《少數(shù)派報(bào)告》講述的華盛頓特區(qū)警局預(yù)測(cè)犯罪的故事,也不過(guò)是電影的情節(jié),而且與“無(wú)罪推定”、“犯罪的四個(gè)要件(犯罪主體、犯罪的主觀方面、犯罪的客觀方面、犯罪客體)”等常識(shí)相悖。
馬克·吐溫說(shuō):歷史不會(huì)重演,但自有其規(guī)律。技術(shù)的進(jìn)步讓人類(lèi)揭示歷史規(guī)律更加便捷和更有可能,大數(shù)據(jù)技術(shù)的進(jìn)步就是其中之一。因此,與其說(shuō)大數(shù)據(jù)的核心價(jià)值是對(duì)未來(lái)的預(yù)測(cè),不如說(shuō)是對(duì)過(guò)去沉睡的規(guī)律的揭示。在“自證預(yù)言”等復(fù)雜因素的作用下,大數(shù)據(jù)對(duì)社會(huì)的一些預(yù)測(cè)和判斷,很可能到后來(lái)只是“事實(shí)證明”。
數(shù)據(jù)并非萬(wàn)能
怎樣做決策?誰(shuí)來(lái)做決策?這樣的問(wèn)題只能由企業(yè)家回答,大數(shù)據(jù)充其量是“用數(shù)據(jù)說(shuō)話”的旁證。
數(shù)據(jù)之于信息社會(huì)就如燃料之于工業(yè)革命,是人們進(jìn)行創(chuàng)新的力量源泉。沒(méi)有大量鮮活的數(shù)據(jù)和健全的服務(wù)市場(chǎng),這些創(chuàng)新就實(shí)現(xiàn)不了。這是維克托·邁爾-舍恩伯格的觀點(diǎn)。一些學(xué)者更進(jìn)一步,將大數(shù)據(jù)視作第三次工業(yè)革命的戰(zhàn)略資源。
不可否認(rèn),大數(shù)據(jù)標(biāo)志著人類(lèi)在尋求量化和認(rèn)識(shí)世界的道路上前進(jìn)了一步。這是計(jì)算技術(shù)的進(jìn)步,是人類(lèi)決策工具的進(jìn)步。但正如《哈佛商業(yè)評(píng)論》所批評(píng)的:“高管們明明還是按照傳統(tǒng)的方式做決定,以那些高薪人士的意見(jiàn)為主,卻拿出一份香艷的數(shù)據(jù)報(bào)告證明自己的決定是多么英明。其實(shí)那不過(guò)是吩咐下屬四處尋找的專(zhuān)為這個(gè)決定做辯護(hù)的一堆數(shù)字。”這些所謂的“偽大數(shù)據(jù)決策”也許是一種常態(tài),“高價(jià)智囊請(qǐng)閉嘴”、“讓數(shù)據(jù)做主”很可能只是大數(shù)據(jù)倡導(dǎo)者的理想。
《點(diǎn)球成金》的故事經(jīng)常被大數(shù)據(jù)概念的倡導(dǎo)者拿來(lái)佐證“專(zhuān)家的消亡和數(shù)據(jù)科學(xué)家的崛起”。改編自邁克爾·劉易斯的《魔球:逆境中制勝的智慧》的影片《點(diǎn)球成金》,講述了一個(gè)真實(shí)的故事,介紹了奧克蘭運(yùn)動(dòng)家棒球隊(duì)總經(jīng)理比利·比恩的經(jīng)營(yíng)哲學(xué),描述了他拋棄幾百年延續(xù)的選擇球員的慣常做法,采用了一種依靠電腦程序和數(shù)學(xué)模型分析比賽數(shù)據(jù)來(lái)選擇球員的方法。比利·比恩的成功稱得上是對(duì)球探們經(jīng)驗(yàn)決策的顛覆,是讓數(shù)據(jù)說(shuō)話的成功范例。但是,其所分析的數(shù)據(jù)根本稱不上大數(shù)據(jù),甚至連海量數(shù)據(jù)也夠不上。比利·比恩成功的關(guān)鍵不在于“讓數(shù)據(jù)說(shuō)話”,而是為“球隊(duì)為贏球而建,不是為球星而建”的經(jīng)營(yíng)常識(shí)找到了數(shù)據(jù)注腳。
正如維克托·邁爾-舍恩伯格將大數(shù)據(jù)視為人工智能的一部分,視為機(jī)器學(xué)習(xí)的一種應(yīng)用一樣,數(shù)據(jù)決策和數(shù)據(jù)旁證的博弈其實(shí)是人和機(jī)器的博弈。熟稔經(jīng)營(yíng)之道的企業(yè)家們并不情愿輕易將決策權(quán)交給大數(shù)據(jù)、放任服務(wù)器。而且,數(shù)據(jù)有時(shí)候也可能是企業(yè)管理的“絆腳石”。
直覺(jué)主義讓位于數(shù)據(jù)分析,專(zhuān)家決策讓位于群眾智慧,只能是大數(shù)據(jù)倡導(dǎo)者的一廂情愿。一個(gè)折中的辦法是,數(shù)據(jù)做分析,專(zhuān)家做判斷,數(shù)據(jù)給答案,專(zhuān)家做選擇。但對(duì)企業(yè)家而言,專(zhuān)家可以找,思想家必須自己做。從數(shù)據(jù)戰(zhàn)略的構(gòu)建,到群體智慧的萃取;從社會(huì)關(guān)系網(wǎng)絡(luò)的解析,到復(fù)雜的自組織系統(tǒng)的發(fā)現(xiàn),均依賴于企業(yè)家的智慧,而不能完全依賴于機(jī)器。即便是有一將難求的數(shù)據(jù)科學(xué)家的協(xié)助,大數(shù)據(jù)決策依然是輔助系統(tǒng)。
核心關(guān)注:拓步ERP系統(tǒng)平臺(tái)是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用,蘊(yùn)涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務(wù)管理理念,功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理,全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域,是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴品牌。
轉(zhuǎn)載請(qǐng)注明出處:拓步ERP資訊網(wǎng)http://m.lukmueng.com/
本文標(biāo)題:中國(guó)計(jì)算機(jī)報(bào)觀察:大數(shù)據(jù)五大悖論