電影《天下無賊》里有這樣一句經(jīng)典對(duì)白:21世紀(jì)什么最重要?人才!?,F(xiàn)在,可能答案還要補(bǔ)上一項(xiàng):數(shù)據(jù)。隨著大數(shù)據(jù)(Big Data)時(shí)代的悄然來臨,數(shù)據(jù)的重要性將愈發(fā)凸顯。
未來數(shù)據(jù)到底有多重要?IBM(微博)新任CEO羅睿蘭(Ginni Rometty)的觀點(diǎn)讓人印象深刻 。她說,數(shù)據(jù)將是下一個(gè)大的自然資源,將會(huì)區(qū)分每個(gè)行業(yè)的勝者與輸家。
關(guān)于什么是大數(shù)據(jù),現(xiàn)在還沒有標(biāo)準(zhǔn)的定義。維基百科上有人對(duì)大數(shù)據(jù)作了如下描述:數(shù)據(jù)增長(zhǎng)如此之快,以至于難以使用現(xiàn)有的數(shù)據(jù)庫管理工具來駕馭,困難存在于數(shù)據(jù)的獲取,存儲(chǔ),搜索,共享,分析和可視化等方面。
通俗地說,大數(shù)據(jù)其實(shí)是一種在互聯(lián)網(wǎng)時(shí)代或信息時(shí)代的企業(yè)現(xiàn)象。中國軟件網(wǎng)、海比研究總經(jīng)理曹開彬告訴新浪科技,在這樣的時(shí)代,任何一個(gè)企業(yè),尤其是大型企業(yè)和互聯(lián)網(wǎng)企業(yè),會(huì)在經(jīng)營(yíng)過程中產(chǎn)生大量的、各種各樣的數(shù)據(jù)。它有幾個(gè)典型特征:數(shù)據(jù)量大、數(shù)據(jù)類型復(fù)雜、處理速度要快。
所謂數(shù)據(jù)量大,是指數(shù)據(jù)不再以幾個(gè)GB和幾個(gè)TB為單位來衡量,而是以PB(1000個(gè)T)、EB(一百萬個(gè)T)或ZB(10億個(gè)T)為計(jì)量單位;數(shù)量類型復(fù)雜,是因?yàn)樗膩碓磸?fù)雜,從結(jié)構(gòu)化數(shù)據(jù)到非結(jié)構(gòu)化數(shù)據(jù);處理速度要快,則是指數(shù)據(jù)的分析和使用需要在極短的時(shí)間內(nèi)完成,甚至實(shí)時(shí)使用。
曹開彬說,這導(dǎo)致現(xiàn)有的數(shù)據(jù)倉庫和商業(yè)智能等數(shù)據(jù)處理和分析技術(shù)無法應(yīng)對(duì)這種情況,但是企業(yè)要對(duì)它進(jìn)行快速處理與分析的需求又很大,因此,大數(shù)據(jù)才會(huì)變得這樣火。
資深I(lǐng)T人士謝文對(duì)于大數(shù)據(jù)有另外的看法。在他看來,大數(shù)據(jù)并不是新概念,而是在物理學(xué),生物學(xué)等科學(xué)領(lǐng)域早已存在的理論,只不過此前沒有有效的手段獲取大數(shù)據(jù)。
他認(rèn)為,Web2.0時(shí)代,大數(shù)據(jù)應(yīng)該是以人為核心,以人的關(guān)系為基礎(chǔ)作信息生產(chǎn)、交換,從而產(chǎn)生的巨大信息爆炸。同時(shí),大數(shù)據(jù)將產(chǎn)生比現(xiàn)在更有價(jià)值的商業(yè)模式,是不能用現(xiàn)有技術(shù)進(jìn)行處理的。
背后價(jià)值
那么,大數(shù)據(jù)到底能給企業(yè)帶來什么價(jià)值呢?本質(zhì)上說,大數(shù)據(jù)本身沒有太多價(jià)值,基于大數(shù)據(jù)的處理和分析才能為企業(yè)帶來的巨大的增值價(jià)值。
曹開彬認(rèn)為,大數(shù)據(jù)里面包含企業(yè)運(yùn)營(yíng)的各種信息,如果能對(duì)它們進(jìn)行及時(shí)有效充分地整理和分析,才可以很好地、迅速地幫助企業(yè)進(jìn)行業(yè)務(wù)決策,響應(yīng)客戶需求,提升競(jìng)爭(zhēng)力。
兩個(gè)月前,剛剛以大數(shù)據(jù)概念在納斯達(dá)克(微博)上市的美國公司Splunk可以讓我們很容易的理解這一點(diǎn)。
Splunk提供一款可運(yùn)行于各種平臺(tái)的IT數(shù)據(jù)、日志分析軟件,可以讓IT運(yùn)維人員以類似谷歌搜索關(guān)鍵詞的方式,快速搜索并查看任何IT設(shè)備運(yùn)行過程中產(chǎn)生的信息。
一個(gè)簡(jiǎn)單的場(chǎng)景是,當(dāng)IT設(shè)備出現(xiàn)異常時(shí),IT運(yùn)維人員只需要搜索關(guān)鍵詞Error,系統(tǒng)便會(huì)列出包含Error的機(jī)器運(yùn)行日志,并以非常好的圖形化方式展現(xiàn)出來。IT運(yùn)維人員可以據(jù)此判斷出是異常出現(xiàn)的具體時(shí)間,具體設(shè)備,并分析故障原因。
顯然,與以前憑借經(jīng)驗(yàn)進(jìn)行故障判斷相比,數(shù)據(jù)分析提供了更精準(zhǔn)的信息,而這便是大數(shù)據(jù)的魅力所在。那么,企業(yè)該如何抓住大數(shù)據(jù)帶來的機(jī)遇呢?
Teradata大中華區(qū)首席執(zhí)行官辛兒倫對(duì)新浪科技表示,隨著大數(shù)據(jù)時(shí)代的到來,企業(yè)應(yīng)該在內(nèi)部培養(yǎng)三種能力。第一,整合企業(yè)數(shù)據(jù)的能力;第二,探索數(shù)據(jù)背后價(jià)值和制定精確行動(dòng)綱領(lǐng)的能力;第三,進(jìn)行精確快速實(shí)時(shí)行動(dòng)的能力。
如果企業(yè)在信息治理上培養(yǎng)出這三種能力,對(duì)未來大數(shù)據(jù)時(shí)代的駕馭能力會(huì)增強(qiáng),對(duì)面臨到的挑戰(zhàn)會(huì)降到最低。辛兒倫表示。
廠商布局
辛兒倫所在的Teradata公司是一家智能分析解決方案廠商,主要為企業(yè)和政府機(jī)構(gòu)做數(shù)據(jù)整合,分析,探索、挖掘數(shù)據(jù)背后的價(jià)值。最近兩年,Teradata通過收購將業(yè)務(wù)從結(jié)構(gòu)化數(shù)據(jù)延伸到非結(jié)構(gòu)化、大數(shù)據(jù)領(lǐng)域。
2011年,Teradata先后收購了云計(jì)算軟件公司Aprimo及高級(jí)分析和管理各種非結(jié)構(gòu)化數(shù)據(jù)領(lǐng)域的Aster Data公司。今年5月8日,Aprimo收購了基于云的數(shù)字營(yíng)銷歐洲領(lǐng)導(dǎo)廠商eCircle,進(jìn)一步加強(qiáng)并拓展了Teradata大數(shù)據(jù)市場(chǎng)的業(yè)務(wù)。
與Teradata一樣看好的大數(shù)據(jù)的還有IBM、甲骨文、惠普(微博)、EMC、微軟等傳統(tǒng)IT廠商,他們也在通過自主研發(fā)或者收購的方式進(jìn)入大數(shù)據(jù)領(lǐng)域。
IBM在過去五年里,已經(jīng)斥資超過140億美元進(jìn)行了20多筆與數(shù)據(jù)分析相關(guān)的收購交易。甲骨文這家以結(jié)構(gòu)化數(shù)據(jù)庫起家的IT公司,推出了大數(shù)據(jù)機(jī)及智能分析解決方案。
去年8月,惠普以100億美元收購英國軟件公司Autonomy,其實(shí)也是為了擴(kuò)大商業(yè)分析軟件的市場(chǎng)份額。Autonomy通過獨(dú)有的算法可以提取出非結(jié)構(gòu)化信息中的含義。
在美國硅谷,Splunk只是大數(shù)據(jù)領(lǐng)域的一家企業(yè)而已,仍有多家創(chuàng)業(yè)公司已經(jīng)聚焦在大數(shù)據(jù)領(lǐng)域,并且獲得風(fēng)險(xiǎn)投資的注資。
國內(nèi)企業(yè)落后
與國外大數(shù)據(jù)的熱火朝天相比,國內(nèi)企業(yè)參與這一領(lǐng)域的并不多。
國內(nèi)IT尤其是軟件企業(yè)在布局大數(shù)據(jù)方面,已經(jīng)落后。曹開彬認(rèn)為,這主要是國內(nèi)企業(yè)在數(shù)據(jù)庫、數(shù)據(jù)倉庫、商業(yè)智能等領(lǐng)域基礎(chǔ)薄弱。
不過,他指出,國內(nèi)企業(yè)在這方面仍有機(jī)會(huì),但需要找準(zhǔn)行業(yè)與切入點(diǎn)。
對(duì)于國內(nèi)可能出現(xiàn)大數(shù)據(jù)公司的領(lǐng)域,曹開彬表示,我比較看好互聯(lián)網(wǎng)公司,像百度、阿里巴巴、騰訊,這樣的互聯(lián)網(wǎng)公司比傳統(tǒng)的IT和軟件公司更有機(jī)會(huì)。
實(shí)際上,作為中國最大的電子商務(wù)公司阿里巴巴已經(jīng)在利用大數(shù)據(jù)技術(shù)提供具體服務(wù):阿里信用貸款與淘寶數(shù)據(jù)魔方。
以阿里信用貸款為例,阿里巴巴通過掌握的企業(yè)交易數(shù)據(jù),借助大數(shù)據(jù)技術(shù)自動(dòng)分析判定是否給予企業(yè)貸款,全程不會(huì)出現(xiàn)人工干預(yù)。據(jù)透露,截至目前阿里巴巴已經(jīng)放貸300多億元,壞賬率約0.3%左右,大大低于商業(yè)銀行。
淘寶數(shù)據(jù)魔方則是淘寶平臺(tái)上的大數(shù)據(jù)應(yīng)用方案。通過這一服務(wù),商家可以了解淘寶平臺(tái)上的行業(yè)宏觀情況、自己品牌的市場(chǎng)狀況、消費(fèi)者行為情況等,并可以據(jù)此作出經(jīng)營(yíng)決策。
不過,謝文并不認(rèn)為這些是真正的大數(shù)據(jù)。他表示,未來能夠稱得上大數(shù)據(jù)的公司將是Facebook、蘋果、谷歌等這樣的平臺(tái)型公司。
他表示,國內(nèi)沒有一家真正朝大數(shù)據(jù)方向努力的公司。國內(nèi)很多公司都在做分拆,并且產(chǎn)品數(shù)據(jù)也不相通。短期來看,這樣可以提高效率,但是長(zhǎng)期看,這是反大數(shù)據(jù)方向的。
謝文預(yù)測(cè),F(xiàn)acebook上市后,下一個(gè)偉大的公司應(yīng)該是大數(shù)據(jù)方向的公司,并有可能在2020年上市。
分享到微信 ×
打開微信,點(diǎn)擊底部的“發(fā)現(xiàn)”,
使用“掃一掃”即可將網(wǎng)頁分享至朋友圈。