阿里云日前宣布,未來3年再投2000億元,用于云操作系統(tǒng)、服務(wù)器、芯片、網(wǎng)絡(luò)等重大核心技術(shù)研發(fā)攻堅(jiān)和面向未來的數(shù)據(jù)中心建設(shè)。意味著阿里云的數(shù)據(jù)中心和服務(wù)器規(guī)模再翻3倍。
阿里巴巴在大數(shù)據(jù)中心上的大手筆投入,讓我們?cè)俅温?lián)想到,自從阿里巴巴提出中臺(tái)戰(zhàn)略思想以來,建設(shè)數(shù)據(jù)中臺(tái)與大數(shù)據(jù)中心的步伐就在不斷加快。
我們可以說,傳統(tǒng)的IT是成本中心,而有了數(shù)據(jù)就可能成為價(jià)值中心,這個(gè)價(jià)值體現(xiàn)在:在管理上提供決策支持,在生產(chǎn)上提供與管理者相匹配的智能工具。大數(shù)據(jù)時(shí)代,數(shù)據(jù)規(guī)模急劇增大,深算能力顯著提升,數(shù)據(jù)從源端到應(yīng)用端距離更短,數(shù)據(jù)的重塑也更快捷。數(shù)據(jù)中臺(tái)就把數(shù)據(jù)滲透到了整個(gè)業(yè)務(wù)的閉環(huán)中,用系統(tǒng)的方式推動(dòng)工作,并實(shí)現(xiàn)業(yè)務(wù)數(shù)據(jù)到知識(shí)分發(fā)的實(shí)時(shí)應(yīng)用。
企業(yè)在建設(shè)數(shù)據(jù)中臺(tái)時(shí),下面幾個(gè)原則是硬核,要高度重視,必須理解和遵守:
一、數(shù)據(jù)分層
數(shù)據(jù)分層,在阿里數(shù)據(jù)中臺(tái)的提法是大中臺(tái),小前臺(tái)。要實(shí)現(xiàn)業(yè)務(wù)數(shù)據(jù)化,就是所有的商業(yè)活動(dòng)都應(yīng)該記錄下相關(guān)的數(shù)據(jù),并把數(shù)據(jù)業(yè)務(wù)化,本質(zhì)就是從數(shù)據(jù)中發(fā)現(xiàn)價(jià)值,反過來賦能業(yè)務(wù)。我們可以利用大數(shù)據(jù)技術(shù),有效實(shí)現(xiàn)數(shù)據(jù)采集、轉(zhuǎn)運(yùn)、存儲(chǔ)、分類、估算預(yù)測、關(guān)聯(lián)分組、聚類,及數(shù)據(jù)循序樣式采礦等,充分地對(duì)數(shù)據(jù)進(jìn)行優(yōu)化整合與知識(shí)沉淀,完成封裝,以此有效滿足多樣化的數(shù)據(jù)應(yīng)用需求。常常的做法是建立操作數(shù)據(jù)層、公共維度模型層及應(yīng)用數(shù)據(jù)層。當(dāng)然,不同的企業(yè)也可開發(fā)不同的分層模式。
二、數(shù)據(jù)標(biāo)準(zhǔn)化
數(shù)據(jù)標(biāo)準(zhǔn)化,在阿里的數(shù)據(jù)中臺(tái)思想中叫做OneData。實(shí)現(xiàn)數(shù)據(jù)資產(chǎn)各域、主題、模型、字段、指標(biāo)命名等的統(tǒng)一規(guī)范,值得強(qiáng)調(diào)的是,數(shù)據(jù)標(biāo)準(zhǔn)化一定要在源頭解決,如果一個(gè)龐大的企業(yè)的業(yè)務(wù)系統(tǒng)數(shù)據(jù)資產(chǎn)都遵循這個(gè)原則,那應(yīng)該是非常厲害了。我們可以利用維度建模的方式建設(shè)總線矩陣,對(duì)數(shù)據(jù)域與業(yè)務(wù)過程等進(jìn)行明確定義。通常可以將指標(biāo)組成體系,細(xì)分成包括原子與衍生指標(biāo)、修飾類型與修飾詞等在內(nèi)的眾多組成部分。我們可以運(yùn)用統(tǒng)一工具,統(tǒng)一標(biāo)準(zhǔn)建模,運(yùn)用統(tǒng)一元數(shù)據(jù)管理機(jī)制甚至實(shí)現(xiàn)元數(shù)據(jù)驅(qū)動(dòng)智能化并計(jì)算出對(duì)資源的訴求。
三、主題標(biāo)簽化
主體標(biāo)簽化,在阿里數(shù)據(jù)中臺(tái)思想中叫做OneID。ID-MAPPING是互聯(lián)網(wǎng)公司的一個(gè)核心技術(shù),其需要確保各個(gè)領(lǐng)域搜集的數(shù)據(jù)是可以繼承和關(guān)聯(lián)分析的,沒有統(tǒng)一ID的支持,多樣化的數(shù)據(jù)集中起來分析是沒有意義的,這是另一種形式的數(shù)據(jù)孤島。數(shù)據(jù)關(guān)聯(lián),這也是我們?cè)趥鹘y(tǒng)數(shù)據(jù)倉庫中數(shù)據(jù)分析的依據(jù)。
三、數(shù)據(jù)資產(chǎn)卡片
數(shù)據(jù)資產(chǎn)卡片在阿里數(shù)據(jù)中臺(tái)思想叫OneMeta。這是我們進(jìn)行數(shù)據(jù)資產(chǎn)分析和數(shù)據(jù)血緣跟蹤的基礎(chǔ),是數(shù)據(jù)管理里非?;镜臇|西。這里面包括數(shù)據(jù)安全管理,質(zhì)量管理,成本管理,資產(chǎn)的創(chuàng)建信息,修改信息等等。
四、主題式數(shù)據(jù)服務(wù)
主題式數(shù)據(jù)服務(wù)在阿里數(shù)據(jù)中臺(tái)思想叫OneService。基于元數(shù)據(jù)構(gòu)建的簡單數(shù)據(jù)服務(wù)查詢引擎,面向業(yè)務(wù)統(tǒng)一數(shù)據(jù)出口與數(shù)據(jù)查詢邏輯,屏蔽多數(shù)據(jù)源與多物理表,就是一套業(yè)務(wù)化的虛擬查詢,方便取數(shù)。數(shù)據(jù)推送、定時(shí)任務(wù),跨源數(shù)據(jù)服務(wù)等都叫主題式數(shù)據(jù)服務(wù)。
筆者認(rèn)為,數(shù)據(jù)中臺(tái)建設(shè)的最大障礙,是企業(yè)對(duì)于數(shù)據(jù)的理解是否已經(jīng)達(dá)到了一定的高度,是否能夠驅(qū)動(dòng)公司去建立一套適合自己標(biāo)準(zhǔn)的數(shù)據(jù)管理機(jī)制和流程,如果牽涉到更多的人性和制度障礙,數(shù)據(jù)中臺(tái)的建設(shè)是難以完成的。數(shù)據(jù)中臺(tái)建設(shè)模式也并非千篇一律,不同的企業(yè)、不同的業(yè)務(wù)所需要的數(shù)據(jù)中臺(tái)并不相同,技術(shù)部門需要和業(yè)務(wù)部門通力協(xié)調(diào),在考慮前瞻性,擴(kuò)展性,靈活性的情況下,建立起一套屬于自己的數(shù)據(jù)中臺(tái)。
分享到微信 ×
打開微信,點(diǎn)擊底部的“發(fā)現(xiàn)”,
使用“掃一掃”即可將網(wǎng)頁分享至朋友圈。