在數(shù)字化轉(zhuǎn)型任務中,數(shù)據(jù),數(shù)據(jù)資源,數(shù)據(jù)資產(chǎn),這些詞匯的概念意義都是非常不一樣的。
從數(shù)據(jù)到數(shù)據(jù)資源,首先經(jīng)歷了成本確認和潛在價值認定的過程,而從數(shù)據(jù)資源再到數(shù)據(jù)資產(chǎn),又經(jīng)歷了數(shù)據(jù)治理的過程。
所謂數(shù)據(jù)治理,本質(zhì)上就是對雜亂、原始的基礎數(shù)據(jù)進行一系列的加工處理,使其數(shù)據(jù)價值得以“顯化”,可以直接為管理或業(yè)務活動提供價值。
數(shù)據(jù)治理本身有非常寬泛的管理學內(nèi)涵,而如果從數(shù)據(jù)價值鏈的視角,把數(shù)據(jù)本身作為觀察對象,或許可以更加清晰地理解數(shù)據(jù)治理活動對數(shù)據(jù)變成資產(chǎn)這個過程產(chǎn)生了什么影響。
下面主要從四個步驟來簡單介紹:
(一)業(yè)務數(shù)據(jù)同步
首先,需要通過數(shù)據(jù)采集、同步的方式,把業(yè)務系統(tǒng)中的數(shù)據(jù)表內(nèi)容遷移到分析域中,實現(xiàn)數(shù)據(jù)對象從流程支持到?jīng)Q策支持這個基礎角色的轉(zhuǎn)變。
例如,在數(shù)據(jù)倉庫的貼源層,盡管只是對業(yè)務系統(tǒng)中的數(shù)據(jù)進行了最基礎的復制操作,其內(nèi)涵也是完全不同的。
這里最大的好處在于,在數(shù)據(jù)倉庫對數(shù)據(jù)進行分析,并不會對業(yè)務系統(tǒng)的正常數(shù)據(jù)運行產(chǎn)生任何影響,這個過程也叫業(yè)務數(shù)據(jù)化。
(二)業(yè)務特征抽取
剛完成的同步的原始數(shù)據(jù)形態(tài),數(shù)據(jù)結構和數(shù)據(jù)規(guī)整度不足,很多時候并不利于直接進行分析。
因此,需要對數(shù)據(jù)進行預處理,去掉可能影響分析結論的誤導性記錄。同時對業(yè)務特征進行抽取和提煉,為后續(xù)的數(shù)據(jù)分析活動以及數(shù)據(jù)服務創(chuàng)造有利的數(shù)字化條件。
其中,對于結構化數(shù)據(jù)來說,常見的做法是對一些核心業(yè)務特征的度量值進行統(tǒng)計計算,比如平均值、最大值、最小值、總數(shù)、比例等總體分布指標。
而對于非結構化數(shù)據(jù)來說,比如文本類數(shù)據(jù),通過語義理解、文本分類、知識抽取等自然語言處理技術,可以自動提煉業(yè)務標簽,獲得相應的結構化表征屬性。
(三)數(shù)據(jù)要素重組
除了對業(yè)務特征抽取,在數(shù)據(jù)治理的過程中,還需要數(shù)據(jù)資源進行匯聚整合。
數(shù)據(jù)匯聚是把來自不同業(yè)務系統(tǒng)(數(shù)據(jù)源)的數(shù)據(jù)在新的統(tǒng)一模型中進行統(tǒng)一、集中的重新表示,這里有兩個主要目的:
一是實現(xiàn)數(shù)據(jù)資源的整合與貫通,實現(xiàn)跨業(yè)務的數(shù)據(jù)價值融合,激發(fā)更大的數(shù)據(jù)要素活力和數(shù)據(jù)場景創(chuàng)新潛力;
二是將數(shù)據(jù)資源的組織形式轉(zhuǎn)變?yōu)楦m合業(yè)務分析的寬表形式,數(shù)據(jù)模型的基本結構從面向過程變?yōu)槊嫦驅(qū)ο蟆?/p>
(四)數(shù)據(jù)質(zhì)量整改
前三個步驟完成了數(shù)據(jù)要素的初步規(guī)整,這里只是考慮了數(shù)據(jù)的信息表示形式,并沒有考慮數(shù)據(jù)質(zhì)量。數(shù)據(jù)質(zhì)量是保證數(shù)據(jù)可用性、價值性的關鍵。
對數(shù)據(jù)質(zhì)量進行定期的核查、整改,是數(shù)據(jù)治理中非常關鍵的環(huán)節(jié),數(shù)據(jù)質(zhì)量一般按照六性(一致性、完整性、準確性、唯一性、有效性)維度展開進行分析、整改、提升。
數(shù)據(jù)質(zhì)量整改除了在數(shù)據(jù)倉庫(或中臺)進行(見效快、不徹底),也可以在各個源端業(yè)務系統(tǒng)(干擾正常業(yè)務、長期效應)展開。
值得注意的是,數(shù)據(jù)質(zhì)量的標準需要緊密結合目標業(yè)務應用來定義,需要考慮權衡數(shù)據(jù)整改活動的“成本-收益”比例。
(五)數(shù)據(jù)產(chǎn)品開發(fā)
在數(shù)據(jù)整改的基礎上,后續(xù)可基于優(yōu)質(zhì)的數(shù)據(jù)表資源,圍繞具體的業(yè)務目標導向,開發(fā)各類有價值的數(shù)據(jù)產(chǎn)品。常見的數(shù)據(jù)產(chǎn)品包括數(shù)據(jù)表本身、BI分析模塊、業(yè)務標簽等多種形式。
數(shù)據(jù)產(chǎn)品一般以“服務化”的方式進行組織內(nèi)外的資源共享和開放。用戶可以通過訪問數(shù)據(jù)服務來訪問數(shù)據(jù)資源和基于數(shù)據(jù)資源的計算分析能力。
最終,數(shù)據(jù)表和數(shù)據(jù)服務,最終都作為數(shù)據(jù)資產(chǎn)進行審核、備案、公開、運營。
用戶可以通過數(shù)據(jù)資產(chǎn)目錄了解企業(yè)的數(shù)據(jù)資產(chǎn)現(xiàn)狀,并按照授權情況進行訪問,以及開展自主數(shù)據(jù)應用。
(六)數(shù)據(jù)資產(chǎn)確權
在成為數(shù)據(jù)資產(chǎn)之前,還有一個環(huán)節(jié)非常重要,即數(shù)據(jù)資產(chǎn)確權。
因為數(shù)據(jù)資產(chǎn)與其他資產(chǎn)一樣,具有價值屬性,這就會涉及關于數(shù)據(jù)價值分配以及責任歸屬的問題。需要明確在組織中誰對數(shù)據(jù)有采集權、管理權、訪問權,以及最終的收益分配權。
當前,關于數(shù)據(jù)資產(chǎn)確權的統(tǒng)一標準還在逐步探索的過程中,在不同行業(yè)和業(yè)務場景中的規(guī)則也各具差異性。
但總體而言,數(shù)據(jù)權益與數(shù)據(jù)責任是相匹配的,需要結合各相關方的資源投入和業(yè)務邊界合理明確,這是數(shù)據(jù)要素市場化不可逾越的關鍵管理學議題。
分享到微信 ×
打開微信,點擊底部的“發(fā)現(xiàn)”,
使用“掃一掃”即可將網(wǎng)頁分享至朋友圈。