編者按:
長亮科技在大數(shù)據(jù)領(lǐng)域始終保持足夠的技術(shù)敏銳度,并積累了豐富的經(jīng)驗與資產(chǎn)。為此,我們組織了一個系列專文,分期發(fā)表,與您一起探索更適合當下行業(yè)發(fā)展的數(shù)據(jù)觀,歡迎大家持續(xù)關(guān)注。
在前一篇文章《數(shù)據(jù)架構(gòu)是管理數(shù)據(jù)的基礎(chǔ)》中,我們回顧了數(shù)據(jù)管理領(lǐng)域具體實踐歷程與反思、數(shù)據(jù)架構(gòu)的內(nèi)涵以及應(yīng)用架構(gòu)、技術(shù)架構(gòu)的關(guān)系,認為應(yīng)該以企業(yè)級的架構(gòu)視角來管理與使用數(shù)據(jù)。本文將進一步圍繞企業(yè)數(shù)據(jù)模型核心,探討如何實施有效的數(shù)據(jù)治理。
作者|長亮科技大數(shù)據(jù)研究院
內(nèi)容|本篇共3427字,預(yù)計閱讀時間12分鐘
越來越多的企業(yè)認識到數(shù)據(jù)要素對企業(yè)的意義,意圖從數(shù)據(jù)中挖掘出更多的業(yè)務(wù)價值,成百上千的數(shù)據(jù)庫,數(shù)十萬張表,就是企業(yè)的數(shù)字資產(chǎn)金礦。他們大量采購?fù)獠繑?shù)據(jù),在WAP與WEB中大量埋點跟蹤用戶行為,應(yīng)采盡采,源源不斷流入數(shù)據(jù)湖中。他們在使用數(shù)據(jù)時才意識到自己不知道有什么數(shù)據(jù),該如何解讀與使用數(shù)據(jù),已知的數(shù)據(jù)大都存在需要治理的各種質(zhì)量問題。
數(shù)據(jù)治理的定義是對數(shù)據(jù)資產(chǎn)的管理行使權(quán)威與控制(規(guī)劃、監(jiān)控和執(zhí)行),對企業(yè)中使用的數(shù)據(jù)的可獲得性、可使用性、完整性、一致性、可審計性和安全性進行全面管理。數(shù)據(jù)治理的目的是確保根據(jù)政策和最佳實踐對數(shù)據(jù)正確地進行管理,數(shù)據(jù)治理的驅(qū)動力通常集中在降低風險與改進流程上(DAMA-DMBOK2)。
目前數(shù)據(jù)治理工作中的問題與誤區(qū)
金融行業(yè)已經(jīng)經(jīng)歷了比較久的數(shù)據(jù)治理歷程,一些企業(yè)積累了豐富的數(shù)據(jù)治理經(jīng)驗,無論實施路徑,解決方案,還是具體實施,如果沒有抓住重點,治理工作很難取得實質(zhì)改進效果。
目前數(shù)據(jù)治理工作或多或少存在一些問題,主要表現(xiàn)為:
重建章立制,而很少深入到實際業(yè)務(wù)與數(shù)據(jù)之中去發(fā)現(xiàn)與解決實際問題,脫離實際數(shù)據(jù)治理活動;
數(shù)據(jù)治理工作常被設(shè)計為一個或若干個項目,沒有作為一項日常工作來做。早期有些企業(yè)轟轟烈烈啟動了項目,制定了激進的計劃,一旦遭遇挫折便偃旗息鼓;
數(shù)據(jù)的開發(fā)、管理與使用,沒有章法,沒有協(xié)作。如,盤點數(shù)據(jù)資產(chǎn)時,深度陷入字段級沼澤,遲遲得不到輸出,而業(yè)務(wù)系統(tǒng)、數(shù)據(jù)分析應(yīng)用一直在動態(tài)變化中,與數(shù)據(jù)治理各行其是,因此輸出的數(shù)據(jù)資產(chǎn)清單新鮮度低,可用性差;
數(shù)據(jù)治理常常被當作重要而不緊急甚至是不重要、不緊急的工作,在面臨緊急的業(yè)務(wù)需求時,常受所謂的敏捷開發(fā)干擾,一邊治理問題,一邊制造問題。
有些企業(yè)雖經(jīng)過10多年的數(shù)據(jù)治理,但沒有取得實質(zhì)進展,僅是低水平的重復(fù):數(shù)據(jù)資產(chǎn)快速膨脹,但高價值資產(chǎn)不多;日常工作效率不高,長期見效緩慢;系統(tǒng)建設(shè)周期性推倒重來,沒有積累沉淀;數(shù)據(jù)建設(shè)、使用與治理的成本以及被監(jiān)管部門的處罰長期居高不下。越來越多的數(shù)據(jù)管理部門認識到數(shù)據(jù)治理工作陷入了困境,步履維艱。
主要原因可以歸納為以下幾個方面:
數(shù)據(jù)治理依據(jù)不充分:數(shù)據(jù)治理的立法與司法職能欠缺,數(shù)據(jù)治理者執(zhí)法依據(jù)不完善,沒有得到高層管理支持,沒有執(zhí)行力;
沒有達成一致的目標:咨詢可能提出了一個空洞的或不切實際的目標,開發(fā)部門以快速支持業(yè)務(wù)為目標,甚至有些部門以增加數(shù)據(jù)資產(chǎn)為目標,都不以定義與交付高質(zhì)量資產(chǎn)為前提,沒有認識到高質(zhì)量的數(shù)據(jù)帶來的價值;
路徑不清晰:有些走過場的數(shù)據(jù)治理咨詢項目交付了一條沒有如何達到目標、沒有實操的實施路徑,甚至可能數(shù)據(jù)治理走出的第一步就錯了;
職責不明確:數(shù)據(jù)生產(chǎn)者、消費者與管理者等干系人之間關(guān)于數(shù)據(jù)管理的認知存在巨大的差異,職責不明確,生產(chǎn)者不對自己生產(chǎn)的數(shù)據(jù)負責,治理部門對資產(chǎn)的膨脹缺少有效控制;
專業(yè)能力不足:受過數(shù)據(jù)管理專業(yè)培訓(xùn)的人員很少,合格數(shù)據(jù)治理專業(yè)人員更少,沒有形成數(shù)據(jù)治理文化與社區(qū);
缺乏有效的工具:缺少便于生產(chǎn)者、管理者和消費者之間溝通協(xié)作的工具來支持日常數(shù)據(jù)管理工作,以提升工作質(zhì)量與效率。
充分利用企業(yè)數(shù)據(jù)模型驅(qū)動數(shù)據(jù)治理工作
良好的數(shù)據(jù)治理工作除了設(shè)立組織機構(gòu)、建章立制之外,還需要設(shè)置和強制執(zhí)行數(shù)據(jù)質(zhì)量和數(shù)據(jù)架構(gòu)標準,作為治理與行政的依據(jù),確保數(shù)據(jù)在全企業(yè)范圍內(nèi)被準確、一致的定義、產(chǎn)生和使用。
許多企業(yè)的數(shù)據(jù)治理工作一般先制訂數(shù)據(jù)標準,以數(shù)據(jù)標準為依據(jù)治理數(shù)據(jù)。數(shù)據(jù)標準僅是衡量數(shù)據(jù)質(zhì)量的參考依據(jù)之一。
很多數(shù)據(jù)標準沒有建立清晰的概念與邏輯關(guān)系,缺少理解標準目錄的詞匯與分類體系,使用者不清楚數(shù)據(jù)標準背后的邏輯,沒有公共理解的基礎(chǔ),數(shù)據(jù)治理工作大多僅限于治理孤立的數(shù)據(jù)類型與碼值;
以Excel、Word、PPT等文件形式展現(xiàn)的數(shù)據(jù)標準,所能表達的內(nèi)容很有限,所能度量的數(shù)據(jù)質(zhì)量維度也有限,數(shù)據(jù)的完整性與一致性不是其追求的目標,不能直接轉(zhuǎn)化為可以實施的細節(jié)與執(zhí)行的依據(jù);
把實施寬泛的大而全的數(shù)據(jù)標準作為數(shù)據(jù)治理的切入點或啟動項目不是一個好的選擇。大而全的數(shù)據(jù)標準可能還沒有實施就已經(jīng)過時。
企業(yè)數(shù)據(jù)模型使數(shù)據(jù)治理真正成為現(xiàn)實。企業(yè)數(shù)據(jù)模型作為業(yè)務(wù)元數(shù)據(jù),提供了數(shù)據(jù)的參考分類框架、關(guān)鍵實體與關(guān)系的定義,以及企業(yè)數(shù)據(jù)元素的標準定義,作為支持數(shù)據(jù)治理利益相關(guān)者協(xié)作、自助服務(wù)和數(shù)據(jù)資產(chǎn)探索等核心基礎(chǔ)設(shè)施,為明確數(shù)據(jù)治理目標形成全面的認知與共識,為如何成功實施達到目標奠定基礎(chǔ)。
對數(shù)據(jù)進行分類,是理解數(shù)據(jù)對數(shù)據(jù)進行治理的第一步。數(shù)據(jù)模型是一種本體論模型,它首先定義數(shù)據(jù)類別,使用既定的規(guī)則收集、管理這些不同類別數(shù)據(jù)。企業(yè)數(shù)據(jù)模型主題域清單表達企業(yè)最關(guān)鍵的領(lǐng)域——是最重要的分類方法之一。銀行業(yè)數(shù)據(jù)標準的主題劃分一般參照成熟的行業(yè)數(shù)據(jù)模型,每個主題之下的劃分標準,各家銀行有比較大的差異;
對數(shù)據(jù)有準確的定義與一致的理解,是衡量數(shù)據(jù)是否符合要求,進行數(shù)據(jù)管理活動的基礎(chǔ)。許多數(shù)據(jù)問題是因為各種概念沒有清晰的定義造成的;
數(shù)據(jù)之間的關(guān)系表達了業(yè)務(wù)規(guī)則,是企業(yè)數(shù)據(jù)實現(xiàn)與使用需要遵循執(zhí)行的依據(jù),但這一點普遍被忽視;
企業(yè)數(shù)據(jù)模型可以幫助數(shù)據(jù)管理人員識別和定位敏感數(shù)據(jù),設(shè)計不同用戶訪問控制權(quán)限以強制執(zhí)行機密性、完整性與合規(guī),確保敏感數(shù)據(jù)得到保護;
企業(yè)數(shù)據(jù)模型幫助干系人站在企業(yè)的視角而不是局限于某個特定的系統(tǒng)或特定的數(shù)據(jù)集,可以發(fā)現(xiàn)影響全局的系統(tǒng)性問題,而不是一個局部范圍,或者某個設(shè)計師的問題,可以有的放矢,重點解決系統(tǒng)性的問題,推動高效治理。
數(shù)據(jù)的定義、分類與關(guān)系的表達形式是ER模型圖,模型的可視化帶來友好性,可以面向各類人員,因此企業(yè)數(shù)據(jù)模型是數(shù)據(jù)管理必不可少的基礎(chǔ)設(shè)施工具。
企業(yè)數(shù)據(jù)模型一般采用IDEF本體論建模圖形化方法,易于理解,便于不同的用戶討論、辨析與定義數(shù)據(jù)表達的本體,使各類用戶的認知達成一致;
基于企業(yè)數(shù)據(jù)模型規(guī)劃數(shù)據(jù)治理工作,幫助制訂如何達到目標的實施路徑與長期漸進的計劃。在模型體系指導(dǎo)下,自上而下從關(guān)鍵的主題開始(如跨各業(yè)務(wù)系統(tǒng)的參與人、機構(gòu)、員工等,高級管理人員不被細節(jié)所困擾,實施人員更容易理解和消化重點)逐個主題、逐個關(guān)鍵實體穩(wěn)步推進,自下而上從關(guān)鍵的屬性開始治理(如證件類型、幣種代碼等);
基于企業(yè)數(shù)據(jù)模型安排責任分工與協(xié)作,支持日常數(shù)據(jù)管理工作。將明確的、透明的、正式的責任和行動應(yīng)用于組織與流程實踐,建立相互協(xié)作信任,保證每項數(shù)據(jù)治理任務(wù)都有明確的治理內(nèi)容與RASCI責任人,確保它處于受控狀態(tài),提升數(shù)據(jù)治理實施的效率與績效;
基于企業(yè)數(shù)據(jù)模型體系有效管理數(shù)據(jù)資產(chǎn),指導(dǎo)、盤點數(shù)據(jù)資產(chǎn)。建立統(tǒng)一的數(shù)據(jù)資源目錄統(tǒng)一管理維護,避免陷于治理沼澤,幫助數(shù)據(jù)治理人員獲得數(shù)據(jù)資產(chǎn)狀態(tài)信息,哪些方面存在問題以找出需要治理的有毒資產(chǎn),哪些得到了增強和改進,作為最終用戶跟蹤、控制、判斷是否符合數(shù)據(jù)治理要求的衡量參考標準,提高交互效率,減少溝通成本。
企業(yè)數(shù)據(jù)模型是企業(yè)綿延數(shù)十年的積累,覆蓋業(yè)務(wù)經(jīng)營、管理和決策數(shù)據(jù)需求,是數(shù)據(jù)領(lǐng)域長期發(fā)展的穩(wěn)定基石,預(yù)防新數(shù)據(jù)問題的發(fā)生,支持可持續(xù)發(fā)展。
銀行的業(yè)務(wù)發(fā)展變化是相對穩(wěn)定的,業(yè)務(wù)邏輯很少發(fā)生顛覆性的改變,業(yè)務(wù)的變化同步更新到企業(yè)數(shù)據(jù)模型中。企業(yè)數(shù)據(jù)模型是新系統(tǒng)開發(fā)的關(guān)鍵輸入與數(shù)據(jù)需求和建模的基線,指導(dǎo)和規(guī)劃業(yè)務(wù)系統(tǒng)與分析系統(tǒng)的模型設(shè)計,可以預(yù)防數(shù)據(jù)問題的發(fā)生;
由于技術(shù)的快速發(fā)展以及企業(yè)應(yīng)用架構(gòu)的優(yōu)化,許多銀行業(yè)務(wù)應(yīng)用系統(tǒng)每隔若干年都會大規(guī)模開發(fā)“新一代”。重用企業(yè)數(shù)據(jù)模型的組件,監(jiān)控新系統(tǒng)的數(shù)據(jù)模型設(shè)計與數(shù)據(jù)分布,可以減少大量數(shù)據(jù)重構(gòu)與遷移工作,提升數(shù)據(jù)的質(zhì)量,保護歷史投資,實現(xiàn)可持續(xù)發(fā)展;
數(shù)據(jù)治理不應(yīng)僅專注于數(shù)據(jù)的治理而忽視數(shù)據(jù)分布流轉(zhuǎn)的治理,不合理的應(yīng)用架構(gòu)與數(shù)據(jù)流轉(zhuǎn)造成的數(shù)據(jù)問題往往是成片成面的,甚至是災(zāi)難性的。如一些業(yè)務(wù)系統(tǒng)數(shù)據(jù)經(jīng)過數(shù)據(jù)中臺或ODS復(fù)雜的整合,作為數(shù)據(jù)倉庫模型的貼源區(qū),不但拉長了加工路徑,大大降低了時效性,由于數(shù)據(jù)中臺或ODS的整合可能使源數(shù)據(jù)面目全非,導(dǎo)致數(shù)據(jù)倉庫在設(shè)計模型時很難還原出業(yè)務(wù)源模型,這樣混亂的數(shù)據(jù)流架構(gòu)在原本數(shù)據(jù)質(zhì)量不高的業(yè)務(wù)數(shù)據(jù)中制造了更多的垃圾。
寫在最后
做正確的事,正確地做事。只有站在企業(yè)架構(gòu)的高度,圍繞企業(yè)數(shù)據(jù)模型核心,關(guān)注技術(shù)架構(gòu)與應(yīng)用架構(gòu)對數(shù)據(jù)可能造成的負面影響,明確各自的職責,達成一致的目標,提升專業(yè)能力,精心設(shè)計專業(yè)科學(xué)的方法與清晰的實施路徑,才能實施有效的數(shù)據(jù)治理,與應(yīng)用架構(gòu)、技術(shù)架構(gòu)協(xié)同支持業(yè)務(wù)目標的實現(xiàn)!