數據治理是市場化個人征信機構的核心競爭力
數字經濟的發展為金融業注入了充沛的活力,也為市場化個人征信行業的發展帶來了機遇。《金融科技發展規劃(2022-2025年)》強調充分釋放數據要素潛能,強化數據能力建設,建立涵蓋數據全生命周期的數據治理體系。在數據要素市場持續健康發展過程中,加強征信數據治理,提高數據質量,促進數據融合,保障數據安全合規,從而挖掘數據價值,全面提升征信機構的數據服務能力,已經成為市場化個人征信機構的“芯片級”的核心競爭力。
市場化征信機構數據治理包括“一個聚焦三個全面”。“一聚焦”指聚焦于征信機構對外服務的數據治理,即市場化個人征信機構從外部金融機構、互聯網平臺采集信用數據,經過整理加工,再重新服務于金融機構、互聯網平臺的過程。不包括針對目前談論很多的內部管理運營方面的數字化轉型等。當然,市場化個人征信機構自身提高數字化建設水平,利用體系內數據,增強運營效率和決策能力,配合外部合作機構,共同打造開放式的征信平臺,也是我們關注的命題。“三個全面”包括全流程、全業務和全體系。“全流程”指數據治理涵蓋征信機構對外部數據進行采集、整理、保存、加工,以及數據挖掘、對外服務等數據全流程。“全業務”指征信機構數據治理的重點不僅包括元數據、主數據、數據標準等傳統內容,還應延伸至數據合規、數據安全、數據生命周期管理,以及異議處理等相關工作。“全體系”指數據治理本身具有較強的體系化特點,既包括核心的數據資產管理平臺的建設,也包括數據治理的戰略規劃、人員等制度保障等多個層面。

百行征信有限公司研究部總經理 田昆
一、深化數據治理是發展的必經路
現階段,市場化個人征信機構開展數據治理工作具有較強的緊迫性和必要性。具體體現為如下三個方面。
1.征信數據的質量提升需要數據治理
數據質量問題貫穿整個“數據供應鏈”,是征信服務基礎。《個人信息保護法》要求,處理個人信息應當保證個人信息的質量,避免因個人信息不準確、不完整對個人權益造成不利影響。市場化個人征信機構想要實現征信數據的準確、有效與易用,產出高質量的分析成果,首先需要保障源頭的數據質量,防止出現數據“garbage in”“garbageout”的情況。從數據采集端來看,市場化個人征信機構與銀行、助貸、小貸等各類主體廣泛開展信貸數據共享合作,數據來源渠道眾多,共享的方式多樣,不同機構的數據治理水平層次不齊,在缺乏強制性手段的情況下,采集端信貸數據質量難以保證。另一方面,支付等各類替代數據也是市場化個人征信機構重要數據采集來源,但替代數據標準建設尚不完善,機構間沒有形成對數據項的統一認識,替代數據共享容易產生數據結構、定義不一致的典型問題。提升數據質量是市場化個人征信機構開展數據治理的直接目標,需要完善數據治理機制,建立覆蓋數據全生命周期的數據質量評估、優化及監測體系,豐富校驗規則,靈活應用自動化工具。重點從完整性、準確性、一致性、唯一性、有效性五個維度提升征信數據的質量。
2.數據安全合規需要數據治理
征信作為具有公信力的基礎設施,肩負著維護信息主體合法權益,防止個人信息泄露和濫用的職責,需要遵守更為嚴格的安全和合規要求。合規方面,《個人信息保護法》要求,個人信息處理應當落實“告知—同意”規則,并按照“最小必要”原則采集個人信息,嚴格限制對敏感個人信息的處理。《征信業管理條例》賦予了信息主體多種權利,包括信息主體了解征信系統處理的關于消費者個人的信用信息內容的知情權,針對錯誤信息進行修改的異議權,以及刪除超出一定期限的不良信息的被遺忘權。市場化個人征信機構要保障上述權利的實現,在保證數據質量的基礎上,還需要做到對數據庫內數據的精細化、可視化、實時化管理,這也離不開數據治理制度與系統的支撐。安全方面,市場化個人征信機構保存大量個人敏感信息,在事前事中事后均需要加強數據安全治理。按照《數據安全法》要求,明確數據安全負責人和管理機構,建立定期的數據風險評估與監測制度;建立健全態勢感知、監測預警、安全防護、應急響應、恢復等數據運行能力保障,從訪問控制、身份認證、數據加密、數據防泄密、備份審計等角度實現“進不來”“改不了”“看不懂”“拿不走”“走不脫”的數據安全保護目標。
3.數據融合應用需要數據治理
個人征信的市場化發展推動了征信數據來源、采集方式的迅速豐富,也產生了各種征信數據之間融合應用的需求。在推動信貸數據共享合作過程中,市場化個人征信機構對信貸、助貸、擔保等的不同機構適用不同形式的接口,對于相同類型的機構可能也會采用“一行一策”,滿足金融機構的個性化訴求,包括對具體數據標簽項的增改,也包括針對少數標簽的“輕采集”方式,以及“二代征信”報文直接轉化的方式。相關數據均最終在同一份信用報告中展現,數據融合的復雜性可見一斑。此外,市場化個人征信機構正積極推動替代數據的應用,如支付、運營商、電商等。征信機構一方面要考慮來源特點,發揮同類型數據的融合互補作用;另一方面要結合信貸數據和其他替代數據,共同融合開發成征信產品。這其中千頭萬緒都要求市場化個人征信機構梳理盤點數據資產,開發統一的管理平臺,并持續深入至數據治理工作中。
二、百行征信數據治理的實踐探索
根據業務發展需要,百行征信成立數據治理與標準工作組,從戰略規劃、組織制度、系統建設三個層面持續深化數據治理工作,制定數據能力建設指引,廣泛開展內外部調研,積極推進數據資產管理平臺建設,形成元數據、數據安全與合規等一整套制度規范,構建完整、有效的覆蓋數據全生命周期的管理體系,推動數據能力全方位提高。
1.戰略規劃:揚帆遠航的“指南針”
加快制定公司層級的數據治理戰略規劃。數據治理是涉及公司多方位的體系化改造,要求各業務線、前中后臺之間的有效協調,也需要結合公司技術系統建設水平、數據資源以及業務應用的開展現狀進行綜合考慮。應當從管理層、領導層出發,從上向下全局部署數據治理方向,從而形成全面的標準規則體系和執行調度流程。戰略規劃是數據治理成為企業戰略核心任務應用的重要部分,是數據資產得到一定程度內外部應用的指導藍圖。
具體執上,首先結合市場化征信業務特點,制定征信領域《數據能力建設參考意見》,明確數據治理工作的總體目標,以及數據質量、合規等細分方向的要求。在此基礎上,可進一步開展內外部調研工作,重點對一線員工進行訪談,總結歸納內部存在的問題及外部建議,形成《調研報告》。調研應當覆蓋數據采集、數據運營、元數據、數據挖掘、數據安全合規等主要業務流程。結合公司資源稟賦與業務發展戰略,制定《實施路徑建議》,劃分工作層次,明確責任部門、資源投入與周期,分別確定數據治理推進路徑。總體上可按照“打基礎、建系統、定制度”的三步走路徑(見圖1所示)。

圖1 市場化征信機構數據治理總體框架
2.系統建設:協同前行的“劃船槳”
系統建設是數據治理戰略落地的主要載體,也是數據管理活動的實操平臺,需要市場化征信機構盡快整合技術資源,搭建統一的數據資產管理平臺(見圖2所示),具體包括元數據管理、主數據管理、數據標準管理、數據質量管理、數據應用管理、數據安全管理、數據合規管理七個方面的職能模塊。

圖2 市場化征信機構數據資產管理平臺
市場化征信機構數據治理的基礎系統工作是元數據管理。元數據是數據的數據,是對數據的結構化描述,使得數據更容易理解、查找、管理和使用。元數據主要包括業務元數據和技術元數據兩類。業務元數據可以消除了數據二義性,尤其是相似信貸數據之間的混淆,讓業務人員對數據有一致的認識,避免“各說自話”,進而為數據分析和應用提供支撐。技術元數據通過理清數據關系,明確存儲、機構,讓業務人員快速定位所需的數據,實現數據血緣追溯和影響分析,為產品開發和系統集成服務。元數據構成了征信數據從采集、加工再到延伸拓展的關鍵節點,應當作為市場化個人征信機構開展數據治理工作的起點。搭建元數據管理系統,配合相應管理辦法及技術規范,梳理數據資產,建立元數據字典,并完善元數據采集、訪問、管理、分析、開發支持等主要功能。
在元數據工作基礎上,要繼續實現數據標準管理和主數據管理的職能。數據標準能夠統一數據定義、數據分類、記錄格式和轉換、編碼等,實現數據的標準化。包括采集標準、數據存儲、標簽命名、衍生等一系列標準和原則等均需要在初期重點關注。數據標準管理包括標準制定、標準實施、標準評估等。市場化征信機構的主數據指個人、企業征信數據庫中的信貸數據,此部分為征信業務所需要的關鍵資源,應盡快地建立技術、運營、產品共享的主數據庫,可考慮建設單獨的主數據庫。針對市場化征信機構使用頻繁的替代數據亦可納入主數據的管理范疇。
在上述的架構、標準、規范工作基礎上,可以進一步完善市場化征信機構數據質量管理,具體包括來自信息主體的數據準確性評價和來自產品開發部門的價值評價。市場化征信機構可建立起數據質量需求、數據質量檢查、數據質量分析、數據質量提升在內的一整套自動化系統方案,對采集、使用過程中的數據進行持續的格式、邏輯校驗與分析,確保數據的完整性、準確性、一致性、及時性,提升數據應用效果的穩定性。數據質量是數據應用分析的保障,在高質量的數據管理的支持下,可以實現數據挖掘、數據應用等主要功能。
此過程中,數據安全管理、數據合規管理將貫穿數據治理與標準工作始終。其中數據安全包括數據安全策略、數據安全管理、數據安全審計,可以借助縱深防御體系等成熟的技術防護架構,建立多重安全防護架構,確保核心數據防泄漏,并加強數據使用行為監控審計,可以運用安全態勢感知、大數據分析技術,主動發現和追溯數據泄露,及時采取有效控制措施。數據合規包括數據采集規則、數據授權、授權核查管理、異議處理更正、征信數據過期銷毀等環節,可考慮嘗試通過區塊鏈及零知識證明等技術持續完善征信機構個人信息授權核查機制。相關工作為各項管理職能落地和統籌提供了有力支撐。
3.制度保障:行穩致遠的“壓艙石”
為了保障數據治理工作的有序開展和長效落地,市場化征信機構還應設計一套有針對性的數據資產的管理流程、管理機制和考核評估辦法,通過管理的手段明確各方“責權利”。并建立一套覆蓋數據共享、處理、應用等覆蓋數據生命周期的管理辦法,從制度層面保障數據治理工作規范有序、長期運轉。具體包括但不限于元數據管理辦法、數據標準管理辦法、數據質量管理辦法、數據安全管理辦法等對應具體管理模塊的規范。
同時,管理辦法還需配套相應的技術規范文件,明確實操的技術細節,為辦法落地提供基礎,避免籠統性、概括性表述。以元數據管理為例,可包括元數據的獲取、命名規則、數據模型、注冊分類、日常維護、落地應用等一系列流程,并考慮指定相應的牽頭部門進行管理。制度執行的過程中需要進行事中監控與事后考核,確保制度落實到位。事中監控包括對項目的評審,以及數據運營情況的動態監測;事后則需建立考核指標,真正將數據治理納入部門日常工作職責中來。
此外,針對公司整體的數據治理情況,可設置數據審計機制,從而綜合地評估公司數據治理水平,明確下一階段工作方向。審計內容既包括對數據資源安全性、準確性、完整性、規范性、一致性、唯一性和時效性的基礎評估,也應包括數據治理戰略規劃、制度規范等的執行落實情況。審計過程中可考慮信息技術審計及監管科技的應用。加強培訓宣傳。培訓宣傳是實施數據治理的重要組成部分,公司內有序的協調需要公司上下較為一致的思想與意識。企業開展數據治理的培訓教育周期、培訓內容和參與方式,包括:數據治理體系培訓,行業內、外部單位優秀經驗溝通與交流等。
三、培育數據治理的核心競爭優勢
1.構建開放化中臺,推動打造征信生態
數據資產管理平臺是數據治理的核心平臺,在此基礎上,市場化征信機構還應進一步完善平臺功能,打造一站式的數據中臺,為開放的征信生態建設夯實系統建設基礎。一方面需要通過前期的業務積累和金融科技公司的支持,沉淀形成眾多易用的數據應用工具及分析成果,形成金融機構自主化、定制化的建模風控平臺;另一方面,也需要完善數據產品服務能力,構建模塊化的產品開發模式與敏捷開發能力,支撐征信生態的高效運轉。技術實現上,數據中臺可運用Hadoop技術棧、New SQL技術棧和圖數據庫技術棧等,結合數據倉庫、元數據、數據沙箱等技術,采用批流結合的數據處理模式,構建產品迭代的高速流水線,數據存儲能力達PB級別,日數據加工能力達TB級別,數據服務TPS達數萬級別,降低數據資產管理成本。在實現數據資產精細、動態、系統化管理的基礎上,數據中臺將成為連接合作伙伴的紐帶、促進行業發展的抓手,在安全合規、自主可控的前提下,實現數據智能驅動,成為數據共享、行業應用的孵化器,以及打通信息流、商務流、資金流的價值中樞,全面提升數據能力、產品能力、技術能力和整體對外服務能力,在業務平臺化的基礎上,實現產業生態化,構建專業開放、協作共享和高科技賦能的征信生態圈和產業鏈。
2.開展征信標準建設,促進數據互聯互通
2021年新出臺的《征信業務管理辦法》將替代數據明確納入信用信息的范疇。原有征信替代數據市場將會發生洗牌,在行業整改規范過程中,替代數據源的采集應用的規則、范式都需要通過持牌的征信機構重新進行明確。市場化征信機構可結合市場應用情況,針對支付、運營商、設備等各類替代數據,積極開展數據標準建設,覆蓋數據處理業務流程。采集端,配合相關平臺方,加強數據采集管理,嚴格落實《個人信息保護法》“最小必要”原則,通過數據采集端標準化,有效保障替代數據質量,促進不同機構之間數據融合共享,推動采集方對采集信息的客觀公正展示,保障用戶知情權;應用端,強化評分產品可解釋性,避免算法歧視,解決非授權、非公允的大數據征信問題,落實金融科技創新的倫理要求。此外,市場化個人征信機構可積極完善信貸數據標準,推動建立與公共征信機構之間的數據共享機制,并探索與境外征信機構的征信標準互認,推動跨境征信的發展。
數據是新時代重要的生產要素,是國家基礎性戰略資源,而數據治理則是實現激活數據要素潛能,實現數據要素有序流轉、應用的“鑰匙”。中國市場化個人征信機構作為數據要素應用的行業探路人,需要不斷強化數據治理能力,打造核心競爭力,真正發揮征信作為金融基礎設施的公信力,提升服務意識與服務效率。