釋放數據資源價值亟需拔掉“數據煙囪”
當前,數據作為數字經濟中的“新石油”,已成為重要的生產要素。發揮數據要素價值,激發數字經濟潛能,需通過開放、共享、交易等實現數據的連接、打通和流動。通過盤活數據資源、豐富數據維度,可充分釋放大數據價值,優化資源配置、提高協同管理效率、節約社會成本以及創造更多的社會財富。但由于前期數據管理意識待提高,數據系統分散,造成了當前各大機構、各行業“數據煙囪”林立的局面。目前,數據資源無法聚合集約和互聯互通已成為當下數字經濟發展的關鍵障礙和瓶頸。
一、“數據煙囪”的表現形式
(一)政府部門數據“條塊分割”
政府機構建立了以部門為中心、以業務為主線的政務信息化發展模式,采用的是縱向數據采集機制,即基層人員采集數據,并上報給各自部門系統,各部門只能向體系內基層采集數據。各部門獨立進行信息化建設,數據儲存在不同地方,格式也存在差異,部門之間橫向相互調取直接使用存在困難,從而導致政府部門掌握的海量數據長期處于“條塊分割”和休眠狀態。
(二)企業內外部數據“壁壘堅固”
企業發展到一定階段會建立多條業務線,不同業務線獨立收集、存儲、定義自身的業務數據,各部分業務數據未被統一存儲、管理以及有機整合。此外,從整個產業生態看,各企業在業務發展過程中積累了大量數據,并將其作為企業重要資產進行管理,形成了一個個“數據煙囪”。比如,當前海量數據被阿里、騰訊、百度等為數不多的互聯網巨頭所壟斷,這些數據寡頭獨立自建內部的、封閉管理的數據庫,作為重要數據資產執行嚴格管理。
(三)高校及研究機構科學數據獲取“樊籬圍堵”
高校及研究機構科學數據獲取“樊籬圍堵”。一方面,同一領域內的科研從業者往往獨立采集相關部分的科研數據,科研數據分散在各個科研工作者手中或研究組織內部,且各方持有的數據普遍存在重復和質量層次參差不齊的問題。另一方面,部分有助于科研的如人文與社會科學、環境科學以及公共健康等領域的公眾數據存儲在相關政府部門,這導致諸科研工作者獲取數據存在一定困難。
二、“數據煙囪”的三大危害
(一)系統服務效率低下
一方面,政府、企業、組織等機構內部不斷投入不同的人力執行收集重復數據、單獨維護不同數據存儲系統的重復造輪式工作,這將嚴重浪費機構內部的人力、物力等資源,導致不合理的資源配置。此外,當需要開展跨業務數據合作時,往往需要開展大規模數據拷貝、遷移等工作,這導致大部分人力資源被耗費在數據準備階段,整個數據系統持續效率低下地運轉。另一方面,封閉阻塞的數據僅能服務于單個機構,在跨領域、跨部門的系統性社會工作開展中將會失效。例如,偵查活動過程中往往需要不同省市偵查部門的數據信息,以及房產、水電、物流等一線社會數據,這些數據大都各自封閉,且偵查人員無權限調取,嚴重阻礙了偵查事件的開展。
(二)用戶成本疊加
各機構在數據服務過程中筑建的“數據煙囪”導致數據使用者(用戶)不斷重復支付服務接收成本。例如,在政務服務場景,同樣的個人信息被要求在不同的政府部門反復提交;相關業務無法實現“線下一窗受理”,用戶需在不同地方或窗口奔波,反復提交重復數據。在企業產品使用場景,同一企業的關聯產品需要注冊登錄不同的賬號;搜索引擎僅能搜索到由搜索公司自己“設計”的部分感興趣內容等。
(三)大數據價值無法發揮
與傳統要素相比,數據要素最明顯的特征就是其單一數據個體是不存在價值的,只有聚合、流轉起來才能具有價值。因此,小而孤立的數據系統無法實現海量數據的關聯和聚合,也就無法通過數據技術全面挖掘大數據潛藏的深度信息,并利用這些信息驅動業務增長、支持機構內部系統性決策等,也無法帶來對外的服務效益和價值,以促進行業產業聯合發展、激活數字經濟。例如,淘寶、京東、拼多多等平臺積累的具有公共服務屬性的數據如果僅供企業自身使用,便只能用于提升其單個企業的市場營銷能力,若將此類數據在保護個人隱私的前提下,以“物理分散、邏輯集中”的方式匯聚至國家大數據平臺服務于公共決策,便可進一步升級、發揮互聯網數據價值。
三、“數據煙囪”難以消除的原因
(一)基于權力利益考量,不愿開放共享數據
一方面,大多數機構均將數據視作為支撐其內部發展、保持市場競爭力的重要私產,數據開放共享意味著讓渡自身權力和利益,會導致數據壟斷的優勢被迅速瓦解。此外,開放共享數據也意味著將機構內部相關事件過程透明化,由此帶來的透明化監督成為部分機構的壓力,因而主觀上更加不愿開放共享數據。另一方面,隨著數據指數性增長,機構收集的數據類型愈加復雜,非結構化數據愈加增多,加之數據清洗、轉化能力與所需處理的數據規模不匹配,數據質量越來越難以把控,這大大提高了數據維護成本,機構在數據開放共享中投入動力受到影響。
(二)基于責任風險和收益權衡,不敢開放共享數據
數據可能涉及個人隱私、商業秘密甚至國家安全的相關信息,部分法律條款或者機構管理規章針對特定機構均明確提出不得隨意對外提供相關數據。此外,由于當下數據開放共享制度尚不完善,上下游責任邊界尚未清晰,即使是沒有受到相關制約的機構,也對向外提供數據的行為表示擔憂,故而更加審慎地選擇了不共享。
(三)基于關鍵技術制約,不能開放共享數據
一方面,機構按各自標準建設數據系統,導致不同機構的數據采集格式、數據存儲方式不統一,嚴重阻礙了數據流通。另一方面,當前確保數據安全流通的數字技術應用尚未發展成熟,數據流通過程中存在的責任難以確定、個人隱私信息及企業敏感數據泄露等系列安全問題難以杜絕,導致數據資源開放共享受阻。
四、促進數據流通和價值釋放的三點建議
(一)夯實數據要素基礎管理
一方面,加強數據分類分級管理。可考慮按照數據泄露可能造成的風險大小、數據敏感程度、數據內容的生產方式(原生、衍生)、數據的不同主體(個人、企業、政府)等多維度對不同場景的數據進行分類,針對不同類型的數據劃分不同的風險等級,對不同級別的數據制定不同約束程度的共享、開放等流通要求。另一方面,建議加大對數據法律屬性的理論探索,開展理論創新,突破當前單一權屬理論“一刀切”的處理方式。同時,在數據分級分類的基礎上,可考慮對不同類型、不同級別的數據進行差異化的權屬處理,因類施策、因級施策,開展針對性的制度設計,以促進數據資源的合理配置,解決數據不愿共享問題。
(二)針對不同場景制定不同的數據流通機制
對于政府機構,適當考慮對部分機構數據共享具有強約束力的法律條款進行修訂,并通過制定數據共享清單、明確責任邊界,促進政務數據安全共享,解決數據不敢共享問題。對于企業,鼓勵企業創建“數據湖”等企業數據平臺,建設數據文化,對內優化管理提高業務效率;完善企業間數據交易制度,借鑒歐盟經濟區數據貨幣化、數據市場、行業數據平臺等企業間數據共享模式,鼓勵企業間通過自愿共享、數據交換和數據交易等方式依法開發利用社會數據。政府與非政府機構之間,健全數據開放共享機制,可通過政府數據開放共享平臺,為企業、研究機構等提供發展所需數據;建立“物理分散,邏輯集中”的國家大數據平臺,可采用數據調用等手段,接入大型互聯網企業所持有的涉及公共管理、國家安全的特定數據,以促進數據在政府與非政府機構間的雙向流通。
(三)強化保障數據有序安全流通的技術手段建設
一是建議制定出臺國家層面統一的數據共享技術標準,明確大數據歸集整合、政府數據開放、政府數據和企業數據共享交換、數據交易等標準規范及實施細則,并要求特定機構參照數據相關標準設計數據接口,解決技術制約下的數據不能共享問題。二是加快發展同態加密、混淆電路、秘密分享、零知識證明等多方安全計算、密碼學、區塊鏈等相關技術,支持在數據“可用不可見”基礎上創新數據的開發利用。三是鼓勵相關機構在探索實現數據安全有序流通路徑的過程中,開發、使用追蹤數據使用情況及流向的工具,保證數據狀態和用途的可知性及可控性。