<menu id="guoca"></menu>
<nav id="guoca"></nav><xmp id="guoca">
  • <xmp id="guoca">
  • <nav id="guoca"><code id="guoca"></code></nav>
  • <nav id="guoca"><code id="guoca"></code></nav>

    數據暴政與數據光明

    VSole2022-06-09 11:26:54


    背景:現如今,空前且大規模的人類行為數據的可用性正在深刻地改變著我們所處的世界,經濟學、公共衛生學、醫學、生物學、城市科學等在這一趨勢中都受到影響。各個組織、公民個人正在積極嘗試、創新和改編算法決策工具以了解全球人類行為模式,并為解決社會重要性問題提供決策支持。


    在這篇文章中,作者提出要在大數據背景下積極利用人類行為數據,通過分析人類行為數據,為公共衛生、災害管理、安全、經濟發展和國家統計等政策提供信息,解決社會重要問題。但作者也指明數據驅動的公共產品算法決策具有風險性,包括對隱私的侵犯,缺乏透明度,信息不對稱,社會排斥和歧視,如果不加重視會導致“數據暴政”的出現。因此作者在這篇文章中提出了三點建議,希望加強決策的民主化,發揮數據驅動型決策的積極作用而減小其負面影響。


    作者將這篇文章分成四部分,首先指明數據驅動決策的意義和存在的問題,第二部分通過案例說明數據驅動算法有利于決策的優化,第三部分說明其存在缺陷,最后提出改善建議,希望發揮數據驅動算法的優勢以解決社會重要問題。


    第一部分 數據驅動決策的重要性和存在的問題

    人類行為數據已經從稀缺的資源發展成為大規模的實時流,作者強調了通過數據驅動的算法決策創造的積極機會:例如推斷社會經濟國家和個人的狀況和犯罪預測,測繪疾病的傳播,或了解自然災害的影響;同時也提醒從業者應該意識和解決的潛在負面后果,防止“數據暴政”的出現。作者在這篇文章中多次提到了黑匣子決策,即只能看到結果無法看到過程,黑匣子決策缺乏透明度和問責性,可能犧牲公民的個人權利,造成數據暴政,例如威廉?伊斯特利表示全球經濟發展和扶貧項目受到“專家專制”的支配,這些“專家”將諸如貧困或正義等多層面的社會現象縮減為一套技術解決方案,這些技術解決方案沒有公民參與,沒有對“專家”的問責,缺乏公平,易導致數據暴政。作者希望通過確保數據決策的透明度,實行問責制和保障公民參與,從而實現數據驅動的民主化決策

    第二部分,數據驅動算法有利于決策優化

    作者建議利用大規模的相關數據流來挖掘和訓練算法,可以提高分析和技術能力,用基于機器學習的算法來處理人為決策極限的復雜問題。人類決策有明顯的局限性,例如腐敗、低效或不公正,向數據驅動算法的轉變反映了對客觀性,以證據為基礎的決策以及對資源和行為的更好理解的探索。

    Diakopoulos 將算法的功能分為四大類:(1)分類,根據信息的特征將信息分類為單獨的“類” (2)確定優先次序,強調和排列特定信息或結果的排名,以犧牲他人為基礎的預定義標準; (3)關聯性,確定實體之間的相關關系;和(4)基于預定標準過濾,包含或排除信息。

    功能

    類型

    示例

    分類

    聲譽系統,新聞評分,信用評分,社交評分

    Ebay, Uber, Airbnb; Reddit, Digg; CreditKarma; Klout

    優先級

    一般搜索引擎,元搜索引擎,語義搜索引擎,問答服務

    Google, Bing, Baidu; image search; social media; Quora; Ask.com

    關聯性

    預測發展和趨勢

    ScoreAhit, Music Xray, Google Flu Trends

    過濾

    垃圾郵件過濾器,兒童保護過濾器,推薦系統,新聞聚合器

    Norton; Net Nanny; Spotify, Netflix; Facebook Newsfeed

    根據以上算法進行功能分析,可以計算出何為社會有益算法,即最能使公共產品決策和資源優化的算法,這些算法旨在分析來自各種來源的大量人類行為數據,然后根據預先確定的標準選擇與其預期目的最相關的信息。作者通過分析下列具體案例,強調了數據算法的積極作用:

      第一,犯罪行為動態分析和預測性警務

    首先,作者介紹了犯罪行為動態分析的兩種模式:1、是以人行為數據為中心的模式,主要用于個人或集體犯罪分析。Wang等人提出了一種名為“系列發現者”的機器學習方法,用于檢測同一罪犯或罪犯群體所犯罪行的具體模式;2、以地方為中心的警務實踐模式,對犯罪熱點檢測、分析和解釋。Toole等人提出了數學、物理和信號處理的定量工具的新穎應用,分析刑事犯罪記錄中的空間和時間模式。

    其次是預測性警務的運用方法正從學術領域轉向警察部門。總的來說,目前正在使用四種主要的預測性警務方法:(1)預測犯罪地點和時間的方法;(2)檢測罪犯和標記將來有犯罪風險的人的方法;(3)確定犯罪者的方法;(4)確定群體或在某些情況下可能成為犯罪受害者的個人的方法。

    第二,推斷國家和個人的社會經濟狀況

    準確地衡量和監測關鍵的社會人口和經濟指標對于設計和實施公共政策至關重要。如今一些研究人員開始使用手機數據、社交媒體和衛星圖像來推斷個人用戶的貧困程度和財富狀況,以創建高分辨率的地圖財富和貧困的地理分布,這為政府用來決定如何分配稀缺資源,研究經濟增長的決定因素提供了基礎。

    第三,數據驅動算法對公共衛生的意義

    數據算法有利于研究流行病學、分析環境和緊急情況,以支持政府決策或評估政府措施,并能更加精準評估精神健康。例如Tizzoni和Wesolowski等將傳統的流動性調查與手機數據(呼叫詳細記錄或CDR)提供的信息進行了比較,對疾病的傳播進行建模,特別是在調查可用性非常有限的低收入經濟體中,能持續監測流動模式,以支持決策或評估政府措施的影響;且在心理健康領域,一些研究表明通過手機和社交媒體收集的行為數據可以被用來識別躁郁癥,情緒,人格和壓力,這些新的行為數據來源可以在臨床環境之外監測心理健康相關的行為和癥狀,而不必依靠自我報告的信息,提升決策準確性。

    表格總結了本節回顧的文獻的主要觀點

    關鍵區域

    解決問題

    參考

    預測性警務

    犯罪行為分析

    Ratcliffe [67], Short et al. [72], Wang et al. [90]

    犯罪熱點預測

    Bogomolov et al. [10, 11], Ferguson

    [32], Traunmueller et al. [85]

    行為人/受害人身份證明

    Perry et al. [64]

    金融與經濟

    財富與貧困的映射

    Blumenstock et al. [8], Louail [49], Jean et al. [39], Soto et al. [76], Venerandi et al. [88]

    消費行為分析

    Singh et al. [73]

    信用評分

    San Pedro et al. [71], Singh et al. [74]

    公共衛生

    流行病學研究

    Frias-Martinez et al. [35], Tizzoni et al. [82], Wesolowski et al. [94]

    環境和緊急情況映射

    Bengtsson et al. [4], Liu et al. [48], Lu et al. [50]

    精神健康

    Bogomolov et al. [9], De Choudhury [20], de Oliveira et al. [25], Faurholt-Jepsena et al. [30], Lepri et al. [46], LiKamWa et al. [47], Matic and Oliver [52], Osmaniet al. [59]


    第三部分,數據驅動算法的負面影響


    大數據和機器學習方法對決策的潛在積極影響是巨大的,但作者也強調了數據驅動型決策的黑暗面。

    第一,侵犯隱私

    計算機濫用用戶披露的個人數據,以及作為數據代理的實體對來自不同來源的數據進行匯總,直接影響隱私。例如作者介紹的Kosinski等人最近的一項研究表明, 結合Facebook上的“喜歡”數據和有限的調查信息,能準確預測男性用戶的性取向,族裔出身,宗教和政治偏好,以及酒精,藥物和香煙的使用情況。

    第二,信息不對稱,缺乏透明度

    大規模積累和操縱客戶、公民的行為數據的能力,可能會使大公司或威權政府使用有力手段通過有針對性的營銷努力和社會控制策略來操縱人群中的部分人群。這會造成信息不對稱,在這種情況下,強大的少數人獲得和使用大多數人無法獲得的知識,從而導致或者加劇了國家或大公司與其他人之間現有的權力不對稱。此外,各種數據驅動的社會福利算法的性質和使用,缺乏公民參與,使得算法缺乏透明度,難以評估問責。

    第三,社會排斥與歧視

    算法決策程序可以再現現有的歧視模式,繼承先前決策者的偏見,或者簡單地反映社會上普遍存在的偏見,造成識別不公。識別不公平造成歧視性的結果不斷增長,但用于協助決策過程的黑匣子模型將呈指數級的復雜性。作者特別強調了需要透明和問責的機器學習模式,否則在機器驅動的決策嚴重影響人們的生活的情況下采用黑匣子方法可能導致形式上的算法污名,特別令人毛骨悚然的是那些被污名化的人可能永遠不會意識到這一點。

    第四部分,提出建議以減小數據驅動算法的消極面


    作者希望能夠發揮數據驅動型算法的積極作用,避免走向數據暴政,使算法功能強大并使其成為創造價值的工具,為此提出了三點建議:

    第一,以用戶為中心的數據所有權和管理

    作者提出建立以用戶為中心的個人數據管理模型,以使個人能夠更好地控制自己的數據。于是Enigma平臺基于個人數據生態系統(個人數據生態系統由個人數據的安全保管庫組成,完全由其所有者控制),利用最新的分散化技術,在密碼學和分散的計算機網絡創造了一種稱為區塊鏈的新技術,它以中間人的作用減少我們作為社會最重要的角色的影響 ,允許人們以安全、可靠和不可改變的方式將獨特的數字財產或數據傳輸給其他人,這種技術可以創建數字貨幣(比特幣),這些數字貨幣不受任何政府機構的支持。

    第二,增加算法的透明度和責任

    許多最先進的基于機器學習的模型(例如神經網絡)一旦部署就充當黑匣子,當這些模型被用于決策時,對于為什么以及如何做出決定缺乏解釋。為了解決這個局限性,最近在機器學習領域的研究工作已經提出了不同的方法來使算法更易于事前和事后檢查。例如,一些研究試圖通過引入識別的工具來解決算法中的歧視問題并糾正不必要的偏見。

    第三,創建生活實驗室進行試驗

    作者建議建立生活實驗室以便在現實生活中測試想法和假設。例如移動領土實驗室(MTL),一個意大利電信基金會,MIT媒體實驗室和西班牙電信發起的生活實驗室,通過多種渠道觀察了超過三年的100個家庭的生活,已經收集了來自多個來源的數據,包括智能手機,問卷調查,經驗抽樣調查等,并用于創建研究參與者生活的多層次視圖。尤其是,社交互動(例如,通話和短信通信),流動程序和消費模式等已被捕獲。 MTL的目標之一是設計個人數據存儲(PDS)技術共享個人數據的新方式,以促進更多的公民參與。

    綜上所述,在人工智能時代,我們不可避免的要接觸到各種數據,借助這篇文章我們對數據算法有了一個基本了解,并意識到數據分析對現實生活和公共事務決策的重要性,但是數據算法的負面影響也不容忽視,只有不斷減小甚至消除數據算法的負面影響,才能避免數據暴政,走向依據數據算法的民主治理,這也需要我們法律人的共同努力

    大數據決策能力
    本作品采用《CC 協議》,轉載必須注明作者和本文鏈接
    社會治理是國家治理的重要方面,社會治理現代化是國家治理體系和治理能力現代化的重要內容。習近平總書記強調,要“加快用網絡信息技術推進社會治理”。黨的十九報告提出,“打造共建共治共享的社會治理格局”“提高社會治理的智能化水平”。《中華人民共和國國民經濟和社會發展第十四個五年規劃和2035年遠景目標綱要》提出,要“以數字化轉型整體驅動治理方式變革”。
    近年來,中國廣播電視行業正在全面實施智慧廣電戰略,加快推進媒體深度融合,全國一網整合和廣電5G一體化發展取得重要進展,而高清、超高清視頻是5G最成熟的帶寬應用,5G+4K/8K+AI成為廣播電視行業重要的發展方向。2022年8月2日,“第30屆中國數字廣播電視與網絡發展年會暨第25屆國際廣播電視技術討論會”(CCNS & ISBT 2022)在歷史文化名城安徽合肥盛大開幕,會議主題是“新技術 新
    近年來,網絡空間已快速上升到大國間博弈的新戰場,以政企、科研機構為代表的APT攻擊、DDoS、工業互聯網攻擊等日益嚴峻,導致政企機構重要情報數據被竊取、工業互聯系統被破壞、金融基礎設施遭受到重大經濟損失,嚴重危害到了我國國家安全和社會經濟利益。
    隨著數據技術的不斷發展,以及其軍事應用優勢的日益顯現,以數據為關鍵基礎,智能決策、智能行動賦能全新作戰樣式、指揮模式和戰爭形態的時代即將到來。基于此,研究了美軍出臺的一系列軍事數據發展戰略,分析了美軍大力推動數據建設的主要需求,梳理了美軍加速推動數據建設的主要途徑和實施方法,闡述了美軍軍事數據的安全體系及關鍵技術,總結了美軍數據的發展趨勢,最后提出了數據發展的建議。
    第二條 本市行政區域內數字經濟促進相關活動適用本條例。第七條 市統計部門會同經濟和信息化部門完善數字經濟統計測度和評價體系,開展數字經濟評價,定期向社會公布主要統計結果、監測結果和綜合評價指數。市人民政府及其有關部門可以探索設立公共數據特定區域,建立適應數字經濟特征的新型監管方式。
    數據治理的最終目標是提升數據的價值,數據治理非常必要,是企業實現數字戰略的基礎,它是一個管理體系,包括組織、制度、流程、工具。
    隨著數據時代的到來,流動的數據已成為連接全世界的載體,也成為促進經濟社會發展、便利人們生產生活的源動力。伴隨著數據流動,尤其是為了解決流動過程中產生的一系列問題,“數據治理”一詞逐漸興起。而要了解數據治理,還得從數據、治理這些基本概念說起。
    習近平總書記指出,“人工智能是引領這一輪科技革命和產業變革的戰略性技術,具有溢出帶動性很強的‘頭雁’效應。”人工智能的快速發展不僅推動經濟社會的深刻變革,同時也為政府決策模式的變革提供了新路徑,對于建立健全數據輔助科學決策機制、全面提升政府決策科學化民主化水平具有重要意義。
    對此,美國防部要求加大數字化投入力度,盡快解決制約美軍信息化基礎建設的障礙,建設安全可靠、數據統一、實時有效、靈活機動的信息環境。該實施計劃將作為OCDO的基本規劃文件,為整個國防信息系統局提供總體指導。美軍緊盯數據發展戰略機遇,出臺了一系列戰略文件加速軍事數據建設,進而謀求以數據為中心的全方位軍事優勢。隨著美軍加速向數據中心化轉型,管理和利用數據資產成為國防部的當務之急。
    VSole
    網絡安全專家
      亚洲 欧美 自拍 唯美 另类