基于LDA模查包養型與政策東西的中國數據主權政策研討_中國網


中國網/中國發展門戶網訊 數據主權是指一個國家對其政權管轄范圍內的網絡設施、數據主體、數據行為和數據資源及相關數據產品具有天生、傳播、治理、把持、應用和保護的主導權,其正在成為數字時代國家主權的主要組成部門。american、歐盟和中國等國家和地區均認識到數據資源所具有的戰略價值,積極開展數據主權戰略安排。由于技術才能和經濟發展狀況分歧等原因,各國采取了差異化的數據主權政策。

數據主權政策對于維護國家平安、保證國家好處具有主要感化,近年來惹起學術界較為廣泛的關注。有的學者從國家主體的視角提出了數據主權概念,也有學者從組織和個人主體的視角界定了數據主權內涵。冉從敬定性總結了數據主權戰略安排的全球態勢。鄭琳等闡釋了國家數據主權概念,并歸納剖析了歐美數據主權戰略。但是,已有研討重要通過定性歸納方式從國家宏觀層面分析數據主權戰略的特點,但缺少關于數據主權政策文本內涵和特征的定量剖析。本文采用政策文天職析方式研討我國數據主權政策,運用LDA(Latent Dirichlet Allocation)主題模子和政策東西定量剖析中國數據主權政策的演變、態勢,基于此與全球數據主權政策進行國際比較并提出對策與建議。這一研討既拓展了政策文天職析方式的應用領域,將其應用于數據主權領域的政策剖析,也為優化設計我國數據主權政策供給方式論指導。

數據主權政策研討的剖析框架構建與設計

研討方式與框架維度

本文從政策東西的角度出發,運用LDA主題模子對中國2010—2022年的數據主權相關政策進行剖析與量化。本文樹立了數據主權政策東西的剖析框架(圖1)。對政策文本進行統計剖析,圍繞政策時間、政策機構和政策類型分布展開,探討數據主權政策的演變過程、機構分布和政策效率。供給型、環境型和需求型政策東西分類法在既有研討中最為常見,本文采用此種政策東西的維度劃分對數據主權政策進行編碼剖析。運用LDA主題模子發掘數據主權政策文本中的焦點主題詞,并進行可視化展現。

數據來源及編碼

本文選用“北年夜法寶在線數據庫”作為數據主權相關政策文本的搜集來源,以“數據主權”“數據平安”“數據跨境”“國家平安”等關鍵詞搭配組合進行全文檢索,篩選“中心法規”政策文件作為剖析文本,共計搜集45份政策文件(表1展現了部門數據主權政策文本)。對納進樣本的45份中心法規政策文件進行摘錄和編碼(部門數據主權政策文件內容編碼情況見表2),以便更清楚地標注分歧政策與具體條款中包括的政策東西,將非結構化的文本數據進行轉換用于定量剖析。

數據主權政策總體情況

政策時間演變分布

根據政策文本的發布時間統計結果,中國數據主權相關政策始于2012年5月工信部發布的《互聯網行業“十二五”發展規劃》;“數據主權”這一名詞初次出現在2015年國務院印發的《促進年夜數據發展行動綱要》,指出應“增強網絡空間數據主權保護才能,維護國家平安,有用晉陞國家競爭力”。但是,早在2010年已經開始出現互聯網主權的概念。數據主權政策發布數量在2016年和2021年迎來了2次年夜幅晉陞(圖2)。結合年夜數據、云計算和區塊鏈等新技術的出現與疾速發展,將數據主權政策演變劃分為4個階段。

互聯網主權階段(2010—2013年)。2010年,國務院新聞辦公室發布《中國互聯網狀況》白皮書,指出“中華國民共和國境內的互聯網屬于中國主權管轄范圍包養網排名,中國的互聯網主權應遭到尊敬和維護”。中國慢慢完美互聯網法令法規,積極推動互聯網基礎設施建設,加強對互聯網的治理和監管,確保互聯網平安,推動互聯網產業發展。

信息主權階段(2014—2015年)。2014年7月16日,習近平主席在巴西國會發表題為《弘揚傳統友愛共譜一起配合新篇》演講,強調每一個國家在信息領域的主權權益都不應遭到侵略。這一階段,相關政策強調加強信息自立可控,建設信息基礎設施,推進信息平安技術和標準的研發,晉陞中國在信息主權領域的實際管控才能和國際話語權。

網絡空間主權階段(2015—2018年)。2015年7月頒布實施的《中華國民共和國國家平安法》初次包養網明確了網絡空間主權的概念。在2017年3月發布的《網絡空間國際一起配合戰略》中將“堅定維護中國網絡主權、平安和發展好處”作為中國參與網絡空間國際一起配合的戰略目標之一。2018年5月,在國家互聯網信息辦公室發布的《數字中國建設發展報告(2017年)》中,將“維護網絡主權”作為數字中國建設面臨的形勢和盡力標的目的。這一階段,相關政策強調加強網絡平安保護、樹立網絡主權治理機制、推進網絡空間管理等,以確保國家在網絡空間中有權利和才能保護國家平安和維護國家好處。

數據主權階段(2019年至今)。2019年7月,《加強工業互聯網平安任務的指導意見》指出,依據工業門類領域、數據類型、數據價值等樹立工業互聯網數據分級分類治理軌制,開展主要數據出境平安評估和監測。2020年9月,中國發起《全球數據平安倡議》,呼吁各國未經他國法令允許不得直接向企業或個人調取位于他國的數據。2021年9月開始實施的《中華國民共和國數據平安法》規定,維護數據平安,應當堅持總體國家平安觀,樹立健全數據平安管理體系,進步數據平安保證才能;同年,《中華國民共和國個人信息保護法》也對個人信息的跨境流動、數據當地化存儲及域外效率做出了相關規定。這一階段,相關政策強調樹立數據分級分類軌制、明確數據出境平安評估請求、推進數據保護才能認證機制等,以確保數據在跨境流動過程中獲得有用保護和合規應用。

綜上,中國的數據主權戰略經歷了“互聯網主權—信息主權—網絡空間主權—數據主權”的演變,整體政策特點為以平安為綱,推動定規立制,促進數據有序流動,加強數據跨境流動過程和出境后的風險評估和監管。

政策發文機構分布

政策發文機構能夠反應出各政策法規的效率級別。國務院、工業和信息化部、商務部、全國人年夜常委會等共計33個機構參與數據主權政策制訂,表3展現了發布政策的焦點機構分布情況。我國數據主權政策有聯合發布和單獨發布2種情勢;45份中心法規政策文件中,8份為聯合發布,37份為單獨發布,單獨發布占比82.2%。

基于統計結果可知,發布政策文件較多的機構順次為國務院、工業和信息化部、商務部;聯合發文的重要為國家發展和改造委員會、工業和信息化部。政策發布焦點主體共有5個,占比15.2%,非焦點主體共有28個,占比84.8%,各政策主體在整體分布上較為疏散。總體來看,參與數據主權政策制訂的主體眾多,但焦點主體的發文數量占比54.2%,較為集中。整體呈現出以國務院、工業和信息化部、商務部、全國人年夜常委會、國家互聯網信息辦公室為五年夜中間發文的結構特征(表3)。

政策類型分布

政策發布所采用的文種類型因政策性質和目標的分歧而有所差異,由此導致了分歧政策的效率分歧。本文所搜集的政策樣本中,數據主權政策采用了9種分歧的情勢進行發布,包含計劃、意見、規劃、法令、告訴、綱要和辦法等,展現出情勢多樣性(表4)。此中,計劃、意見和規劃在政策文本中占比較高,這說明現有政策中相關部門提出的見解和處理意見較多;而針對性更強、更具體的辦法在整體政策分布中較少;全國人年夜及其常務委員會共頒布4項法令。

數據主權政策二維剖析

政策東西是政策主體為實現政策目標而采取的具體辦法和手腕,本文根據已有研討從需求型、環境型和供給型3個方面構建了數據主權政策東西剖析維度,通過政策東西識別出政策實施的主要途徑和保證辦法,并基于LDA主題模子進行政策主題剖析,提醒了政策的焦點內容和重要目標,以期為國家進一個步驟優化完美數據主權政策制訂供給決策參考。

考慮到一個政策剖析單元能夠同時應用多種政策東西,是以本文用于剖析的政策東西數量之和超過編碼單元總數。從政策東西應用類型來看,我國數據主權政策對政策東西的應用較為周全,需求型、環境型、供給型政策東西分別占比21.6%、59.6%、18.8%(圖3)。此中,環境型政策東西較為常用,需求型和供給型政策東西應用頻率次之。我國采用多種政策東西配合推動數據跨境平安流動和數據主權保護。

政策東西維度的實證剖析

需求型政策東西,旨在引進各方氣力進行交通與一起配合,積極開展包養網數據平安治理、跨境流動和國際一起配合規則等試點,凸起主要領域和關鍵環節,從而促進數據平安有序流動(表5)。需求型數據主權政策東西以試點示范和國際一起配合為主,著重于通過試點示范和國際一起配合等發展形式先行先試,積累數據平安治理和數據主權保護有用經驗并推廣普及于全社會,包養重視引導社會氣力參與,開展宣傳推廣,從而推動行業規范發展、進步數據主權保護意識。

環境型政策東西,旨在通過優化各主體、各環節實施的環境條件、政策導向、標準規范和問責機制等引導和監管各主體采取更積極的數據平安治理和數據主權保護辦法(表6)。整體而言,環境型政策東西占比超過半數,作為一種間接調控手腕遭到政策主體的青睞。法規管束是常用方式,隨著新技術的發展,數據規模不斷擴年夜,國際數據主權威脅等問題日益凸顯,需求加強規制積極應對域外效率等問題。標準規范、平安規范、保證辦法和審查評估是引導新興數字產業規范發展、保證數據平安有序流動等正在慢慢完美的政策文件,包含跨境暢通準則、平安評估和保證機制等。戰略性辦法對政策體系起到補充感化。當前知識產權政策東西應用較少,是數據主權政策中的明顯空缺點。

供給型政策東西,旨在為各主體的數據平安治理、數據主權保護、信息基礎設施建設、技術研發、人才培養、統籌協調等供給各類資源支撐(表7)。在供給型政策東西中,信息基礎設施建設、技術支撐和組織建設占比較高。隨著年夜數據、云計算和區塊鏈等新技術的出現,信息化設施成為數字經濟發展的主要基礎條件。《中華國民共和國國平易近經濟和社會發展第十四個五年規劃和2035年遠景目標綱要》和《中華國民共和國網絡平安法》均提出要樹立健全關鍵信息基礎設施保護體系。技術支撐是保證數據平安流動的主要氣力,應通過開發焦點技術構建平安靠得住的數據暢通環境。在組織建設的統籌協調下,信息基礎設施建設和技術支撐相輔相成,為數據平安流動和數據主權保護供給持續動力。當後人才支撐和資金支撐政策東西應用較少,分別為6.67%和8.89%。資金支撐具有定向性優勢,人才培養則具有長期效益,應適當增添這兩個政策東西的應用。

政策主題維度的實證剖析

LDA主題模子主題數與分歧性剖析

LDA主題模子可用于發掘大批文本的潛在主題特征。它是一種無監督的、非結構化的概率模子,運用了單詞共現具有語義關聯的規律,無需預先設置字典或主題類別便可發現文檔語料庫中的潛在主題,減少了研討者主觀判斷對主題分類的影響。本文將每個編碼單元視為一個文檔,選擇主題分歧性指標模子用于鑒定最優主題數量,若分歧性處于較高程度,模子的主題結構將加倍穩定。本文選用“哈工年夜停用詞表”對文檔進行文本預處理(中文分詞、往停用詞),主題數與分歧性結果如圖4所示。通過主題評估,本文選用3作為主題個數,并應用pyLDAvis算法對LDA主題模子結果進行可視化剖析與展現。

詞云可視化

圖5展現了基于LDA主題模子發掘出的數據主權政策的主題詞袋(bag of words)。根據LDA主題模子可視化結果,當前數據主權政策分為3類:數據平安與個人信息保護;數據跨境與國際一起配合;數據平安評估與數據出境。

數據平安與個人信息保護(圖5a)。推動建設周全數據平安保護體系,包含完美數據分級分類軌制和個人信息授權應用軌制。為構成數據資源匯集共享、數據流動平安有序的數據要素良性發展格式,應妥當處理國家平安、數據跨境暢通和個人隱私保護三者的關系。

數據跨境與國際一起配合(圖5b)。明確數據平安法在域外的適用效率,進一個步驟健全數據跨境暢通規范,實施數據跨境傳輸與平安管控試點。摸索參加區域性國際數據跨境暢通規則制訂,促進構成數據跨境暢通的全球協同機制,強化中國同世界其他國家和地區之間的平安協作與信息資源共享。

數據平安評估與數據出境(圖5c)。健全數據分級分類治理軌制和數據出境平安審查機制。確保數據在出境前能夠進行周全的事前評估、持續監督和風險自評估,有用識別和防范數據出境帶來的平安風險,保護國家和個人的敏感信息。摸索數據保護才能認證機制設計,為數據出境供給客觀和可托的評估標準,確保數據的符合法規性、平安性和可控性。

綜上,中國數據主權政策重要運用了環境型政策東西,輔之需求型和供給型政策東西,推動數據跨境平安流動和數據主權保護。政策文本內容呈現出“數據平安與個人信息保護”“數據跨境與國際一起配合”“數據平安評估與數據出境”三年夜主題特征。我國陸續制訂了《中華國民共和國個人信息保護法》《中華國民共和國數據平安法》等法令,出臺了《數據出境平安評估辦法》等一系列規章軌制,實行嚴格數據出境和信息保護治理形式,確保我國數據主權得以保護。

啟示與建議

本文在對數據主權領域政策進行剖析的基礎上,對我國數據跨境平安流動與數據主權保護提出4條政策建議。

積極主導和參與國際規則制訂,樹立互信機制,進步國際話語權。積極主導和建設性參與制訂、完美數字時代的國際規則和標準,與更廣泛的國家樹立多種情勢的數據一起配合平臺,就數據基礎設施建設、數據資源開發應用、數據平安保證等方面進行技術支撐和才能建設,促進數據互聯互通和共享共贏。推動與其他國家或地區在數據保護程度、標準、規范等方面的一起配合討論,爭取更多分歧意見和共識,實現數據保護標準和規范的彼此認可或互惠適當性。

優化數據出境平安評估流程,進步評估效力和準確性。樹立以風險為導向的數據包養行情分類治理軌制,對分歧類型和等級的數據采取差異化的管控辦法,加強數據平安評估的標準制訂和實施,明確數據平安評估的請求和指導,確保數據出境過程中的平安性和可托性。應用先進技術手腕進步數據出境平安評估的效力和準確性。例如,可以通過引進人工智能和年夜數據剖析技術等自動化評估流程,疾速識別高風險的數據出境行為,以進步評估結果的準確性和靠得住性。

完美個人信息出境標準合同模版,進步合規運營的效力。《個人信息出境標準合同辦法》于2023年6月1日起實施,旨在確保個人信息符合法規、平安、有序地跨境傳輸。通過應用標準合同模板,我國能夠通過《個人信息出境標準合同辦法》賦予的法令約束力來將境內的管轄權“延長”至境外,達到必定“境內法域外適用”的後果,實現數據跨境流動保護。未來,可以將標準合同模板進行模塊化拓展,根據組織、企業或個人的業務需求,制訂更多可以選擇的模塊,以下降相關實體合規運營本錢,進步效力。

強化數據平安法治保證,構筑數據主權防線。以總體國家平安觀為指導,完美保證數據平安的法令法規,強化數據平安管理體系。明確數據平安的法令責任,保護關鍵數據基礎設施;樹立數據平安風險評估和應急響應機制;開展數據主權與平安宣傳教導,進步全平易近數據平安意識和才能;推動國際一起配合,加強與其他國家和地區在數據平安法令法規方面的交通和互鑒,配合促進國際數據平安標準制訂,晉陞中國在全球數據管理中的話語權和影響力。

(作者:喬晗、徐君如,中國科學院年夜學經濟與治理學院 中國科學院年夜學數字經濟監測預測預警與政策仿真教導部哲學社會科學實驗室。《中國科學院院刊》供稿)


發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *