AI數據安全問題及治理

2020/08/09

根據觀安信息和賽博研究院共同發布的《人工智能數據安全治理報告》,我將分享四個方面的內容:第一,當前人工智能有什么樣的發展趨勢,其面臨哪些數字安全風險挑戰;第二,全球人工智能數據治理現狀如何;第三,人工智能數據安全治理的方向在哪里;第四,針對典型的人工智能場景,有什么具體的數據安全解決方案。


數據安全問題亟待解決

數字新基建、數據新要素、在線新經濟是今年以來的幾大熱詞,這也一定程度上昭示著人工智能的發展趨勢。


5G、工業互聯網等新型基礎設施在逐步建設,再加上疫情中遠程辦公、經濟活動、新業態都催生了新的人工智能應用場景。今年4月,國家提出將數據作為和土地、勞動力并列的新元素,數據至此上升到了國家戰略的高度。


當前,人工智能從“探索期”逐步進入到“成長期”。這一階段的人工智能有四個關鍵特征:第一,包括專用的AI硬件、芯片在內的人工智能專用技術逐漸獲得突破;第二,人工智能產業生態蔚然成型;第三,人工智能投融資日趨理性成熟;第四,人工智能應用場景向深層拓展。


數據安全已經成為人工智能發展不得不解決的瓶頸問題。一方面,人工智能增加了傳統數據的安全風險;另一方面,新技術又引發了新型數據安全風險。在數據全生命周期,人工智能將帶來如下新風險:一是數據采集的風險,如隱私保護、過度采集,智能終端、APP不在應用范圍內收集個人信息,數據過量采集將引發安全風險。二是數據處理的風險。利用“數據中毒”的方式來攻擊人工智能系統,會造成人工智能模型計算的偏差,導致無法達到預期結果。三是數據流通的風險。人工智能依托于算力、算法、數據,因為這些數據很可能是由多個企業協同完成,如有的企業做數據采集,有的企業做數據標注。數據在各企業流轉過程中,會出現數據交互、數據跨境的風險。四是數據處置的風險。人工智能的關聯分析、還原、攻擊、對抗樣本攻擊等,都會帶來數據安全風險。


AI數據安全缺乏標準

針對風險,我們再來看全球人工智能數據安全治理現狀。包括中國在內的各國在戰略層面都非常重視數據安全,美國、歐盟在各種人工智能案件倡議、倫理規范中,都強調了對于數據安全的應對措施。


在法律層面,各國的人工智能立法差異較大,各有不同。舉例來說,美國是通過場景化立法來推進人工智能數據安全,在加州推出了人臉識別的安全技術法;歐盟則是在加快統一數據安全立法下,進行場景化監督。前幾年,歐盟推出在“GDPR”(General Data Protection Regulation,通用數據保護條例,簡稱GDPR)的框架下持續推進自動駕駛、人臉識別、生物制造等典型場景的數據安全立法。而中國目前還需要進一步加快數據安全立法和人工智能標準化立法。


在標準層面,無論是國內或是國外,通用的、專門針對人工智能數據安全的標準尚未出臺,缺乏特定的標準。在技術層面,有四個前沿技術與人工智能數據安全相關聯。


一是隱私計算。其核心是當數據交給合作方、第三方之時,不給對方未公開的數據。通過這種手段,保證模型訓練,滿足業務場景的需要,比較典型的如同臺加密、聯邦學習。二是區塊鏈。區塊鏈是針對去中心化的技術,主要作用于數據安全的防篡改、防泄漏。三是數據偏見檢測。在數據安全風險里,人工智能有典型的應用和場景,如果訓練數據存在偏見性,就會導致人工智能模型算出來的結果出現偏差,產生不可預期的影響。四是數據安全檢測,主要是對數據集污染、對抗安全攻擊方面進行檢測。


AI數據治理的路徑

關于人工智能數據治理框架主要涉及三個方面。


第一,治理思路。保障數據安全是為了讓人工智能得到更可靠、更有效的發展,而非阻礙其前行的腳步。在人工智能的動態發展中,實現對數據安全風險的可知和可控是治理的思路。我們要充分發揮“安全”對人工智能發展的賦能作用,讓其成為賦能的機制而非瓶頸。第二,治理原則。鼓勵和推進AI發展,要保護主體在發展過程中的權益。以隱私數據個人所有權合法權益為例,我們要通過重視技術解決技術賦能的問題,防范風險,聚焦行業場景,推動多元參與。人工智能數據安全的問題,單憑某一家企業是不行的,它需要國家、社會團體、行業、企業等進行多方參與,最后再加強國際合作,確定治理原則。第三,治理路徑。一要從宏觀戰略、法律法規、監管機制層面完善數據安全治理的底層設計;二要建立人工智能數據安全標準體系,如建立通用標準、行業標準、技術標準、人工智能應用場景安全標準;三要不斷提高企業自身數據安全能力,通過組織、管理手段、技術手段結合的方式,提高數據安全的能力,包括組織建設、制度規范、文化、技術、人員的能力;四要多方參與,打造全面立體的人工智能數據的安全能力供給,解決數據安全的問題。我們要從技術研發、產品服務、測評認證、合規咨詢、安全生態五個層次,打造整體數據的安全能力供給。


AI場景風險的解決方案

我們從接口、數據、核心功能、承建四個層面,完成了針對人工智能場景和平臺的風險評估、數據管理、知識庫管理及威脅情報;通過對人工智能場景的敏感數據探測、數據質量評估、差異評估、特異性評估,實現整體數據安全檢測。


針對三個典型的人工智能場景,我們提出了針對性的數據安全解決方案。


場景一:無人駕駛。存儲和傳輸環節會存在數據被竊聽的安全風險,過度采集會侵犯隱私,還會涉及到數據跨境帶來的數據安全風險。針對這些數據風險,我們提出了解決建議:加強車載端訪問控制,實施分域管理,降低數據安全風險。基于KPI和數據通信加密,構建“車—云”數據通訊,在網絡層進行異常流量檢測,以提升整體車聯網網絡安全防護水平。場景二:人臉識別。有些企業內部管理較為薄弱,其內部數據安全制度、整體網絡安全防護能力都有待加強,整體數據存在泄漏風險。這會導致在AI平臺中進行人臉識別時出現數據泄漏和數據偏差。所以,我們要在解決方案中強調加強準入,包括準入認證和控制,以保障數據鏈路、數據傳輸與共享的安全;同時,采取技術手段,實現敏感數據的追蹤和溯源。場景三:工業互聯網。工業互聯網平臺架構層、平臺層、IaaS、PaaS、SaaS、邊緣計算層面都存在數據泄漏的安全風險。對此,我們建議建立數據防泄漏子系統,通過各個層面,加強數據安全審計和防泄漏;同時,針對敏感數據傳輸、接口傳輸,用數據脫敏子系統、脫敏技術實現敏感數據保護,建立完整的數據安全交換子系統,最終建立數據安全風險與預警平臺。通過預警平臺,實現工業互聯網場景下數據安全的可知可控,從而保障整體數據安全,最終提升工業互聯網場景下的數據安全能力。


(胡紹勇? ?上海觀安信息技術股份有限公司首席技術官)


關閉
啪嗒啪嗒高清视频在线观看