上海快三2码遗漏 www.xqauf.com

鄔賀銓:大數據共享與開放面臨三大挑戰
來源:中國信息安全雜志 更新時間:2017-06-08

 

一、大數據的共享與開放

國務院《促進大數據發展行動綱要》提到,推動政府信息系統和公共數據的互聯共享,避免重復建設和數據打架,增強政府的公信力,促進社會信用體系建設。

大數據共享包括政府部門之間的數據共享、跨行政區域政府間的信息共享、政府與企業間的數據的合作和共享、企事業單位之間的數據共享等。

政府層面,需要設立大數據協同管理機構,促進政府部門間的數據共享,但是必須要健全大數據相關制度框架和制度體系。另外,需要進一步建立基礎數據庫,一方面要集中存儲被共享的數據,同時進行清晰校驗和整合,提供可以共享的目錄,以便用戶可以接入和收取這些數據。當然,還要規定訪問的權限和進行災備等。

2013年,在北愛爾蘭召開的G8會議,簽署了《開放數據憲章》,提出了開放14個重點領域數據。要求發布的數據不是一般的數據,而是高價值的數據,不僅僅是加工過的數據,還要有源數據。以往我們認為,政府發布的數據是加工過的,實際上只要不影響國家安全和公民隱私,政府應該開放原始數據??諾氖菀暾?、重要的、及時的。共享是政府部門之間、政府和單位之間,開放是對社會。

美國政府要求開放數據要屏蔽掉隱私,注意隱私安全,數據內容包括交通、空氣污染、環境、支付等。美國政府開放數據同時開放了數據挖掘工具,幫助老百姓利用這些數據,在政府開放數據的平臺收集了老百姓通過挖掘這些數據得出的可視化的結果,有利于公民了解社會。

根據不完全統計,中國政府數據開放平臺超過40多個,其中沿海經濟發達地區占總數的70%,西部中部比較少。雖然中國政府開放了教育、醫療、文體、環境等方面的數據,但是開放數據的總量偏低、結構化程度低、數據質量不高、民眾參與反饋不準。

以北京市政府開放數據為例,2016年,北京市政府主動公開政府信息超過100萬條,跟2015年差不多,其中主動公開的文件不到1萬件,主動公開的重點政府領域信息73萬條。北京市公開的政府信息中,關于食品安全標準和食品生產的內容占了一半,關于企業信用系統的數據占40%,兩項加起來占了90%,剩下的只有10%。這10%包括政府的三公預算、農民征地和政府定價。公民關心食品安全,所以,這方面的數據比較多。

聯合國電子政務發展指數包括三項,信息基礎設施、人力資源和在線服務情況。其中,在線服務與開放數據有關。據統計,2016年開放電子政務數據發展最好的是英國,中國排第63位。政府開放數據需要技術框架支持,包括開放數據管理、開放數據技術和開放數據門戶。

數據共享和開放現在面臨三大挑戰:

第一,不愿意共享開放,政府部門各自為政、把數據開放當成自己的權利。很多政府部門以信息不對稱作為手段,缺乏激勵機制,和技術部門共享數據還得向公眾開放數據,得不到商業回報,因此職能部門對于數據開放消極被動。

第二,法律法規制度不夠具體,不清楚哪些數據可以跨部門共享和向公眾開放,數據信息的共享開放有一定的風險,搞不好把一些應該保密的數據開放了,搞不好泄露了公民隱私,責任很難界定。

第三,缺乏公共平臺,共享渠道不暢。過去信息的傳遞多數是部門之間通過電子郵件進行,安全性、保密性、可持續性很難保證,沒有統一的標準規范,不同職能部門對數據的采集記錄標準千差萬別,統計口徑和時間不一致。數據開放需要脫敏,缺乏必要的技術和人才支撐,很難按照技術標準來規范。

二、大數據的流通與交易

數據有提供方和使用方,很多時候,數據需要通過中介方進行交易。政府開放的數據是脫敏以后的原始數據,數據挖掘公司將政府數據加工后出售給數據使用方、行業戶。

一般來講,數據生產者很少直接面向最終用戶,大多通過中介渠道實現自身數據的變現。例如,推特(Twitter)本身不直接銷售數據,而是把數據授權給好幾個公司售賣。目前,美國的數據中介本身也是一個大產業,交易數據在2012年的規模已經達到1500億美元。

大數據交易的關鍵是對數據質量的要求,包括數據的準確性、真實性、完整性、一致性等。關于交易數據合法性、及時性、可用性、安全性等問題,都是現階段我國家數據交易所面臨的問題。

政府的數據不存在提供給中介方交易的問題,當然,中介方可以收集政府的數據,進行加工。運營商收集的用戶數據原則上所有權是用戶,BAT收集的數據原則上所有權是用戶,但是運營商和BAT擁有對數據脫敏及挖掘分析后加工數據的所有權。

有數據的公司通過數據挖掘向政府和企業提供咨詢報告,這類公司雖然沒有數據所有權,但是有數據挖掘能力;而那些沒有數據,但是有數據挖掘能力的公司,可以受委托完成數據挖掘。是否允許前者在?;ひ膠凸野踩那榭魷綠峁┦?,是否允許后者受委托進行數據挖掘后利用數據為非委托方服務,這些問題現在還沒有明確規定。

此外,沒有數據也沒有挖掘能力的公司,可以作為中介平臺,但是是否可以允許其截留數據呢?中介方收集了政府開放的數據據為己有并且出售是不是合法?因此,關于在數據源的穩定性、更新頻率和數據擴散等方面,也需要相關規定給出明確的界限。

精加工的數據、可視化的數據怎么定價,怎么衡量數據挖掘的工作量,一次性買斷的數據和可以重復多次出售的數據怎么定價,數據的價值與時效性有什么關系,是不是需要有對數據評估的第三方機構,都是現階段國內的數據流通和交易存在的問題。

政府和企業組織沒有充分認識到用外部數據可以對自身工作和業務起到巨大的提升作用,所以,一般來講,都很少利用外部數據。很多數據擁有者對數據蘊含的價值缺乏足夠的洞察,不放心讓自己的數據進入流通環節,擔心企業隱私機密泄露。所以,流通也不夠,交易也不夠,利用更不夠。

三、大數據利用和?;?

首先,和國家安全有關的數據、和企業商業秘密有關的數據以及涉及公民隱私的數據需要?;?。目前,歐盟制定了嚴格的數據?;しò?,中國雖然有宏觀上的數據?;ひ?,但是沒有全面的數據?;しü?。

關于歐盟的數據?;?,2016年4月,歐洲議會通過了《一般數據?;ぬ趵罰℅DPR)。這個法案在2018年5月25日生效。這個數據?;しò干婕芭訪說ノ歡遠嘣蕕拇?,不管在歐盟內部處理,還是在歐盟外部處理,都要受這個法規管。要注意的是,處理者在不在歐盟里不重要,但是歐盟消費者都要受這個管理。如果中國企業把微信支付寶用到了歐洲,那么,一樣也要受這個法案管理。

多元數據是跟個人隱私、專業、公共生活有關的任何信息,包括姓名、照片、電子郵件地址、工作表現、經濟狀況、健康狀況、個人偏好、興趣、IP地址等。針對個人信息的收集、記錄、組織、建構、存儲、修改、咨詢、使用、傳播和其他應用,包括排列組合,都可以通過人工處理或自動化處理。

個人具有管理自己個人數據的權益,具有自己的數據被泄露能夠獲得及時通知的權利以及被遺忘權。對個人數據處理,要合法公正透明,必須有規有法。只有為了公共利益或歷史研究,個人數據才能長時間存儲,其他目的個人數據不能長時間存儲。同時,還要保證收集的個人數據有技術措施保證,不能受非法授權、非法處理、遺失丟失和損毀。

并不是說個人數據不能處理,符合規定的可以處理,例如本人同意可以作為一個或多個特定目的的數據。個人數據處理是為了?;ぷ約?,?;ひ桓鱟勻蝗說那猩砝?;為了公共利益,為了追求合法利益的必要,允許商業利用。商業部門、企業處理個人數據,首先是為了合法利益,當然不能侵犯提供個人信息數據的消費者的利益,尤其是兒童。現在手機的幾乎所有APP都收集個人信息,如果是為了合法利益的,是被允許的。

有個社會調研,關于是否愿意為了將來應用資費上的優惠犧牲隱私,全球有27%的人表示可以犧牲隱私,中國有38%的人表示可以犧牲隱私,更多中國人認為隱私不重要,反而優惠更重要。

數據的傳輸存儲和開發要有要求。所有的軟件,包括移動應用的APP,在開發階段和運行數據處理階段要?;じ鋈聳蕕囊?。數據控制也含APP,要有充分的技術和措施,確保數據和移動應用的完整性,必須應對數據處理面臨的風險。

歐盟提出,如果一個政府在云里存儲了數據,就是管理者,應該對數據所有的保密、安全負責。所以,云平臺有云平臺的責任,存數據者也有他們的責任。該法規不受限于公司國籍,不受限于云服務的地理位置,如果在中國存了關于歐洲公民的個人數據,這個法規也適用,所以,在中國的云平臺也不是什么數據都存進去。目前,80%的云服務不會在合同終止的時候立即刪除客戶的數據,58%的云服務不能提供IT所有權的保證。

我國也有一些關于數據開發應用的文件,工信部出臺的“大數據產業發展規劃”,2016年出臺的“網絡安全法”,都提到對個人信息和重要數據的境內存儲,需要?;ば畔踩透鋈艘?。但是,跟歐盟的法規比,我們的規范都很宏觀,真正違反了會怎么樣,并沒有規定。

四、結語

數據的價值在于融合與挖掘,政府數據對公眾的最大利益在于共享與開放。數據流通與交易有利于促進數據的融合挖掘。數據的使用必須面對?;さ腦鶉斡胍邐?,尤其是對個人隱私數據的?;?。歐盟提出的GDPR,將數據?;さ難現匭蘊岣叩角八從械某潭?,需要引起我們的高度重視。數據的共享開放、流通交易和?;び氚踩?,對數據技術提出研究挑戰,數據的共享、開放、流通、交流、使用和?;ざ苑傻鬧貧ㄓ脛蔥刑岢雋撕芨咭?,同時還需要平衡數據的?;び朧蕕目⒗?。