486486048

199IT資料中心微信賬戶:i199IT

近日,阿里資料經濟研究中心(ADEC)以資料經濟新型智庫平臺的角色,牽手清華大學公共管理學院舉辦了一場主題為“政府資料開放的挑戰、困惑與探索”的沙龍。本文為本文為復旦大學移動與數字治理實驗室主任鄭磊在沙龍的精彩發言。

我們實驗室最近選了七個開放政府資料的城市和城區做了研究評估,今天先給大家彙報一下這個報告的發現,然後再講一下我們在各種研究和案例調研中發現的一些開放資料中的難點,然後提出一些可能的路徑和建議。

關於政府資料開放的概念

開放政府資料跟之前的資訊公開是相關的,但是這兩個也有重要的差別,現在我看到有些報導把政府資訊公開和資料開放等混在一起,資訊公開是保障知情權,公開的大多是一些檔案、政策,也公開了一些資料,主要是為了保障知情權,也就讓你知道的權利等,而資料開放則是強調利用權,我們在評估資料開放平臺的時候,這是一個重要的切入點,如果你把資料上傳到平臺只是讓大家去查詢,而無法利用,那就只是公開而不是開放。所以公開和開放是兩個概念,我們在調研當中發現有一些網站,他說是資料開放,但其實只屬於資料釋出和資訊公開,不是真正的開放,因為沒法下載和利用這些資料。

下一張圖,縱軸上是資訊層和資料層,資料層是底層的,對資料層進行加工和解讀才成為資訊,橫軸上從左到右是知情,有限利用和自由利用,傳統的“政府資訊公開”是在知情這個層次,過去提到過的“政府資訊資源再利用“主要指的是有限利用,政府把資訊給幾家比較信任的公司,只讓他們來開發利用,這就是有限利用,不是平等的、開放的自由下載和利用,其他的公司得不到這些資料就沒有辦法開發利用。

487487048

資料開放是要開放到資料層,同時又能保障自由利用,大家有平等的使用的權利。雖然“政府資訊公開”有時也達到了資料層,但更多的是資料查詢服務和資料釋出,並不能讓人下載利用這些資料。政府開放資料的思路把資料層跟應用層分開,政府提供資料,但政府自己不再需要把資料開發成應用,這時政府依然在提供公共服務,但不再需要自己生產公共服務,而是與市場實現合作共創,共同為社會創造價值。

舉一個例子,如果我們把資料當成底層資源,資料相當於大米,我把大米開放給社會以後,社會是可以做成各種飯的,取決於他想吃什麼飯,他善於做什麼飯,以及社會需要什麼飯。如果政府自己把米做成了蛋炒飯,就面臨三種情況:

別人想不想吃蛋炒飯?如果別人只想吃白米飯怎麼辦?眾口難調怎麼辦?

政府自己來開發資料需要花財政的錢,而開放資料給市場來開發花的是市場的錢。

政府能做得比市場好嗎?有那麼多的人和時間來開發一個個的應用嗎?

市場的需求越來越多元化,政府的投入總是有限的,能忙得過來嗎?結果就是政府自己做的很辛苦,但吃力不討好。其實政府只需開發一些基本的應用作為公共產品,個性化的應用讓市場自己去開發就可以了。

中國政府開放資料現狀與問題

我們對於開放資料的研究,目前得到了三方面的資助,包括國家自然科學基金,世界銀行開放資料能力評估與建設課題以及上海市開放政府資料三年規劃課題。我們去年首先做文獻理論和框架構建,今年開始做現狀評估。我們參考了國際上知名的針對各國的開放資料評估報告,這些報告主要是針對國家層面的,而我國是地方層面現行探索,國家資料開放平臺尚未推出,所以目前尚缺少對中國地方政府開放資料現狀與問題的研究。我們希望通過該研究建立一套適用於中國國情的地方政府開放資料實踐評估框架,呈現和評估中國地方開放資料實踐的現狀與問題,然後為我國開放政府資料實踐提供政策建議。

我們首先對國際上的十幾種開放資料包告進行梳理,然後探索建立適合中國的評估框架。我們決定首先針對供應端,也就是政府開放資料平臺進行評估,國際上的評估報告同時對供應端和需求端進行評估,比如開放資料500強,哪些公司利用政府開放的資料,給他建立500強,這是對需求端的評估,但是中國開放政府資料剛剛起步,還沒發展到這一步,目前的工作主要集中在資料的供應端,先要把資料開放出來,才談得上對應用端進行評估,所以我們這次的評估報告主要針對供應端。

我們採用三個一級指標:平臺層、資料層和基礎層,下面有13個維度和53項指標。第一個是平臺層,然後是資料層,平臺建的再好,上面沒有乾貨的資料也不行,這個是更關鍵的,在表面的平臺層和資料層之後,還有基礎層,更多是指體制機制的支撐,經濟社會的基礎,而不是指技術上的基礎設施。我們這次報告採集的資料主要來自網際網路上公開可見的資料和資訊,不包括從政府內部得到的資訊。我們選取了幾個比較有引領性的、有代表性的七個地方,北京、上海、武漢、無錫、湛江、寧波海曙、佛山南海。

首先看資料層,這七個地方平均公開278個資料集。武漢號稱最多,他是635,但是有一半是PDF格式的,可機讀比例僅54%,不能讓人直接利用,其實還是以資訊公開為主。可機讀資料開放最多的是上海市,一共有398個資料集,各地平均可機讀率是84.1%。各地平均有86.25%是靜態資料,僅17.21%的資料按承諾得到了更新。僅無錫、海曙明確保障資料的永久免費;各地的開放資料中,0%明確賦予並保障自由增值、解讀、分享資料的權利。

總的來說,現在開放資料總量還是偏低,可機讀性差,大多為靜態資料,資料按承諾更新比例低,整體都未嚴格符合開放授權。

然後看平臺層,各地方平臺包含三個模組,一個是資料導引,一個是資料獲取,一個是互動交流,這是雙向的,你需要什麼資料或者提一些問題。我們發現,只有無錫和湛江是無需註冊即可下載資料,開放出來的資料既然已經經過了國家安全、商業機密和個人隱私的稽核,開放之後誰來下載利用應該是自由便利的,不一定非要註冊跟蹤,當然政府也確實想知道開放的資料產生了怎樣的效益,有利於下一步的開放。

開放資料本身不會直接產生價值,只有開放出來的資料被社會利用了才真正有意義。各地都開設了應用展示頻道,展示市場上基於開放資料開發出來的應用,這樣就形成一個迴圈,政府開放資料市場拿去用開發成應用,然後政府的開放資料網站上還成為一個展示這些應用的一站式的平臺,這樣首先政府一方面知道了誰利用了我開放的資料,更重要的是也讓公眾容易找到這些應用。展示應用數量最多的是上海,列出APP共 78個,各地平均APP數量為20個,但需要指出的是,這些展示出來的應用很多並不是市場開發的,而是政府自己開發的。

研究還發現僅寧波海曙一個地方公開了使用者提出的資料請求,其他的地方只有政府後臺才能看見這些請求。對比國外的開放資料平臺,使用者在提交資料需求後,還發起了附議的行動,其他有同樣需求的公眾可以點贊附和。報告還發現,僅佛山南海開設了社交媒體帳號向公眾傳播開放資料資訊,僅上海一個地方實現了資料平臺的移動端適配。這些資料都是截止到五月底的資料,我們希望每半年更新一次這個資料。在平臺層的總體現狀是普通互動便捷性差,缺乏高質量資料應用展示,溝通交流缺乏便捷性、有效性和公開性。

在基礎層,資料開放已經從特大型城市擴充套件到不同地域、不同規模的地方,但依然集中於沿海一二線地區,經濟通常較為發達,政府資訊化基礎相對較好、IT產業發展具備一定潛力的城市。針對開放資料的專門政策和工作方案普遍缺位,管理體制和領導力支援尚不足以支撐工作推進。從體制保障來看,僅南海、上海建立了專門針對資料統籌開放的主管單位,特別是南海成立了資料統籌局。僅上海公開發布了開放資料的針對性政策和工作方案。僅上海、南海有公開報導高層行政領導對開放資料的支援。

總體來說,上海跟南海兩地整體資料開放水平最高,武漢、寧波海曙相對偏低。

然而,如果把上海跟紐約在一起比,差距仍然很大。上海是31個部門開放435個資料集,紐約是98個部門1831個資料集。當然,我們不能光看資料集的數字,還要看資料的價值。我還想重點指出的是在開放資料集的同時,還要開放後設資料,後設資料開放才會讓大家更多瞭解資料的背景,告訴我們資料什麼時間採集,如何採集的,然後在利用的時候就能用得更好,也會發現原來有些開放的資料集並不是自己想要的。可以看到紐約市開放的後設資料欄位有22項,而上海市是13項。再有是格式的多樣性,紐約是五星指標,說明格式種類很豐富,而上海是二星指標,因為其開放的資料主要是EXCEL格式為主。這幾個關鍵指標其實代表了資料是否能被容易便利地利用。

政府資料開放的六大難點

第一個難點是很多部門不知道資料在哪裡?你問他資料,他說我沒有,有時是真沒有,一些政府部門確實沒有采集這樣的資料,但有時其實是他不知道他有,有些部門自己都沒有資料清單,不清楚自己手上到底有什麼資料資源。

第二是難點是能不能開放。這個是政策的角度,涉及到國家安全、商業機密、個人隱私的資料不能開放,但我們的法律法規有些是模糊的,甚至是衝突的,這種情況下負責開放資料的工作人員一般會偏向於保守,就是傾向於不開放資料,這樣對他們自身更安全。

第三個難點是願意不願意開放,這個就涉及到部門利益了,明明是可以開放,但是也許是有一些顯性隱性的利益。我一開放出去,我的部門利益就沒有了,所以就不願意開放。

第四個難點是資料好不好?即使前面幾條都解決了,但這些資料是有問題的,不準確不及時或不全面,這樣開放出去之後,不僅不會產生價值,還可能給社會造成損失。所以還需要提升資料質量。

第五個難點是能力夠不夠,開放資料能力建設對政府部門來說是一個全新的挑戰和全新的工作,有沒有專門的部門負責這個工作?需要在管理層和技術層進行能力培訓,需要交流經驗。

第六個難點是動力有沒有,就是多一事不如少一事的組織文化,有些政府部門會覺得多做多錯,少做少錯,不做不錯,不如先觀望一下。

關於政府資料開放的建議:培育開放資料生態圈

最主要的建議是開放資料要整體性系統性的思考問題,這是一個生態系統,這個生態系統中最大的兩個群體,一個是政府,是開放資料的,另一個是市場,是利用資料的,要培育、輔導和支援生態圈的形成,讓資料被開發出來,被利用起來,對整個社會產生價值。這兩大群體又受到內外部環境的影響,即使一個地方的政府非常願意開放資料,但這個地方的經濟社會資訊化環境並不利於資料的開發利用,用不起來,無法產生真正的社會價值,那也無法產生效果。

485485048

政府作為開放資料的提供者,需要考慮管理體制、組織架構方面的變革,需要同時在資料管理和開放平臺建設兩方面下功夫。現在國際上資料開放的會議上,這兩年我聽到的更多是在討論誰來用資料?幹什麼用?利用者之間的差異如何?美國政府在最早推出政府資料開放平臺後,就發現缺少對基礎使用者的支援,因為資料開發能力不是每個普通老百姓都具備的,以前我們說數字鴻溝,現在可能會形成資料鴻溝,中間誰把這個鴻溝連上?資料開發公司可以作為中間的橋樑,把資料開發成應用,為社會上的普通公眾服務,所以政府要把這些資料開發公司視為合作伙伴。資料的利用者能力非常關鍵,機構使用者、增值開發者、一手使用者、二手使用者等等是一個生態圈,各自發揮不同的作用,你把一個幹掉了,可能另一個也消失了,所以我要有生態圈的意識,不要隨便的干預,除非他們觸碰到了底線,但也不要隨便的去扶持誰,這樣可能會破壞生態圈的平衡。

開放資料會產生一系列政治、經濟和社會的效益,但也有損失與風險,要看最後帶來的收益大於損失,還是反之。如下圖我們構建的系統動力圖所示,未開放的資料開放出來之後,本身並沒有直接產生價值,必須要被利用,變成被利用的開放資料之後,才會產生或者是收益或者是損失,這個價值反饋回來會影響到整個社會、經濟、技術、創新等環境,這些環境越有利,就會越支撐政府開放資料的機制建設,開放平臺建設和資料管理,資料質量和數量都上去以後,開放的效果也會越好,形成一個正迴圈。反之,如果開放資料造成的風險高於收益,社會環境中都在反對這個事情,或者政府開放出來的資料沒有什麼價值,不是社會真正需要的,因而沒有人來利用資料,就都無法形成開放資料的正迴圈,所以要有一個生態圈的思維,要讓這個系統向正迴圈的方向走,而不是負迴圈或迴圈不下去。總結起來,就是開放資料這項工作是一個複雜的動態的過程,涉及到多個利益相關方,存在多種因素的互動關係和因果迴路。但一切要以公眾需求為出發點,以創造公眾價值為終極目標。

作者,鄭磊,復旦大學移動與數字治理實驗室主任

阿里研究院

摘自:http://www.aliresearch.com/blog/article/detail/id/20659.html