9月16日,阿里資料經濟研究中心(ADEC)以資料經濟新型智庫平臺的角色,牽手清華大學公共管理學院舉辦了一場主題為“政府資料開放的挑戰、困惑與探索”的沙龍,來自清華、北大、人大、復旦、一財研究院、中科院、國研中心等學界和研究機構的30多位業內學者專家以及阿里巴巴集團的專家參與了此次思想的碰撞與交流,沙龍形式活潑,主題分享和分組討論氣氛熱烈。本文為復旦大學移動與數字治理實驗室主任鄭磊的沙龍發言《中國地方政府開放資料現狀、問題與難點》,此為上篇。
我們實驗室最近選了七個開放政府資料的城市和城區做了研究評估,今天先給大家彙報一下這個報告的發現,然後再講一下我們在各種研究和案例調研中發現的一些開放資料中的難點,然後提出一些可能的路徑和建議。
關於政府資料開放的概念
開放政府資料跟之前的資訊公開是相關的,但是這兩個也有重要的差別,現在我看到有些報導把政府資訊公開和資料開放等混在一起,資訊公開是保障知情權,公開的大多是一些檔案、政策,也公開了一些資料,主要是為了保障知情權,也就讓你知道的權利等,而資料開放則是強調利用權,我們在評估資料開放平臺的時候,這是一個重要的切入點,如果你把資料上傳到平臺只是讓大家去查詢,而無法利用,那就只是公開而不是開放。所以公開和開放是兩個概念,我們在調研當中發現有一些網站,他說是資料開放,但其實只屬於資料釋出和資訊公開,不是真正的開放,因為沒法下載和利用這些資料。
下一張圖,縱軸上是資訊層和資料層,資料層是底層的,對資料層進行加工和解讀才成為資訊,橫軸上從左到右是知情,有限利用和自由利用,傳統的“政府資訊公開”是在知情這個層次,過去提到過的“政府資訊資源再利用“主要指的是有限利用,政府把資訊給幾家比較信任的公司,只讓他們來開發利用,這就是有限利用,不是平等的、開放的自由下載和利用,其他的公司得不到這些資料就沒有辦法開發利用。
資料開放是要開放到資料層,同時又能保障自由利用,大家有平等的使用的權利。雖然“政府資訊公開”有時也達到了資料層,但更多的是資料查詢服務和資料釋出,並不能讓人下載利用這些資料。政府開放資料的思路把資料層跟應用層分開,政府提供資料,但政府自己不再需要把資料開發成應用,這時政府依然在提供公共服務,但不再需要自己生產公共服務,而是與市場實現合作共創,共同為社會創造價值。
舉一個例子,如果我們把資料當成底層資源,資料相當於大米,我把大米開放給社會以後,社會是可以做成各種飯的,取決於他想吃什麼飯,他善於做什麼飯,以及社會需要什麼飯。如果政府自己把米做成了蛋炒飯,就面臨三種情況,一、別人想不想吃蛋炒飯?如果別人只想吃白米飯怎麼辦?眾口難調怎麼辦?二、政府自己來開發資料需要花財政的錢,而開放資料給市場來開發花的是市場的錢。三、政府能做得比市場好嗎?有那麼多的人和時間來開發一個個的應用嗎?市場的需求越來越多元化,政府的投入總是有限的,能忙得過來嗎?結果就是政府自己做的很辛苦,但吃力不討好。其實政府只需開發一些基本的應用作為公共產品,個性化的應用讓市場自己去開發就可以了。
中國政府開放資料現狀與問題
我們對於開放資料的研究,目前得到了三方面的資助,包括國家自然科學基金,世界銀行開放資料能力評估與建設課題以及上海市開放政府資料三年規劃課題。我們去年首先做文獻理論和框架構建,今年開始做現狀評估。我們參考了國際上知名的針對各國的開放資料評估報告,這些報告主要是針對國家層面的,而我國是地方層面現行探索,國家資料開放平臺尚未推出,所以目前尚缺少對中國地方政府開放資料現狀與問題的研究。我們希望通過該研究建立一套適用於中國國情的地方政府開放資料實踐評估框架,呈現和評估中國地方開放資料實踐的現狀與問題,然後為我國開放政府資料實踐提供政策建議。
我們首先對國際上的十幾種開放資料包告進行梳理,然後探索建立適合中國的評估框架。我們決定首先針對供應端,也就是政府開放資料平臺進行評估,國際上的評估報告同時對供應端和需求端進行評估,比如開放資料500強,哪些公司利用政府開放的資料,給他建立500強,這是對需求端的評估,但是中國開放政府資料剛剛起步,還沒發展到這一步,目前的工作主要集中在資料的供應端,先要把資料開放出來,才談得上對應用端進行評估,所以我們這次的評估報告主要針對供應端。
我們採用三個一級指標:平臺層、資料層和基礎層,下面有13個維度和53項指標。第一個是平臺層,然後是資料層,平臺建的再好,上面沒有乾貨的資料也不行,這個是更關鍵的,在表面的平臺層和資料層之後,還有基礎層,更多是指體制機制的支撐,經濟社會的基礎,而不是指技術上的基礎設施。我們這次報告採集的資料主要來自網際網路上公開可見的資料和資訊,不包括從政府內部得到的資訊。我們選取了幾個比較有引領性的、有代表性的七個地方,北京、上海、武漢、無錫、湛江、寧波海曙、佛山南海。
首先看資料層,這七個地方平均公開278個資料集。武漢號稱最多,他是635,但是有一半是PDF格式的,可機讀比例僅54%,不能讓人直接利用,其實還是以資訊公開為主。可機讀資料開放最多的是上海市,一共有398個資料集,各地平均可機讀率是84.1%。各地平均有86.25%是靜態資料,僅17.21%的資料按承諾得到了更新。僅無錫、海曙明確保障資料的永久免費;各地的開放資料中,0%明確賦予並保障自由增值、解讀、分享資料的權利。
總的來說,現在開放資料總量還是偏低,可機讀性差,大多為靜態資料,資料按承諾更新比例低,整體都未嚴格符合開放授權。
然後看平臺層,各地方平臺包含三個模組,一個是資料導引,一個是資料獲取,一個是互動交流,這是雙向的,你需要什麼資料或者提一些問題。我們發現,只有無錫和湛江是無需註冊即可下載資料,開放出來的資料既然已經經過了國家安全、商業機密和個人隱私的稽核,開放之後誰來下載利用應該是自由便利的,不一定非要註冊跟蹤,當然政府也確實想知道開放的資料產生了怎樣的效益,有利於下一步的開放。
開放資料本身不會直接產生價值,只有開放出來的資料被社會利用了才真正有意義。各地都開設了應用展示頻道,展示市場上基於開放資料開發出來的應用,這樣就形成一個迴圈,政府開放資料市場拿去用開發成應用,然後政府的開放資料網站上還成為一個展示這些應用的一站式的平臺,這樣首先政府一方面知道了誰利用了我開放的資料,更重要的是也讓公眾容易找到這些應用。展示應用數量最多的是上海,列出APP共 78個,各地平均APP數量為20個,但需要指出的是,這些展示出來的應用很多並不是市場開發的,而是政府自己開發的。
研究還發現僅寧波海曙一個地方公開了使用者提出的資料請求,其他的地方只有政府後臺才能看見這些請求。對比國外的開放資料平臺,使用者在提交資料需求後,還發起了附議的行動,其他有同樣需求的公眾可以點贊附和。報告還發現,僅佛山南海開設了社交媒體帳號向公眾傳播開放資料資訊,僅上海一個地方實現了資料平臺的移動端適配。這些資料都是截止到五月底的資料,我們希望每半年更新一次這個資料。在平臺層的總體現狀是普通互動便捷性差,缺乏高質量資料應用展示,溝通交流缺乏便捷性、有效性和公開性。
在基礎層,資料開放已經從特大型城市擴充套件到不同地域、不同規模的地方,但依然集中於沿海一二線地區,經濟通常較為發達,政府資訊化基礎相對較好、IT產業發展具備一定潛力的城市。針對開放資料的專門政策和工作方案普遍缺位,管理體制和領導力支援尚不足以支撐工作推進。從體制保障來看,僅南海、上海建立了專門針對資料統籌開放的主管單位,特別是南海成立了資料統籌局。僅上海公開發布了開放資料的針對性政策和工作方案。僅上海、南海有公開報導高層行政領導對開放資料的支援。
總體來說,上海跟南海兩地整體資料開放水平最高,武漢、寧波海曙相對偏低。
然而,如果把上海跟紐約在一起比,差距仍然很大。上海是31個部門開放435個資料集,紐約是98個部門1831個資料集。當然,我們不能光看資料集的數字,還要看資料的價值。我還想重點指出的是在開放資料集的同時,還要開放後設資料,後設資料開放才會讓大家更多瞭解資料的背景,告訴我們資料什麼時間採集,如何採集的,然後在利用的時候就能用得更好,也會發現原來有些開放的資料集並不是自己想要的。可以看到紐約市開放的後設資料欄位有22項,而上海市是13項。再有是格式的多樣性,紐約是五星指標,說明格式種類很豐富,而上海是二星指標,因為其開放的資料主要是EXCEL格式為主。這幾個關鍵指標其實代表了資料是否能被容易便利地利用。
來源:阿里研究院