10月22日,由上海市經濟和資訊化委員會、上海市靜安區人民政府、上海市大資料中心指導,上海市北高新(集團)有限公司主辦的2020上海靜安國際大資料論壇在上海市靜安區市北高新商務中心隆重舉行。作為大會的重磅環節,論壇上首次釋出了《2020長三角政府資料開放一體化報告》。《2020長三角政府資料開放一體化報告》是“中國開放數林指數”系列報告發布的首個區域性報告。長三角地區作為我國經濟發展最活躍、開放程度最高、創新能力最強的區域之一,在國家現代化建設大局和全方位開放格局中具有舉足輕重的戰略地位。在長三角地區深入推進政府資料開放一體化,有利於打造數字長三角,促進資料要素的跨域流動和融合利用,推動長三角數字經濟和數字社會的一體化高質量發展。復旦大學數字與移動治理實驗室主任、國際關係與公共事務學院教授鄭磊帶來報告解讀。復旦大學數字與移動治理實驗室主任、國際關係與公共事務學院教授鄭磊《長三角政府資料開放一體化報告》:聚焦資料新要素與長三角一體化大家上午好,很榮幸在上海靜安國際大資料論壇釋出《長三角政府資料開放一體化報告》,這也是我們第一次釋出長三角的報告。為什麼在釋出了全國的資料開放報告之外,我們還要專門釋出一個長三角的資料開放一體化的報告呢?一方面是因為資料資源的重要性,特別是今年四月,中共中央、國務院釋出重磅意見,將資料作為新型生產要素寫入檔案,並提出了要開放企業登記、交通運輸、氣象等公共資料,以及促進資料資源的流動。同時,國家已把長三角區域一體化上升為國家戰略,所以我們把資料新要素和長三角一體化這兩個主題放在一起做了這個報告。長三角地區是我國地方政府資料開放實踐的重要發源地
首先我們來看目前長三角地區資料開放的情況。長三角地區是我國地方政府資料開放實踐的重要發源地,在2012年6月份,上海市推出了全國第一個地方政府資料開放平臺;2014年,無錫市上線了長三角第一個、全國第二個地級的政府資料開放平臺;到2015年,浙江省上線了全國第一個省域政府資料開放平臺。大家可以看到2018年之後,各地政府資料開放平臺的上線速度進一步快速增長,到2020年9月份,長三角地區已經有32個地級以上包括副省級的地方政府資料開放平臺。評估指標體系:聚焦準備度、平臺層、資料層、利用層,四維綜合評價目前這32個資料開放平臺,它們分別是什麼情況呢?首先我們從準備度、平臺層、資料層、利用層四個維度來比較這些地方。其中,準備度是“數根”,是資料開放的基礎;平臺層是“數幹”,是資料開放的樞紐;資料層是“數葉”,是資料開放的核心;利用層是“數果”,是資料開放的成效。我們把每個地方開放資料的情況,比喻成一棵“數木”。首先看它的數根,包括政策法規、領導重視、標準規範、執行力度。在數根的基礎上,我們再看它的平臺建設情況,平臺層是指開放平臺本身的使用者體驗如何,是否便於搜尋、下載、使用這個政府開放的資料。其次,最關鍵的權重在資料層上,佔比40%。它指的是:在這個平臺上有多少資料的乾貨,包括資料的質量、資料的覆蓋面,資料的標準等。最後我們還要看這些資料有沒有開花結果,也就是說政府開放的資料,社會有沒有對它們進行充分的利用,產生了各種資料視覺化的產品、APP應用等,最後帶來了社會和經濟價值。所以從這四個層面看,長三角各個地區本身數木生長情況如何呢?從省級來說,目前領先的地區是浙江和上海。在準備度和平臺層上,上海不僅領先長三角地區,而且在全國也處於領先位置。在資料層和利用層上,浙江在全國處於領先地位。大家可以看到長三角地區目前在整個國家的地方政府資料開放當中的地位。之後是江蘇,安徽的平臺還沒有上線。我們也期待著長三角四個地方的省級平臺都能上線。我們看一下地級(含副省級)地方的指數排名,目前領先的是三個地方:寧波,紹興,溫州,之後是泰州,衢州,無錫,金華等。我們看一下地理分佈,顏色越深的地方,相對目前做得最好的地方,也就是數木從數根一直到數果最茂盛的地方,大家可以發現主要集中在浙江的東部跟南部,浙江整體的水平比較好;然後是江蘇的南部,比如寧波,紹興,溫州;然後是江蘇的南部,比如像無錫這樣的地方;然後蘇中,蘇北地區的連雲港也不錯。往安徽這邊,就稍微相對弱一點。但是和三年前相比,那時的資料開放情況還要弱很多,我們已經看到它在一點點擴散進步的過程。所以我們期待一兩年之後會有更多的地方上線更好的資料開放平臺。更重要的是,本次報告和全國總體情況的報告不同,《長三角政府資料開放一體化報告》不僅僅看每一個地方的情況如何,更要看一體化的情況,也就是這些平臺之間有沒有形成協同。
在法規政策的協同度上,我們會看各地是否已經制訂了專門針對資料開放或者是公共資料管理,或者是公共資料共享開放相關的管理辦法、以地方規章或者是規範性檔案的形式。目前,長三角專門針對資料開放的管理辦法只有三個地方:最早的是上海,在2019年8月29日出臺全國第一個針對公共資料開放的管理辦法;之後是浙江,在今年六月份出臺了浙江省公共資料開放和安全管理暫行辦法;江蘇省連雲港也有這樣一個辦法。其他地方是把開放跟共享放在一起,或者和公共資料管理放在一起制定。此外,浙江和上海還有專門關於公共資料開放的技術和標準規範。但目前的問題是各地有關於本地的資料開放管理辦法,但還沒有形成一個長三角地區的資料開放協同的專門檔案或相關政策。所以我們認為在政策協同度上,現在還有進一步提升的空間。
在開放平臺的連線性上,我們發現各個地方的平臺都做的不錯,但平臺之間還沒有互相關聯,也沒有深一步的長三角一體化的資料開放協同,這也是下一步的發展空間。在資料集主題的重合度和內容的匹配度上,我們發現有些資料集在有的地方開放了,在有的地方沒有開放。我們看了14個常見資料集,就是各地都開放的一些通用資料集。可以看到,這14個裡面,有一些上海開放了,有一些浙江開放了。我們再看某一個資料集,比較它的欄位的匹配度,把這個資料集開啟以後,比如“許可範圍”這個欄位浙江有,上海沒有,但是“稅務登記號”上海有,浙江沒有。對資料利用者來說,如果想把上海和浙江的資料放在放在一起做一個應用,這個你有,這個他沒有,他就沒法協同利用起來。
所以我們開啟一個個資料集,看看欄位是否進一步匹配,這樣對於資料利用者,能產生資料跨地區、跨省的資料協同的視角,這方面我們發現還有很大的空間。比如“食品生產經營抽檢”這個資料集,有一個浙江有、上海沒有,但是上海有的、浙江沒有。非常好的是有一些兩邊都有,這就有協同的可能性。但是比較遺憾,江蘇和安徽還沒有出現這樣的資料集。後設資料是關於資料的資料,看看你把這個資料集放出來以後,有沒有關於這個資料集背景的資訊,比如它的名稱,摘要簡介,關鍵字、資料主題、提供單位、格式、開放型別等。在後設資料標準的一致性上,我們看到,除了有一個資料浙江有、上海還沒有,上海和浙江的一致性還是比較強的。但是安徽和江蘇還沒有開放出來。為什麼要看這些,主要是為了從資料利用者的角度去判斷能否能把各個地方的資料協同起來進行利用。在資料利用的跨域性上,各地都已經舉辦了很多的比賽。例如,每年舉辦的上海開放資料創新應用大賽,到現在已經有六年了。浙江和江蘇今年也辦了比賽,但是我們還沒有看到長三角各個地方真正協同起來的比賽,或者是看四個省市的地級市區之間有沒有聯動比賽。目前各個地方還是各做各的,還未出現真正的聯動型比賽。但是參賽者裡面有聯動,上海賽區有浙江、江蘇的參賽者,浙江賽區有外地的參賽者。未來是不是有可能變成一個協同的比賽?這是我們要考慮的。從資料的利用成果來看,目前在這些大賽的成果裡面,我們還沒有看到哪一個大賽的成果能夠用到各個地方的資料,當然我們不能怪這些資料利用者,主要是因為有些地方的資料有的沒有開放,供給跟不上,利用當然也跟不上。所以,我們期待各個地方的開放數木,從數根到數幹,到數葉,到數果都能夠枝繁葉茂、花開結果。過去三年,我們也不斷看到了這些數木的成長。但是,從長三角一體化的視角來看,我們期待這些數木不僅枝繁葉茂、開花結果,同時還能夠根系相通,枝葉相連,在數葉的匹配度一致性,以及數果的相聯性上面進一步推進,使它們都能夠聯動起來,這樣才能形成一片繁盛多樣、又協同一體的長三角開放數林。非常感謝上海市靜安區對於《長三角政府資料開放一體化報告》和“資料新要素與長三角一體化”論壇的支援,我們也期待未來能夠繼續在靜安釋出以後的報告。謝謝!