199IT資料中心微信賬戶:i199IT
京津冀協同發展是一項重大國家戰略,2015年的政府工作報告中再次重申這一戰略的重要性,而大資料則是“網際網路+”行動計劃的重要組成部分。京津冀三地地域相鄰,在大資料產業發展中各具特色。因此,在京津冀協同框架下,三地充分發揮自身優勢,建立差異互補、協同合作的大資料產業鏈。
關鍵詞:京津冀協同;大資料;網際網路
一、引言
京津冀協同發展是一項重大國家戰略。習近平總書記曾指出實現京津冀協同發展,是面向未來打造新的首都經濟圈、推進區域發展體制機制創新的需要,是探索完善城市群佈局和形態、為優化開發區域發展提供示範和樣板的需要,是探索生態文明建設有效路徑、促進人口經濟資源環境相協調的需要,是實現京津冀優勢互補、促進環渤海經濟區發展、帶動北方腹地發展的需要,要堅持優勢互補、互利共贏、紮實推進,加快走出一條科學持續的協同發展路子。
2015年的政府工作報告中也指出,要推進京津冀協同發展,在交通一體化、生態環保、產業升級轉移等方面率先取得實質性突破。
而大資料是資訊產業的重大技術突破,具有非常廣闊的發展前景。1980年,著名未來學家阿爾文·托夫勒便在《第三次浪潮》一書中,將大資料熱情地讚頌為“第三次浪潮的華彩樂章”[1]。大約從2009年開始,“大資料”成為網際網路資訊科技行業的流行詞彙。
無論是國外還是國內城市都對大資料市場寄予了巨大的希望。我國在2015年的政府工作報告中也指出,要制定“網際網路+”行動計劃,推動移動網際網路、雲端計算、大資料、物聯網等與現代製造業結合,促進電子商務、工業網際網路和網際網路金融健康發展,引導網際網路企業擴充國際市場。
京津冀在發展大資料產業方面都具備自身的優勢,但也存在一些侷限,在京津冀協同發展的大框架下,就需要優勢互補,共同協作。
二、大資料產業的內涵及特點
大資料,或稱巨量資料、海量資料,是指由數量巨大、結構複雜、型別眾多的資料構成的資料集合,是基於雲端計算的資料處理與應用模式,通過資料的整合共享、交叉複用形成的智力資源和知識服務能力。
維克托·邁爾-舍恩伯格及肯尼斯·庫克耶編寫的《大資料時代》中,大資料指不用隨機分析法(抽樣調查)這樣的捷徑,而採用所有資料進行分析處理[2]。
大資料具有4V特點,即Volume(大量)、Velocity(高速)、Variety(多樣)、Value(價值)。這些特點恰恰體現了大資料對資訊科技的超高要求。
Volume(大量)。大資料所包含的資料量巨大。美國網際網路資料中心曾指出,網際網路上的資料每年將增長50%,每兩年便將翻一番,而近90%的資料都是近幾年產生的。僅以百度為例,根據公開的資訊,作為全球最大的中文搜尋引擎,百度每天響應來自138個國家和地區的數十億次請求,每日新增資料10TB,要處理超過100PB的資料。而網際網路中產生的資料僅是大資料構成的一部分,其餘來自工業、商業等領域的資料更是不計其數。例如僅國家電網,全國能夠採集獲得的資料總量也是上10個PB級別的。據統計2013年中國產生的資料總量超過0.8ZB(相當於8億TB),2倍於2012年,相當於2009年全球的資料總量。預計到2020年,中國產生的資料總量將是2013年的10倍,超過8.5ZB。
Velocity(高速)。大資料對資料處理速度要求高。各種資料的產生與更新速度非常快,如騰訊QQ目前擁有8億使用者,4億移動使用者,每日新增資料約在200TB~300TB,平均每秒新增資料約為2.37GB~3.56GB,可謂瞬息萬變,分秒間處理出的結果已是千差萬別,因此大資料具有鮮明的時效性,大資料的挖掘要求在秒級時間範圍內給出分析結果,這也是大資料處理技術和傳統的資料探勘技術最大的區別。
Variety(多樣)。大資料的型別繁多,資料來源於各種各樣的渠道。除資料龐大的網際網路之外,電信、金融、保險、電力、石化系統、公共安全、醫療、交通領域、氣象、教育、地理、政務、商業銷售、製造業、農業、物流和流通等其他領域也都包含著規模龐大的資料。據推算,目前國內銀行和金融系統每年產生的資料達到數十PB;整個醫療衛生行業,一年能夠儲存下來的資料就可以達到數百PB;交通方面,航班往返一次能產生的資料就達到TB級別,列車、水陸路運輸產生的各種資料視訊、文字類資料,每年也在百PB級別[3]。
Value(價值)。正因為資料數量如此龐大,而來源又如此繁雜,因此真正能夠產生價值的資料比例不高。大資料具有資料價值密度低,商業價值高的特點。大資料的特點也決定了大資料產業鏈所必須包含的組成部分。大量與多樣的特點決定了產業鏈中應包含資料來源及儲存部分;而速度和價值特點則決定了產業鏈應包括快速資料處理挖掘和應用部分。因此可以說大資料產業鏈主要包含四個層面:第一層,資料來源層,包括網際網路、移動網際網路、運營商、政府部門、工業、商業等領域;第二層,資料儲存層,包括雲服務平臺、雲端儲存裝置商等;第三層,資料分析與挖掘層,包括各綜合及專業服務部門,負責資料分析及共享等;第四層,資料應用層,包括網際網路、政府部門、商業部門等多個領域。
三、京津冀大資料產業發展的優勢比較
1. 資訊業發展基礎比較
大資料是資訊科技發展的更高階段,資訊業的發展也是大資料產業發展的基礎。在資訊業發展中,北京在京津冀三地中處於絕對的領先地位。2013年1-12月北京市軟體和資訊服務業實現營業收入4 900億元,這與政府的重視和財力物力的大量投入密不可分。如圖1所示,2013年北京市資訊傳輸、軟體和資訊科技服務業固定資產投資209.74億元,是河北的1.8倍,天津的2.8倍。完善的基礎設施和高速發展的資訊業也吸引了更多的專業技術人員從事這一行業,如圖2所示,2013年北京市資訊傳輸、軟體和資訊科技服務業從業人員達到73.2萬人,遠遠領先於河北的19.8萬人和天津的7.98萬人。因此說,在三地中,北京具備更加完備的資訊業發展基礎,擁有更多的專業人員。
2. 軟體產業總體發展狀況比較
軟體是大資料產業發展的核心,大資料產業發展的各個環節都離不開專業技術軟體。相比較起來,三地的軟體產業發展差距也比較大。從軟體企業數量和軟體業務收入兩個指標上看,北京均居於三地之首。如圖3所示,至2013年底北京共有軟體企業1 956家;天津共有560家,河北共有264家。在軟體產品數量上,北京的增長量也很大,2013年北京新認定軟體產品8 783件,同比增長34.2%,軟體業務收入4 210.63億元,遠遠高於天津的711.39億元和河北的134.23億元(見圖4)。因此從總體上說,北京的軟體產業比天津和河北發展速度更快,產業規模更大。
3. 軟體產業專案分類比較
雖然北京的軟體產業發展水平遠遠領先於天津和河北,但軟體產業中細分了各個類目,具體分析來看,三地對於軟體產業的側重點也有不同。如表1所示,北京的資訊系統整合服務收入、資訊科技諮詢服務收入、資料處理和儲存服務收入這三項收入都很高,甚至其中兩個專案是其他兩個地區的十餘倍;而天津的嵌入式系統軟體收入和積體電路設計收入則都高於其他兩個地區,特別是嵌入式系統軟體收入這一項,相當於北京同類專案收入的15倍;而河北的軟體產業發展相對較弱,除資訊系統整合服務收入與天津相當外,其餘的專案均遠遠低於其他兩個城市。
4. 科技研發基礎比較
大資料屬於高科技產業,因此研發水平的高低對於產業發展有著至關重要的作用。首先,從研究與試驗發展(R&D)經費上來看,2013年北京市全年發(R&D)經費支出1 200.7億元,相當於地區生產總值的6.2%;天津市全年經費支出約402.4億元,佔地區生產總值的2.8%;河北省全年經費支出290億元,佔全省生產總值的1.0%。其次,從專業人才方面來看,2013年北京市共有研發(R&D)活動人員35.1萬人,全市共有56所普通高校和80個科研機構培養研究生,全年研究生教育招生9.1萬人,在學研究生26.6萬人,畢業生7.3萬人;天津市共有普通高校55所,全年招收研究生1.7萬人,在學研究生5.1萬人,畢業生1.5萬人;河北省全年研究生教育招生1.3萬人,在學研究生3.8萬人,畢業生1.1萬人。
綜合以上資料分析可知,北京市研發經費支出數額與佔GDP的比重都高於其他兩個地區,且無論是現有專業人才還是後備人才也比其他兩個地區數量更多,因此說三個地區相比,北京具有更雄厚的科技研發基礎,天津其次,河北相對較弱。
5. 土地資源比較
與許多產業相同,大資料產業對土地資源也有一定的需求,其後續的擴充也需廣闊的發展空間。從地理位置來看,京津冀同處環渤海心臟地帶,地域相鄰。但三地的土地面積和人口密度卻具有很大差別。其中北京土地面積1.64萬平方公里,2014年末全市常住人口2 151.6萬人,人口密度約為1 312人/平方公里;天津土地面積1.19萬平方公里,年末全市常住人口1 516.81萬人,人口密度約為1 275人/平方公里;河北省18.88萬平方公里,年末全省常住人口7 383.75萬人,人口密度約為391人/平方公里。從以上資料可以看出,與京津地區相比,河北省土地面積大,人口密度小,具有更大的空間發展潛力。
6. 人力資源成本比較
無論任何產業,人力資源都是產業發展的根本,而擁有更低的勞動力成本,將會為企業節約更多的資源,更有效地提高企業競爭力,推動企業良性運轉,從而推動整個產業的發展。據統計,2013年北京市全年城鎮居民人均可支配收入為40 321元;天津市為32 658元;河北省為22 580元。從以上資料中可以非常直觀地發現,河北省擁有更低的勞動力成本,天津次之,北京最高。
四、推進京津冀大資料產業差異互補發展的對策建議
1. 京津冀合作構建差異互補的大資料產業鏈
大資料產業涉及領域廣泛,涉及內容細緻繁雜,所需儲存空間龐大,資料蒐集涉及多個部門,僅靠一個省市構建完善的大資料產業鏈所需投入的人力物力財力較大,且根據以上的比較可以看出,北京、天津、河北三地在大資料產業建設基礎條件上各有優劣,單一的地區可能在基礎設施、研發能力、土地資源、人力資源等許多方面受到制約。因此,不如充分運用三地現有優勢,設計適合三地發展並能實現合作共贏的產業規劃,在京津冀協同發展戰略引導下,共同構建京津冀大資料產業鏈,讓三地在產業鏈上的佈局分配及側重點上有所差別。取長補短,差異性、互補性發展。
2. 建立統一共享的大資料平臺
資料的蒐集是大資料產業鏈的開端,也是資料探勘、分析的必備前提,充足全面的資料可以使資料的分析更加客觀準確,得出的結論更具參考價值。目前三地的政府、產業界、網際網路站都積累了大量的資料資產,但由於受觀念制約,或對資料資源的獲取能力和整合能力不足,許多資料並不能完全實現共享,得不到充分的利用,造成了大量資料資源的浪費。因而建議京津冀建立統一的大資料平臺及資料庫,讓三地資料實現互傳共享,從而最大程度地挖掘資料價值,提高資料利用率,創造出更大的社會和經濟價值。
3. 建議在北京建立大資料技術研發中心及應用中心,側重於大資料的研發及應用
大資料產業的發展需要不斷更新提升的高新技術作為支撐,特別是面對目前國內科技創新能力不強的問題,急需具備軟體開發能力的軟體企業及具有自主創新能力的研發力量。根據以上的比較可以看出,北京的軟體產業發展最快,軟體企業最多,軟體業務的收入也最高。而且,北京還有相對於其他兩個地區更為雄厚的技術研發基礎,因此建議在北京建立大資料研發中心,負責大資料新技術的研發。另外,鑑於北京資訊產業整體發展領先於其他兩地,且北京又是許多國內外大企業總部的集聚地,因此建議將大資料應用中心設於北京,以期將經過挖掘與處理的資料更好地投入應用。
4. 建議在天津建立相關裝置生產基地和雲端計算中心,側重於相關裝置生產及資料分析
從以上資料可知,天津的嵌入式系統軟體收入和積體電路設計收入都高於其他兩個地區,而嵌入式系統是綜合了計算機軟硬體、感測器技術、積體電路技術、電子應用技術為一體的複雜技術。它在物聯網中承擔著分析、管理、處置資訊的核心作用。物聯網產業也是天津著力發展的產業之一,而且天津的雲端伺服器、儲存器、路由器生產也位居國內先進水平。因此建議在天津建立物聯網與雲端計算裝置生產基地,為大資料產業提供硬體支撐。
在天津建立雲端計算中心,則是依託天津濱海新區雲端計算產業基地,以國家超算天津中心為基礎,借力“天河一號”應用平臺,結合計算效能達到百萬億次的天河·天騰系統;包含128個Intel-EX5675 CPU的天河·天翔系統;包含24個節點共計96個CPU的天河·天馳系統,提供高質量、高效能的計算與分析服務。
5. 建議在河北建立雲端儲存基地,側重於資料蒐集及儲存服務
通過以上分析可知,河北相對於其他兩個城市,具有土地資源及人力資源成本優勢。而大資料的儲存中心恰恰由於受土地和勞動力成本的制約而不適合建在中心城市,但又由於招商及維護等方面原因不宜離中心城市過遠。因而河北便可充分利用它毗鄰京津的地域優勢,建立雲端儲存基地,側重於大資料的蒐集及儲存服務。
但也應注意,由於河北省下設多個城市,城市之間可能會因為總體規劃不明確而出現城市大資料產業規劃雷同,產品服務同質化,嚴重地甚至會出現惡性競爭。這就需要省內統一規劃大資料產業佈局,結合各地優質資源集中謀劃,在全省內形成協作互利的大資料儲存網路。
作者,陳瀅,天津社會科學院城市經濟研究所
摘自:《經濟與管理》 2015年第03期