本期嘉賓演講為北京市政交通一卡通公司資料運營總監張翔帶來的分享,看了他講的內容才知道,我們每天都在用的公交卡真是一種神奇的東西,以它為媒介積累了海量資料,從中能進行各種有趣而使用的挖掘實踐。

北京市政交通一卡通公司資料運營總監張翔
各位嘉賓、各位朋友,大家上午好。我今天帶來的題目是北京市政交通IC卡資料在城市治理中的應用。
我主要講三個方面,首先是北京市政交通一卡通業務介紹。第二是資料現狀平臺功能,第三是城市治理中的應用實踐。




第一套是具有鮮明一卡通特色的資料治理體系。第二套是我們資料探勘分析和計算體系。第三套是我們應用和展示體系。

在卡片當中應用比較多的像通勤的OD、充值的次數、票價敏感度等等都是標籤。還有學生卡、老年人卡,我們單獨會有專項的標籤。目前我們發了1億張,保有量8000萬。但是正常活躍在用的大概是3000萬張,我們經過一年的努力把3000萬市民的畫像基本上做全了,這也是為政府各項資料分析服務提供了基礎。
我們的標籤基本上分成三類,一類是公共交通類,一類是市政服務類,還有一類是外源融合類,包括天氣資料、商業化的資料等等。



從這張圖可以看出來,昊海樓中的工作人群(當然我們要限定了,它只限於公交方式的人群,私家車我沒有加進去),他的出行距離、上班的時間分佈、使用的交通工具,以及換乘的方式和各個區域之間的方式,可以很典型的通過這張圖來實現。我們和國家發改委規劃院和北京規劃院有深入的合作,為他們的規劃提供了支援,用他們的術語叫資料驅動規劃。

前面我簡單介紹了企業情況,以及我們的資料和資料平臺的情況。下面我分四個方面介紹一下北京一卡通的資料,我把一年來做的各種案例梳理了一下,主要分為四類,一是政策效果評估,二是城市規劃支撐,三是特定人群的分析以及服務,四是公共交通的優化。
第一個案例是北京的重大政策的評估。評估分為事前、事中和事後,北京在2014年做了一次票改,減少非剛需的地鐵客流,引導客流的合理出行。我們取了票改前後各一個月的10億條資料,我們在國內外交流的時候,很多專家告訴我們,至少這是國內第一份基於全口徑的分析。票改後第一個月地鐵刷卡次數減少了10%,從結果上來看,基本上達到了市政府票改的目的。


從這個圖可以看出來,整個票改對北京人群出行影響有149萬,同時一個月超過十次的我們稱他改變了出行結構,我們把地鐵轉化為公交的定為票價敏感人群。這20萬人群是下一步票改需要重點考慮的人群。
第二個案例選擇的是2015年北京的大閱兵,閱兵的過程當中採取了交通限行措施,我們研究了單雙號限行對整個北京區域內公交的影響。我們從右邊可以看出來結果,限行期間和限行前,整個公共交通的出行增量增長了7%,其中公交增加了10%,並且早高峰提前了十分鐘,地鐵略降了2%。


因為這次是限行,主要是想讓私家車出行轉成公交方式出行。所以我們重點研究了一下有車族轉至公交的情況。從上面的圖可以看出來,前兩週一次都沒有坐過公交系統的,在限行期間內坐了兩次或者兩次以上的有329萬人。在限行期間乘坐公共交通八次以上的有94萬人,從效果來看達到了政策設計的目的。
現在政府非常推崇綠色出行,就是自行車。當然這個裡面是直觀的體現,從總人群上看增加了10%,每一個使用的頻次都有相應的增加。
剛才是關於城市重大政策的事前、事中、事後的案例。因為北京區域非常大,各個區之間跨區的工作現象非常多,這裡面我們和國家發改委一起合作,做了北京區域內的跨區工作的分佈。


關於城市規劃支撐,第二個案例是通州,通州現在被定義成北京的副中心。而且它的高度現在也被提到了已經不是北京的通州了,它是京津冀的通州。包括國家發改委、市發改委都委託我們研究通州它的公共交通影響的靜態和動態的人群。


我們再看右邊這張圖通州工作外區居住,從這個圖可以典型看出來朝陽、豐臺和大興區居住人群到通州上班的比例是比較高的。
這兩張圖反映的也是剛才的,是通州和各區之間的關係。下面是以熱力圖的方式來反映,左邊是它的工作地分佈,右邊是通州的居住地分佈。


北京的工作人群不僅僅受北京的影響,還受河北的影響,典型是河北的北三縣,公共交通出行的工作人口中,超過40%是在北京的區域裡工作,其中又以朝陽和通州的比例較高。

第三個案例是對特定人群的分析,原來我的PPT沒有這個,但是這段時間有一個現象,英國的學者提出來用IC卡資料來抓小偷,好像在資料分析師圈子裡面流傳很廣。實際上這件事情,我們五年前就在做和北京公交總隊合作在做,為什麼沒有說呢?因為你說出來有負面影響,但是為了增加趣味性我今天就把這個題拿出來說一下。
我們有一套系統稱為北京一卡通特定人群分析系統,它有三個層次。第一個層次我們可以分為大學生、中小學生、老年人、小偷、乞討,它有一個巨集觀的北京市的整體的考慮,相關的政府部門必須考慮,我們按照他們的要求做的這套系統。其中灰色人群的體系裡面,有一塊專門是小偷、乞討和其他的灰色人群,包括有些快遞我們也歸為灰色人群。


我們更多做的是一些普通人群,包括老年人、中小學生,特別是中小學生在北京是IC卡應用起到了相當大的作用。這四張圖體現的是北京的中小學生每天通學的距離。


右邊是通勤人群,我們可以看到北京人民還是很辛苦的。特別是出行公里數在25%左右是12到20公里,還有剩下16%是20公里以上,像我每天單程是20公里。
第四部分是我們公共交通優化的分析體系
我們是四個層次,第一層次是對整個路網的監控。第二層次是某一條路網的某一條。第三個層次是線路里面的站點。第四個層次從線路里面出來的人,以及人的軌跡的分析。
這是全天路網24小時動態分佈圖,顏色越深代表這個站點出行的人群密度越大。大家可以看到北京最北邊和右下方這個位置有幾個站,從早上開始一直要紅到晚上十點鐘。


第四個層次是個人軌跡,我們通過對個人通勤軌跡的分析,我們可以找出它的通勤方式的偏好,通勤的距離、時長、換乘的方式、居住的區域,以及它的工作的區域,居住區的車站分佈等等特徵都可以通過他的刷卡行為體現出來。當然如果再融合其他的外源資料可能有更深的發現。

整個這一塊我們對標籤畫像軌跡的描述,對很多設計部門、政府管理部門,甚至是一些商業單位是很有價值的做法。我們四層結構的包括路網、線路、站點和個人分析,在工作當中對交通優化起到了很強的資料支撐作用。比如說對通勤班車線路的設計、公交、地鐵站點之間換乘接駁,有很強的指導意義。
從剛才我們描述的諸多案例可以看出來,IC卡資料確實在城市治理當中起到了一些典型的效果。它提升了城市政策制定的效果和效率,提升了政府對特定人群服務的質量和水平。同時,它更可以優化公共交通資源的配置,我們北京一卡通公司做這種資料分析工作,已經有三四年時間了。在這三四年的過程當中,我們也應用了很多計算基礎和國內國外的計算工具和方法。在做的過程當中,我們感覺到我們開啟了一扇門,這個門裡面目前做的是為政府提供服務。但事實上我理解就我們現在的資料基礎和經驗完全可以為社會提供更深的資料服務,可以為公眾提供服務,甚至為個人提供服務或者是對商業企業做很多具體的應用。
後面幾項是更廣闊的空間,我們公司下一步確實在探索和研究,看是不是可以往商業化的方向考慮。我覺得在座的都是同行,如果大家有興趣的話我們是不是可以從這幾個層面。包括資料研究的層面和資料互換的層面,我們可以直接從商業層面合作,希望大家會後有機會可以交流。
