假日辦撤了,“黃金週長假”到底意味著什麼?官方資料可能太巨集大,不妨借用新興社交媒體的大資料,觀察和記錄2014年“十一”黃金週。看看遊客從哪裡來,又到哪裡去,哪些地方最具吸引力。可以為大家在2015的“十一”黃金週出行提供具有價值的參考。

2014年的“十一黃金週”,人們都去哪兒了?官方資料顯示,2014年“十一”黃金週期間全國共接待遊客4.75億人次,實現旅遊收入2453億元,分別比2013年增長了10.9%和15.7%。而納入國家旅遊局直報的124個旅遊景區(點)在國慶節期間共接待3169萬人次,門票收入超過16億元。

但這背後,是頻現媒體頭條的“看不起”、“擠怕了”等關鍵詞。在快速增長的公眾假期旅遊市場中,“提升品質”似乎成了最具共鳴卻也最難實現的呼聲。

簡單依據官方格式化的通報和統計數字,難以探察越發成熟、訴求愈發多樣的旅遊群體。擁有海量使用者的社交媒體也許為我們提供了一條考察途徑。

微博是國內最大的社交網路平臺之一。隨著移動客戶端普及,遊客所發的位置微博(基於LBS)比例相應提升。使用者在景區一次次拍照、簽到、發微博等行為,目的性異常明確,由此產生的位置微博可被認為是一種範圍與規模更大、也更精細的記錄手段,成為探察遊客旅遊行為的新脈絡。

那麼,從微博的大資料來看,遊客都去哪兒了?他們的感受如何?

資料概覽

通過新浪微博提供的開放平臺和應用程式程式設計介面(Application Programming Interface,API),我們基於全國地理資訊網格,採集了“十一”黃金週及前一週(2014年9月24日至10月8日)共計14天公開的位置微博資料,空間範圍覆蓋整個大陸及港澳臺。

“十一”黃金週位置微博分佈熱點

發微博和黃金週有啥關係?微博使用者對假期旅行經歷的分享,顯著推動了微博數量增長。從總數看,“十一”黃金週期間,全國位置微博約667萬條,最高日約102萬條,最低日約86萬條。相比節前一週的566萬條,總量增長約18%,尤其是照片數量增長明顯。在黃金週末期,微博數量逐步回落到節前水平。

那麼,在哪裡發微博的人最多?從分佈看,全國尺度上微博數量與人口總量的分佈非常相似,以愛輝-騰衝線為界,東部地區微博數量遠高於西部。其中北上廣、各省省會等一、二線城市普遍具有較強的聚集能力,假日期間顯著吸引了周邊乃至全國的移動人口。

但這一資料或許還不能完全說明旅遊地的受歡迎程度。在進一步與當地常住人口(六普)及節前日常水平進行對比後,以人均微博密度為指標,我們發現,額濟納、稻城、麗江等非一線地區作為旅遊熱點,在縣域尺度同樣表現出非同一般的吸引力。其中,四川省表現尤為突出,在前十位的熱點縣區中獨佔五席。這與官方統計結論相吻合,國家旅遊局通報顯示, 2014年“十一”黃金週四川省旅遊總收入超過200億元,較前一年增長達到29.1%,是全國旅遊收入增長最快的省份。

在微博中,我們還能探知哪裡的景區可能更有趣。相關的考察角度,是每帖照片數:因拍照是遊客分享旅行經歷中最重要的形式之一,每帖照片數從側面可體現遊覽景區能在多大程度上激發使用者的拍照和分享,可將其視為當地旅遊感染力強弱的綜合反映。

從整體統計的意義看,可認為每帖照片數較多的地區,其景觀資源品質也相對較高。

從結果看,西部地區社交網路使用者數量雖少,但照片比例遠高於東部,與前述微博總量“東高西低”格局呈現出有趣的對稱現象。早有學者指出,西部地區是我國旅遊資源最豐富的地區,自然景觀和人文景觀佔了全國“半壁江山”,西部十省市也都無一例外地把旅遊業當作支柱產業來培育和發展。從遊客角度出發,拍照意願的強弱程度也進一步佐證了這一結論。

從哪裡來,到哪裡去?

到達量方面,北京、廣州、深圳、成都、上海總量居前五位,五地微博使用者到達量佔全國總量13%,這與當地移動網際網路使用者基數較大有一定關係。我們將到達量與官方“十一”黃金週重點旅遊城市排行比較,可發現,靠前的幾個城市排序相似性較高,但人口較少的城市(青島、煙臺)相似性偏弱,表明現階段微博資料與官方統計口徑之間依然存在一定差異。

官方統計與微博資料比較

因此,我們進一步引入節前各地的使用者數為基數,分析到達量佔基數的比重,以減少資料口徑偏差的影響。調整後發現,神農架、阿拉善、海南(青海)等地的排序靠前且均超過100%,對官方統計資料形成較好的補充。

那麼,“十一”黃金週期間的旅遊者,又是從哪裡來的?我們在離開量方面,主要考察從某地離開與到達該地的比值。該比值越大,當地使用者外出的傾向就越高。比值排行靠前的城市有烏魯木齊、蘭州、合肥、北京、澳門等地。將到達量與離開量繪製在一張圖上,平均值線上下兩部分的城市,可分別被劃分為長假人口“外出型”和“湧入型”的地區。

長假外出型城市和長假湧入型城市

遊客從哪裡來,又到哪裡去,哪些起訖點之間,遊客流量最大?是短途遊,還是長途遊?

在城市間流量方面,將使用者離開與達到的單次資料通過空間分析進行聚合並分級統計,我們得到“十一”黃金週期間全國微博使用者流動的網路圖。流量處於第一層級的城市對,包括北京-天津、成都-重慶、廣州-深圳等。第二層級前幾對的城市則包括廈門-漳州、南充-成都、渭南-西安等。這兩個層級的城市間流量合計佔了全國總流量的16.6%。

圖上還能直觀看到一個由北京、上海、廣州、成都所構成的菱形結構,若再加上武漢、西安、山東半島及福建沿海城市帶(廈門-福州-漳州)的話,黃金週期間,微博使用者流動所刻畫出來的這個菱形,實質上與中國城市化水平最高的地區高度重合。

在第一和第二層級的城市對當中,除北京與上海、成都、廣州、西安之外,其餘城市間的相互間距離均未超過300~400公里,使用者流動規模與移動距離呈明顯負相關關係。而北京則表現出了首都所具有的國家尺度吸引力水平。

在主要城市之外,我們還挑選了部分知名景區,研究其外地遊客的主要來源。在這些景區中,烏鎮、青海湖和鼓浪嶼的主要外地客源,均來自自身所處的地域,而黃山、鳳凰和九寨溝的外地客源則具有更大的多樣性,景區影響力也更大。

部分景區客源分佈

遊客在哪裡會更多地談論“愛”和“美”

社交媒體最具價值的部分,依然是微博訊息內容本身。

以烏鎮和九寨溝為例,在自然語言處理工具(Natural Language Processing,NLP)的幫助下,我們進一步對遊客在黃金週第一天所發微博的內容進行了語義分析(Sentiment Analysis)。對比兩地的高頻詞後發現,在以周邊遊為主的烏鎮景區內,遊客留言相對具體,多次談及時間(“國慶”、“一天”)、事物(“水鄉”、“江南”、“旅遊”)等,而九寨溝遊客的留言則明顯趨向於情感化,以“愛”、“美”、“快樂”等詞語為主。

豐富的資料使我們可以回答諸如“某景區不同來源、不同型別遊客在不同時間裡都在讚美或吐槽什麼”這樣的問題。

結語

2014年的“十一”黃金週,恰逢我國首部《旅遊法》頒佈實施一週年。《旅遊法》強調了以人為本的出發點,更注重保護旅遊者的權力。其中明文規定,各地主管部門應建立旅遊公共資訊和諮詢平臺向旅遊者提供必要資訊和諮詢服務。

旅遊作為典型的口碑經濟和體驗經濟,對行業和遊客輿論應予關注。從購物到安全、從票價到擁擠,網路輿情中各類關於景區的報導會對遊客的消費決策產生明顯影響,公眾可以“用腳投票”選擇目的地。社交媒體上的公開資料進一步完善後,完全可以採集不同時間段、不同來源的遊客反饋,進行提煉與分析,做出更有針對性的改善措施,這對旅遊業的監管、運營及遊客自身都意義重大。

目前全國納入旅遊局直報系統的城市和景區僅有125處,而我國僅4A、5A級景區就有近千家,官方統計存在明顯不足。對整個旅遊行業來說,社交媒體等網路輿情資訊經過挖掘能對官方資料形成補充,具有極大的科研、管理和商業價值,也是監管者、運營者與遊客之間重要的即時互動橋樑。

故而,在傳統旅遊公共資訊平臺基礎上,各地還可以建立起一套囊括官方統計、新興媒體、物聯網監控等各類來源的旅遊行業資料開放與治理體系,完善旅遊開放資料的應用生態圈,集社會合力共同提升整個旅遊行業的發展水平。

[作者系中國城市規劃設計研究院高階工程師。作者感謝香港大學規劃與設計系助理教授劉行健博士、北京城市規劃設計研究院高階工程師龍瀛博士對本文繪圖與基礎資料的協助,三人均為致力於定量城市研究的虛擬學術網路“北京城市實驗室(Beijing City Lab,BCL)”主要成員]

來源:阿里研究院