IP 庫之手機基站資料篇

高春輝發表於2017-03-09

編者按:本文作者由專業 IP 資料庫的創始人高春輝親自撰寫,向大家披露移動網際網路時代的 IP 資料庫與手機基站的那些事。

我們在當 IPIP 的客服的時候,除了地理位置這個事情外,一般都會有公司的人追問,你有沒有這種資料,有沒有那種資料,其中一個問題就是基站資料,當時我們也沒有精力做,所以一概反饋以後再說吧。

還有一個場景就是在使用者剛購買完使用者剛投入使用的時候,會拿著統計資料來問,你們不是說國內到城市嗎?為什麼有這麼多 IP 只標註到了省呢?我們看到資料反饋(現在不需要看,也能猜到大概情況了),都得一遍一遍的去解釋這大部分都是使用者在使用基站的情況,雖然也有其它情況,但是遠少於基站的出現頻率,畢竟手機使用者越來越多了。

後來 2015 年第三季度的某一天,發現我們基於已有的資料可以做基站資料的識別了,其實之前也有,只是沒想到可以這麼用。於是就有了這個基站 IP 資料庫。

這裡說的基站 IP 資料,和基站 ID 對應的地理位置資料是兩碼事,後面這個以後再安利吧。

先說一下概念,大家在不使用 WIFI 網路的時候,使用手機透過運營商提供的網路進行上網的時候,目前都是在使用者端使用私有IP,然後對外做 NAT 轉換,這樣的情況就導致大家統一使用一些 IP 段進行訪問網站或者 APP。一般我們稱這些相對固定的 IP 段為基站 IP ,這個不一定是運營商的說法,無論是 GGSN 還是什麼,但是我們這些關注這塊的人都這麼叫,算是約定俗成吧。

這種方式對於運營商的好處壞處我們就不談了,我們從網際網路公司這邊的影響來看:

1、想透過 IP 定位到城市,難。

由於國內大部分的省都是以省級為單位劃分基站對外訪問 IP ,也就是說,同樣一個出口 IP,後面的對應使用者可能是跨多個城市的。

也有一部分省是按照市一級為單位劃分的,但是位置偏遠,你估計也不會關心。

還有一部分地區是一段 IP 給兩三個城市同時使用,在我們的資料庫依然沒法準確到城市。

2、對於反作弊或者反爬蟲,麻煩。

由於是 NAT 方式,一個IP 後面必然是一大堆使用者,那麼從網際網路公司的運維角度來看,明顯會看出一個IP的訪問過於頻繁,那是否要進行特殊處理,比如封禁,就要基於 IP 本身的用途進行參考。

比如基站 IP, 所封禁的閾值,就要比家庭寬頻的要高的多,而 IDC 的 IP ,在不考慮第三方出口的情況下,閾值可能就要相對低很多。不然你的封禁處理會可能導致影響到正常使用者使用。

3、漫遊,巨麻煩。

往往大家在有些時候需要判斷使用者所在地理位置,那麼在基站下,則是另外一個情況。

不但像第一點說的定位不到城市,而且還有可以連當時使用者所在的省都是錯的。

經過兜裡揣三部手機出差到處看 IP 的 職業病習慣的歷練 ,目前我們所知道的三家運營商的漫遊情況是這樣的,請大家務必牢記:

  • 移動:漫遊到當地網路。如果你的卡是北京的,如果去到上海,那麼你會看到上海的 IP。
  • 聯通和電信:漫遊回屬地網路。如果你的卡是北京的,如果去到上海,你依然會看到北京的 IP。

提醒一點,這只是國內的情況,當你漫遊到港澳臺(我只去過臺灣,但我相信港澳也是一樣的)和國外(我只去過美國,但可以以此類推了)的時候,都是屬地漫遊方式。你經常看到有人抱怨說拿著移動聯通或者電信的手機,在國外訪問 GOOGLE 依然會被牆,因為你等於走了隧道回到國內再出去,當然會被牆啊,沒什麼可奇怪的了。這也是為啥有人要買國外的運營商手機卡拿到國內來用的原因吧。

不過能夠明確知曉三家運營商的漫遊情況,也能幫助你判斷一些事情,比如使用者是移動的 IP 就不用太擔心了,一定是使用者目前所在地,雖然不能到城市,但是也可以相信。聯通和電信才麻煩。

不過我們有時也在想,畢竟長期漫遊不是一般使用者能幹的事情,這種相對小機率事件其實可以忽略掉的。而且如果有其他資料來源, IP 庫還是作為兜底方案為好。

我們的基站資料就是提供這樣一個 IP 列表,告訴你哪些 IP 段是運營商用於基站的。目前大約有 36000 多個 C 段,含臺灣的部分資料,包含一部分運營商 WIFI 資料 。

以上三個是比較都容易想到的情況,還有一個情況,是我和朋友聊天的時候,對於基站資料所發現的新用途。

典型場景是這樣的,目前無論是何種手機系統,基本上都支援手機當熱點,好壞不用說了。但是會有一個問題。

很多系統或者應用的場景,會基於 WIFI 環境下做背景下載或者圖片的尺寸的最佳化,沒錯吧?比如很多應用商店的策略都是說 WIFI 下會自動更新。蘋果手機也不例外。

問題來了,如果我的手機是連線的朋友手機的熱點上的 WIFI,那麼以上的 WIFI 場景判斷都很有可能會導致流量大增,最後傷害到使用者體驗。

怎麼破?貌似沒聽說哪個系統支援,即使有人說蘋果可以檢測,但是那應該是兩個蘋果裝置之間的檢測,如果我連結了一個安卓手機的熱點呢?

嘿嘿,頭大了吧?:-)

呵呵,我們做的基站 IP 資料能幫你忙。。。

只要在判斷 WIFI 的場景下,再增加一個使用者出口 IP 的判斷,只要不在我們的資料庫裡,才能認為是真實可用的 WIFI 環境,就可以了,麼麼噠。

而且也可以用於使用者當前上網方式的判斷,如果你只能拿到 IP 的話 ,這個庫就可以幫助你判斷,使用者目前的上網方式,拿來出資料包告也是有價值的。

如果你想資料進行測試,請用手機訪問這個網頁, https://www.ipip.net/ip.html

我們會在符合基站資料條件的的資料下面標註“ 該 IP 段由運營商應用在基站(含 WIFI)用途,此類用途 IP 一般為省級或者市級區域使用。”。

歡迎測試準確性,有錯誤,請反饋給我。

相關文章