忘記12306!用 Python3 實現自己的火車票檢視器!
課程簡介:
使用 Python3 抓取 12306 網站資訊提供一個命令列的火車票查詢工具。通過該專案的實現,可以熟悉 Python3 基礎及網路程式設計,以及 docopt,requests,prettytable 等庫的使用。
專案由小蝸牛釋出在實驗樓,專案線上練習地址:Python3 實現火車票查詢工具,可以直接在教程中下載程式碼使用demo。
一、實驗簡介
當你想查詢一下火車票資訊的時候,你還在上 12306 官網嗎?或是開啟你手機裡的 APP?
下面讓我們來用 Python 寫一個命令列版的火車票檢視器, 只要在命令列敲一行命令就能獲得你想要的火車票資訊!如果你剛掌握了Python基礎,這將是個不錯的小練習。
1.1 知識點
Python3 基礎知識的綜合運用
docopt、requests 及 prettytable 庫的使用
1.2 效果截圖
二、介面設計
一個應用寫出來最終是要給人使用的,哪怕只是給你自己使用。
所以,首先應該想想你希望怎麼使用它?讓我們先給這個小應用起個名字吧,既然及查詢票務資訊,那就叫它 tickets 好了。
我們希望使用者只要輸入出發站,到達站以及日期就讓就能獲得想要的資訊,比如要檢視8月25號上海-北京的火車餘票, 我們只需輸入:
$ tickets shanghai beijing 2016-08-25
注意: 由於實驗樓環境中無法輸入中文,所以我們的引數設計為拼音的形式,在這裡思考下使用拼音是否有什麼弊端?
對這一介面進行抽象得到:
$ tickets from to date
另外,火車有各種型別,高鐵、動車、特快、快速和直達,我們希望可以提供選項只查詢特定的一種或幾種的火車,所以,我們應該有下面這些選項:
-g 高鐵
-d 動車
-t 特快
-k 快速
-z 直達
這幾個選項應該能被組合使用,所以,最終我們的介面應該是這個樣子的:
$ tickets [-gdtkz] from to date
介面已經確定好了,剩下的就是實現它了。
三、程式碼實現
首先安裝一下實驗需要用到的庫:
$ sodo pip install requests prettytable docopt
requests, 不用不多介紹了吧,使用 Python 訪問 HTTP 資源的必備庫。
docopt, Python3 命令列引數解析工具。
prettytable, 格式化資訊列印工具,能讓你像 MySQL 那樣列印資料。
3.1 解析引數
Python有很多寫命令列引數解析工具,如 argparse, docopt, click,這裡我們選用的是 docopt 這個簡單易用的工具。docopt 可以按我們在文件字串中定義的格式來解析引數,比如我們在 tickets.py:
注意: 實驗樓中無法輸入中文,引數後的中文可以使用拼音代替。
# coding: utf-8
"""Train tickets query via command-line.
Usage:
tickets [-gdtkz] <from> <to> <date>
Options:
-h,--help 顯示幫助選單
-g 高鐵
-d 動車
-t 特快
-k 快速
-z 直達
Example:
tickets beijing shanghai 2016-08-25
"""
from docopt import docopt
def cli():
"""command-line interface"""
arguments = docopt(__doc__)
print(arguments)
if __name__ == '__main__':
cli()
下面我們執行一下這個程式:
$ python3 tickets.py beijing shanghai 2016-08-25
我們得到下面的結果:
3.2 獲取資料
引數已經解析好了,下面就是如何獲取資料了,這也是最主要的部分。首先我們開啟 12306,進入餘票查詢頁面,如果你使用 Chrome,那麼按 F12 開啟開發者工具,選中 Network 一欄,在查詢框鍾我們輸入 上海 到 北京,日期 2016-08-25, 點選查詢,我們在除錯工具發現,查詢系統實際上請求了這個URL:
https://kyfw.12306.cn/otn/lcxxcx/query?purpose_codes=ADULT&queryDate=2016-07-01&from_station=SHH&to_station=BJP
並且返回的是JSON格式的資料!
接下來問題就簡單了,我們只需要構建請求URL然後解析返回的Json資料就可以了。但是我們發現,URL裡面 from_station 和 to_station 並不是漢字或者拼音,而是一個代號,而我們想要輸入的是漢字或者拼音,我們要如何獲取代號呢?我們開啟網頁原始碼看看有沒有什麼發現。
果然,我們在網頁裡面找到了這個連結:https://kyfw.12306.cn/otn/resources/js/framework/station_name.js?station_version=1.8955 這裡面貌似是包含了所有車站的中文名,拼音,簡寫和代號等資訊。但是這些資訊擠在一起,而我們只想要車站的拼音和大寫字母的代號資訊,怎麼辦呢?
正規表示式就是答案,我們寫個小指令碼來匹配提取出想要的資訊吧, 在parse_station.py中:
# coding: utf-8
import re
import requests
from pprint import pprint
url = 'https://kyfw.12306.cn/otn/resources/js/framework/station_name.js?station_version=1.8955'
text = requests.get(url, verify=False)
stations = re.findall(r'([A-Z]+)\|([a-z]+)', text)
stations = dict(stations)
stations = dict(zip(stations.values(), stations.keys()))
pprint(stations, indent=4)
注意,上面的正規表示式匹配出的結果轉為字典後,字典的鍵是大寫字母大號,這顯然不是我們想要的結果,於是,我們通過一個變換將鍵值反過來。 我們執行這個指令碼,它將以字典的形式返回所有車站和它的大寫字母代號, 我們將結果重定向到 stations.py中,
$ python3 parse_station.py > stations.py
我們為這個字典加名字,stations, 最終,stations.py檔案是這樣的:
現在,使用者輸入車站的中文名,我們就可以直接從這個字典中獲取它的字母程式碼了:
...
from stations import stations
def cli():
arguments = docopt(__doc__)
from_staion = stations.get(arguments['<from>'])
to_station = stations.get(arguments['<to>'])
date = arguments['<date>']
# 構建URL
url = 'https://kyfw.12306.cn/otn/lcxxcx/query?purpose_codes=ADULT&queryDate={}&from_station={}&to_station={}'.format(
date, from_staion, to_station
)
萬事俱備,下面我們來請求這個URL獲取資料吧!這裡我們使用 requests 這個庫, 它提供了非常簡單易用的介面,
...
import requests
def cli():
...
# 新增verify=False引數不驗證證照
r = requests.get(url, verify=False)
print(r.json())
從結果中,我們可以觀察到,與車票有關的資訊需要進一步提取:
def cli():
...
r = requsets.get(url);
rows = r.json()['data']['datas']
3.3 解析資料
我們封裝一個簡單的類來解析資料:
from prettytable import PrettyTable
class TrainCollection(object):
# 顯示車次、出發/到達站、 出發/到達時間、歷時、一等坐、二等坐、軟臥、硬臥、硬座
header = 'train station time duration first second softsleep hardsleep hardsit'.split()
def __init__(self, rows):
self.rows = rows
def _get_duration(self.row):
"""
獲取車次執行時間
"""
duration = row.get('lishi').replace(':', 'h') + 'm'
if duration.startswith('00'):
return duration[4:]
if duration.startswith('0'):
return duration[1:]
return duration
@property
def trains(self):
for row in self.rows:
train = [
# 車次
row['station_train_code'],
# 出發、到達站
'\n'.join([row['from_staion_name'], row['to_station_name']]),
# 出發、到達時間
'\n'.join([row['start_time'], row['arrive']]),
# 歷時
self._get_duration(row),
# 一等坐
row['zy_num'],
# 二等坐
row['ze_num'],
# 軟臥
row['rw_num'],
# 軟坐
row['yw_num'],
# 硬坐
row['yz_num']
]
yield train
def pretty_print(self):
"""
資料已經獲取到了,剩下的就是提取我們要的資訊並將它顯示出來。
`prettytable`這個庫可以讓我們它像MySQL資料庫那樣格式化顯示資料。
"""
pt = PrettyTable()
# 設定每一列的標題
pt._set_field_names(self.header)
for train in self.trains:
pt.add_row(train)
print(pt)
3.4 顯示結果
最後,我們將上述過程進行彙總並將結果輸出到螢幕上:
...
class TrainCollection:
...
...
def cli():
arguments = docopt(__doc__)
from_staion = stations.get(arguments['<from>'])
to_station = stations.get(arguments['<to>'])
date = arguments['<date>']
# 構建URL
url = 'https://kyfw.12306.cn/otn/lcxxcx/query?purpose_codes=ADULT&queryDate={}&from_station={}&to_station={}'.format(
date, from_staion, to_station
)
r = requests.get(url, verify=False)
rows = r.json()['data']['datas']
trains = TrainCollection(rows)
trains.pretty_print()
if __name__ == '__main__':
cli()
3.5 最後一米
至此, 程式的主體已經完成了, 但是上面列印出的結果是黑白的,很是乏味,我們來給它新增顏色吧:
def colored(color, text):
table = {
'red': '\033[91m',
'green': '\033[92m',
# no color
'nc': '\033[0'
}
cv = table.get(color)
nc = table.get('nv')
return ''.join([cv, text, nc])
修改一下程式,將出發車站與出發時間顯示為紅色, 將到達車站與到達時間顯示為綠色:
...
'\n'.join([colored('green', row['from_staion_name'])
colored('red', row['to_station_name'])]),
'\n'.join([colored('green', row['start_time'])
colored('red', row['arrive_time'])]),
...
四、總結
本課程使用 Python3 抓取 12306 網站資訊提供一個命令列的火車票查詢工具。通過該專案的實現,可以學習並實踐 Python3 基礎及網路程式設計,以及 docopt,requests,prettytable 等庫的使用。
感興趣的同學可以實現更多擴充套件功能:
顯示商務坐, 無坐
新增引數支援,使用者可以指定火車型別
支援更多的時間格式,如:20161010
本專案的完整程式碼及demo,可在實驗樓檢視並線上完成,立即【開始實驗】
更多Python經典專案:Python全部 - 課程
相關文章
- Python3.6實現12306火車票自動搶票Python
- Python3實現搶火車票功能(下)Python
- PostgreSQL與12306搶火車票的思考SQL
- 12306候補購票怎麼用?12306火車票候補購票使用攻略和注意事項
- 教你用Python動重新整理搶12306火車票,附原始碼!Python原始碼
- 12306火車票搶票Python程式碼最新完整版釋出,五一搶票就靠它了!Python
- 鐵路12306:2023年五一假期淄博火車票搜尋量環比增長988%
- 用PyQt5編輯 12306車票資訊爬取程式QT
- 車票100–火車票介面開發文件
- 從零實現一款12306搶票軟體
- 光流法應用——自適應檢測視訊火車速度
- Python學習筆記之12306搶票Python筆記
- 車停哪裡忘記了怎麼找到?如何找到自己的停車位置?
- 『現學現忘』Git基礎 — 24、Git中檢視歷史版本記錄Git
- Java+SpringBoot+vue+element實現火車訂票平臺管理系統JavaSpring BootVue
- 11 UML中的邏輯檢視、程序檢視、實現檢視、部署檢視
- 父子元件通訊——模擬12306購票新增乘車人元件
- 火車票調整預售(轉)
- Java語言多執行緒實現一個火車站賣票系統Java執行緒
- 【請抓緊時間上車】實現一個12306的chrom外掛
- 最新12306搶票爬蟲爬蟲
- 12306購票送溫暖
- 做一個自己的WiFi密碼檢視器——AndroidWiFi密碼Android
- 關聯物件(防止自己忘記記錄)物件
- 在 React 應用程式中實現簡單的頁面檢視跟蹤器React
- 火車票預訂的一些問題
- 電腦已連線的wifi密碼忘記了檢視方式WiFi密碼
- Monaco Editor 實現一個日誌檢視器
- 使用 PyQt5 實現圖片檢視器QT
- 用 ABAP 呼叫 OCR 介面實現計程車發票掃描
- 2019春運火車票搶票攻略,候補購票撿漏搶票技巧
- 4.16 實現自己的堆管理器
- 實現【檢視更多】功能的程式碼
- 原生JS實現類似《掘金》網站的圖片檢視器JS網站
- 搶火車票這個事吧,其實我也能做!(python黑科技)Python
- 多執行緒賣火車票簡單例子執行緒單例
- 是程式設計師就用Python查12306的票程式設計師Python
- 自己實現一個滑動視窗
- 車間操作檢視