分析了16年的福利彩票記錄,原來可以用Python這麼買彩票

上海小胖發表於2019-07-09

分析了16年的福利彩票記錄,原來可以用Python這麼買彩票

目錄
0 引言
1 環境
2 需求分析
3 程式碼實現
4 後記

0 引言

上週被一則新聞震驚到了,《2454萬元大獎無人認領!福彩史上第二大棄獎在廣東中山產生 》,在2019年5月2日開獎的雙色球中,廣東中山一位彩民博中2454萬元,兌獎時間截至2019年7月1日。

令人遺憾的是,中獎者最終未現身領獎,2454萬元大獎成為棄獎。經中山市福彩中心查證,這是中國福彩史上金額第二大的棄獎。根據《彩票管理條例實施細則》的有關規定,這次的2454萬元棄獎獎金將被納入彩票公益金。

一直在為福彩做貢獻的我,啥時候能攤上這樣的好事啊。於是我用Python生成了一組雙色球的號碼……

1 環境

作業系統:Windows

Python版本:3.7.3

2 需求分析

隨機生成一組雙色球的號碼,我們可以藉助random函式,如下:

import random

def ball():
    ball_list=[]
    while 1:
        a=random.randint(1,33)
        if a not in ball_list:
            ball_list.append(a)
        if len(ball_list)==6:
            break

    ball_list.sort()
    ball_list.append(random.randint(1,16))
    print(ball_list)


ball()

但要知道,這麼搞的話,絲毫不會有什麼中獎的,因為太隨機了……

經歷過高考的人,肯定都知道三年模擬五年高考。要知道彩票中獎概率很低的,所以我們在這裡先分析下歷年的資料,藉助往年的資料來“精準”地推算下一期中獎號碼。

我們通過這個網站來查詢彩票的歷史開獎資訊。

http://kaijiang.zhcw.com/zhcw/html/ssq/list_1.html

分析了16年的福利彩票記錄,原來可以用Python這麼買彩票

我們點選下一頁,看看網址連結是否有規律

http://kaijiang.zhcw.com/zhcw/html/ssq/list_1.html

http://kaijiang.zhcw.com/zhcw/html/ssq/list_2.html

http://kaijiang.zhcw.com/zhcw/html/ssq/list_3.html

http://kaijiang.zhcw.com/zhcw/html/ssq/list_4.html

http://kaijiang.zhcw.com/zhcw/html/ssq/list_5.html

不難發現,可以將目標網址拆分如下:

url_part = 'http://kaijiang.zhcw.com/zhcw/html/ssq/list'
url = url_part + '_' + str(i) + '.html'

而 i 對應的正好是頁碼資訊,我們藉助

分析了16年的福利彩票記錄,原來可以用Python這麼買彩票

記錄下這裡的元素資訊。

接下來,我們需要抓取每一頁中的具體開獎資訊。我們繼續通過開發者工具分析出每期開獎資訊。

我們依次記錄下每期的開獎日期對應的元素資訊:
分析了16年的福利彩票記錄,原來可以用Python這麼買彩票

開獎的批次對應的元素資訊:
分析了16年的福利彩票記錄,原來可以用Python這麼買彩票

中獎號碼對應的元素資訊:
分析了16年的福利彩票記錄,原來可以用Python這麼買彩票

有了這些元素資訊之後,接下來就是程式碼的具體實現。

3 程式碼實現

在這裡,我們獲取網頁的請求使用 requests 模組;解析網址藉助 beautifulsoup4 模組。因為都是第三方模組,如環境中沒有可以使用 pip 進行安裝。

pip install requests
pip install beautifulsoup4
pip install lxml

模組安裝好之後,進行匯入

import requests
from bs4 import BeautifulSoup

我們需要先在首頁中,拿到頁數資訊

# 發起請求
basic_url = 'http://kaijiang.zhcw.com/zhcw/html/ssq/list_1.html'
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.100 Safari/537.36'
}
response = requests.get(basic_url, headers=headers, timeout=10)
response.encoding = 'utf-8'
htm = response.text

# 解析內容
soup = BeautifulSoup(htm, 'html.parser')

# 獲取頁數資訊
page = int(soup.find('p', attrs={"class": "pg"}).find_all('strong')[0].text)


接下來,我們就可以根據規律組裝好我們的URL:

url_part = 'http://kaijiang.zhcw.com/zhcw/html/ssq/list'

for i in range(1, page+1):
    url = url_part + '_' + str(i) + '.html'

拿組裝後的url發起請求,並獲取每頁中各期的開獎資訊:

res = requests.get(url, headers=headers, timeout=10)
res.encoding = 'utf-8'
context = res.text
soups = BeautifulSoup(context, 'html.parser')

if soups.table is None:
    continue
elif soups.table:
    table_rows = soups.table.find_all('tr')
    for row_num in range(2, len(table_rows)-1):
        row_tds = table_rows[row_num].find_all('td')
        ems = row_tds[2].find_all('em')
        result = row_tds[0].string +', '+ row_tds[1].string +', '+ems[0].string+' '+ems[1].string+' '+ems[2].string+' '+ems[3].string+' '+ems[4].string+' '+ems[5].string+', '+ems[6].string
        print(result)

這樣,我們就完成了對每一頁中各期開獎資料的獲取。獲取的資料可以儲存在本地。

def save_to_file(content):
    with open('ssq.txt', 'a', encoding='utf-8') as f:
        f.write(content + '\n')

我們在獲取每期的開獎資料的同時,記錄下紅藍球出現的號碼資訊。

# 定義兩個變數, 用於記錄歷史開獎資訊中的紅球、藍球號碼資訊
red_num = [] 
blue_num = []

red_num.append(ems[0].string) # 紅色球1
red_num.append(ems[1].string) # 紅色球2
red_num.append(ems[2].string) # 紅色球3
red_num.append(ems[3].string) # 紅色球4
red_num.append(ems[4].string) # 紅色球5
red_num.append(ems[5].string) # 紅色球6
blue_num.append(ems[6].string) # 藍色球

統計出各個號碼出現次數資訊:

red_count = Counter(red_num)
blue_count = Counter(blue_num)

接下來我們可以根據紅藍號碼出現的頻率進行排序,並推測出幾組雙色球號碼資訊:

# 按照出現頻率順序
red_sorted = sorted(red_count.items(), key=lambda x: x[1], reverse=False)
blue_sorted = sorted(blue_count.items(), key=lambda x: x[1], reverse=False)

red = red_sorted[0:6]
blue = blue_sorted[0:3]

red = list(map(lambda x:x[0], red))
blue = list(map(lambda x:x[0], blue))

red.sort()
blue.sort()

print('號碼高頻-1注:'+str(red)+' | '+blue[0])
print('號碼高頻-2注:'+str(red)+' | '+blue[1])
print('號碼高頻-3注:'+str(red)+' | '+blue[2])

當然了,也可以輸出反序輸出,中獎號碼出現頻率較低的幾組,只需要設定 reverse=True 即可。

4 後記

這裡根據藍色球各號碼出現的次數,作了張直方圖,可以很直觀到藍色球各號碼出現的頻率。
分析了16年的福利彩票記錄,原來可以用Python這麼買彩票

有人會問了,這樣預測出的中獎號碼,中獎概率究竟有多大呢?

這個,我可說不清楚,只有買了才會知道……小心錯過一個億喲!

好了,以上就是本篇全部內容。

關注公眾號「Python專欄」,更多有趣好玩的Python等著你~

本文全套程式碼已上傳至Github:https://github.com/MiracleYoung/You-are-Pythonista/tree/master/PythonExercise/Tool/SSQ_Predict/

相關文章