用Python預測雙色球福利彩票中獎號碼（請不要當真）

松鼠愛出餅乾發表於2021-08-05

原文網址 : https://www.cnblogs.com/qshhl/p/15105140.html

Python

前言

雙色球是中國福利彩票的一種玩法。

紅球一共6組，每組從1-33中抽取一個，六個互相不重複。然後藍球是從1-16中抽取一個數字，這整個組成的雙色球

python從零基礎入門到實戰

今天，我們就用Python來統計一下各號碼的中獎概率，並視覺化展示。我本人，也會買概率最大的幾個號碼試試，中獎的話，我就刪號，並開始樸實無華有錢人的生活！！！

先是資料的來源，採集雙色球往期中獎資料

傳送求情

import requests # 資料請求

# 傳送請求的url地址
url = 'http://www.cwl.gov.cn/cwl_admin/kjxx/findDrawNotice'

params = {
    'name': 'ssq',
    'issueCount': '',
    'issueStart': '',
    'issueEnd': '',
    'dayStart': '2017-10-24',
    'dayEnd': '2021-08-04',
    'pageNo': page,
}
headers = {
    'Referer': 'http://www.cwl.gov.cn/kjxx/ssq/kjgg/',
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.131 Safari/537.36'
}
response = requests.get(url=url, params=params, headers=headers)
# <> 物件 200 請求成功  狀態碼

解析資料，for遍歷

for index in result:
    dit = {
        '期號': index['code'],
        '開獎日期': index['date'],
        '紅球': index['red'],
        '藍球': index['blue'],
        '一等獎中獎注數': index['prizegrades'][0]['typenum'],
        '一等獎中獎金額': index['prizegrades'][0]['typemoney'],
        '二等獎中獎注數': index['prizegrades'][1]['typenum'],
        '二等獎中獎金額': index['prizegrades'][1]['typemoney'],
        '三等獎中獎注數': index['prizegrades'][2]['typenum'],
        '三等獎中獎金額': index['prizegrades'][2]['typemoney'],
        '四等獎中獎注數': index['prizegrades'][3]['typenum'],
        '四等獎中獎金額': index['prizegrades'][3]['typemoney'],
        '五等獎中獎注數': index['prizegrades'][4]['typenum'],
        '五等獎中獎金額': index['prizegrades'][4]['typemoney'],
        '六等獎中獎注數': index['prizegrades'][5]['typenum'],
        '六等獎中獎金額': index['prizegrades'][5]['typemoney'],
        '一等獎中獎地區': index['content'],
        '獎池金額': index['poolmoney']
    }

儲存資料

import csv # 內建模組

f = open('雙色球.csv', mode='a', encoding='utf-8', newline='')
csv_writer = csv.DictWriter(f, fieldnames=['期號',
                                '開獎日期',
                                '紅球',
                                '藍球',
                                '一等獎中獎注數',
                                '一等獎中獎金額',
                                '二等獎中獎注數',
                                '二等獎中獎金額',
                                '三等獎中獎注數',
                                '三等獎中獎金額',
                                '四等獎中獎注數',
                                '四等獎中獎金額',
                                '五等獎中獎注數',
                                '五等獎中獎金額',
                                '六等獎中獎注數',
                                '六等獎中獎金額',
                                '一等獎中獎地區',
                                '獎池金額'])

csv_writer.writeheader() # 寫入表頭
csv_writer.writerow(dit)
print(dit)

執行程式碼，這樣就得到了往期雙色球的資料了

現在開始，我們來分析這些資料

先匯入需要用到的模組

import pandas as pd
from pyecharts.charts import *
from sklearn.linear_model import LogisticRegression

讀取採集到的表格資料

data = pd.read_csv('雙色球.csv',encoding='utf-8', engine='python')
data.head()

取資料，指定訓練集和測試集

def get_lotto_data(data, lotto, lotto_id):
    data['lotto_id'] = lotto_id
    X = []
    Y = []
    # 標籤and值
    for s, p in zip(data['lotto_id'], data[lotto]):
        X.append([float(s)])
        Y.append(float(p))
    return X, Y

建立線性迴歸模型

def linear_model_test(X, Y, predict_value):
    regr = LogisticRegression()
    regr.fit(X, Y)
    predict_outcome = regr.predict(predict_value)
    predictions = {}
    predictions['intercept'] = regr.intercept_
    predictions['coefficient'] = regr.coef_
    predictions['predicted_value'] = predict_outcome
    return predictions

使用線性迴歸推測中獎號碼

def get_predicted_num(file, lotto, lotto_id):
    X, Y = get_lotto_data(file, lotto, lotto_id)
    predict_value = [[33]]
    result = linear_model_test(X, Y, predict_value)
    if lotto_id < 7:
        print(f'中獎第{lotto_id}個紅球為：', result['predicted_value'].astype('int64'), '號球')
    else:
        print('中獎藍球為：', result['predicted_value'].astype('int64'), '號球')

預測結果

get_predicted_num(data, 'r1', 1)  # 預測紅1
get_predicted_num(data, 'r2', 2)  # 預測紅2
get_predicted_num(data, 'r3', 3)  # 預測紅3
get_predicted_num(data, 'r4', 4)  # 預測紅4
get_predicted_num(data, 'r5', 5)  # 預測紅5
get_predicted_num(data, 'r6', 6)  # 預測紅6
get_predicted_num(data, '藍球', 7)  # 預測藍7

視覺化展示

紅球中獎概率分佈圖

x = red_ball_count.index.tolist()
y = red_ball_count.values.tolist()
# 視覺化展示 
pie = (
    Pie()
    .add(""
        ,[list(z) for z in zip(x, y)]
        )
)
pie.render_notebook()

藍球中獎概率分佈圖

x = blue_ball_count.index.tolist()
y = blue_ball_count.values.tolist()
pie = (
    Pie()
    .add(""
        ,[list(z) for z in zip(x, y)]
        )
)
pie.render_notebook()

藍球中獎次數分佈

from pyecharts import options as opts
from pyecharts.charts import PictorialBar
from pyecharts.globals import SymbolType

c = (
    PictorialBar()
    .add_xaxis(x)
    .add_yaxis(
        "",
        y,
        label_opts=opts.LabelOpts(is_show=False),
        symbol_size=18,
        symbol_repeat="fixed",
        symbol_offset=[0, 0],
        is_symbol_clip=True,
    )
    .reversal_axis()
    .set_global_opts(
        title_opts=opts.TitleOpts(title='藍球中獎號碼'),
        xaxis_opts=opts.AxisOpts(is_show=False),
        yaxis_opts=opts.AxisOpts(
            axistick_opts=opts.AxisTickOpts(is_show=False),
            axisline_opts=opts.AxisLineOpts(
                linestyle_opts=opts.LineStyleOpts(opacity=0)
            ),
        ),
    )
)
c.render_notebook()

中獎注數漏斗圖

x_data = df['中獎注數'].index.tolist()
y_data = df['中獎注數'].values.tolist()

c = (
    Funnel()
    .add(
        "中獎注數漏斗圖",
        [list(z) for z in zip(x_data, y_data)],
        label_opts=opts.LabelOpts(position="inside"),
    )
    .set_global_opts(title_opts=opts.TitleOpts(title="中獎注數漏斗圖"))
)
c.render_notebook()

很真實，基數太大，一、二等獎的中獎數都看不見了

python -- 雙色球
2019-04-09
Python
用JavaScript中lodash編寫雙色球
2018-06-23
JavaScript
Python爬取雙色球，媽媽再也不會擔心我不會中獎了
2019-03-18
Python
Python中雙冒號的作用
2020-11-07
Python
[用科學的方法做不科學的事情繫列]—分析五百萬大獎-雙色球之花落誰家?(1)
2018-10-17
python中怎麼輸出雙引號
2020-09-23
Python
請不要以python思維對待django ORM
2019-02-05
PythonDjangoORM
手把手教你用Python庫Keras做預測（附程式碼）
2018-06-01
PythonKeras
物聯網中的預測分析：當IoTDA遇上ModelArts
2024-04-09
Python！請不要再亂搞 Linux 發行版了
2022-06-22
PythonLinux
Python3中預設編碼是什麼？怎麼用？
2021-09-11
Python
【轉】cmd中%號和雙引號轉義
2020-11-11
Python 使用” 先知” 預測公眾號未來的粉絲量
2020-05-16
Python
爬蟲雙色球所有的歷史資料並儲存到SQLite
2020-10-28
爬蟲SQLite
請不要在“微服務”的狂熱中迷失自我！
2018-06-25
微服務
變數用雙引號包起來
2018-03-20
變數
獎勵翻倍！平安產險雙11眾測活動火熱進行中！
2021-10-20
shell中定義變數用雙引號和單引號以及不用引號的區別
2018-05-21
變數
linux bash中的引號：單雙引號、反撇號
2020-11-07
Linux
Python中get、post請求詳解(HTTP請求頭、狀態碼)
2020-03-09
PythonHTTP
python 中 *符號
2020-12-12
Python符號
分析了16年的福利彩票記錄，原來可以用Python這麼買彩票
2019-07-09
Python
創意設計師，請不要相信考證無用論!
2023-04-10
CSS 單雙引號應用規範
2019-01-12
CSS
JSON 屬性必須用雙引號
2018-09-10
JSON
用python做時間序列預測一：初識概念
2020-06-02
Python
Oracle中單引號和雙引號的區別
2020-12-28
Oracle
不要頻繁更換手機號碼了！手機號用的時間越長好處越多你造嗎?
2019-02-10
web頁面中接入空號檢測API教程，實現視覺化號碼檢測
2024-03-06
WebAPI視覺化
天下英雄，盡出我輩！真·三國無雙霸“無雙終測”定檔4月中旬
2021-04-01
手機、電話號碼、郵箱、域名、身份證號的測試用例
2018-04-04
介面測試時遇到 java 程式碼加密請求資料，用 python 的我該怎麼辦？
2019-08-02
Java加密Python
python三引號巢狀雙引號執行結果不對
2020-10-14
Python巢狀
遊戲人請不要焦慮
2021-04-06
遊戲
yai 請求預處理指令碼
2020-08-08
AI指令碼
CSV中欄位的去掉雙引號
2023-01-03
影片編碼中幀內預測的發展
2024-06-16
用python做時間序列預測九：ARIMA模型簡介
2020-06-16
Python模型

用Python預測雙色球福利彩票中獎號碼（請不要當真）

前言

python從零基礎入門到實戰

今天，我們就用Python來統計一下各號碼的中獎概率，並視覺化展示。我本人，也會買概率最大的幾個號碼試試，中獎的話，我就刪號，並開始樸實無華有錢人的生活！！！

先是資料的來源，採集雙色球往期中獎資料

傳送求情

解析資料，for遍歷

儲存資料

現在開始，我們來分析這些資料

先匯入需要用到的模組

讀取採集到的表格資料

取資料，指定訓練集和測試集

建立線性迴歸模型

使用線性迴歸推測中獎號碼

預測結果

視覺化展示

紅球中獎概率分佈圖

藍球中獎概率分佈圖

藍球中獎次數分佈

中獎注數漏斗圖

很真實，基數太大，一、二等獎的中獎數都看不見了

相關文章