[用科學的方法做不科學的事情繫列]—分析五百萬大獎-雙色球之花落誰家?(1)

不做發表於2018-10-17

原文網址 : https://flycode.co/archives/165038

目的:
瞧瞧雙色球裡的各種資料.
用阿里雲的pai來分析分析雙色球相關的東西.

獲取資料

環境搭建

安裝 python3
安裝 pip
安裝第三方模組

pip install BeautifulSoup
pip install requests

算了,不廢話,直接上程式碼吧.

import requests
from bs4 import BeautifulSoup
import json
import time
def url_find(url):
    r = requests.get(url)
    r.encoding=`utf-8`
    soup = BeautifulSoup(r.text, `html.parser`)
    x = soup.find_all(`a`)
    xx = []
    for i in x:
        #print(i)
        if str(i).find("期開獎公告")>0:
            m = "http://www.cwl.gov.cn"+i.get(`href`)
            #print(m)
            xx.append(m)
    return xx
def cat_text(url):
    m={}
    r = requests.get(url)
    r.encoding=`utf-8`
    soup = BeautifulSoup(r.text, `html.parser`)
    y=[]
    for x in soup.find_all(`td`):
        y.append(x.get_text())
    x_id=str(soup.h2.get_text())[10:17]
    for i in soup.find_all("script"):
        if str(i).find("var khHq") > 0:
            qiu_h=json.loads(str(i)[24:55])
    for i in soup.find_all("span"):
        
        if i.get("class") == ["qiuL"]:
            qiu_l=i.get_text()
    for i in soup.find_all("div"):
        if i.get("class") == ["zjqkzy"]:
            address=i.find("dd").get_text()
    if y[3]==`- 元`:
        mm = x_id + "," + y[0] + "," + y[1].rstrip(" 元").replace(",","") + ","+ y[2].rstrip(" 元").replace(",","") + ","+ y[9] +","+  y[10].split("（")[0] + ","+ y[12] +",TEst"+  y[13].split("(含")[0]+ ","+ y[15].split("（")[0] +","+  y[16] + ","+ y[18] +","+  y[19] + ","+ y[21] +","+  y[22] + ","+ y[24] +","+  y[25] +","+str(qiu_h).replace("[","").replace("]","").replace(" ","").replace("`","")+","+qiu_l+","+address.replace(",","--").replace("。","").replace("共","").replace("注","")
    elif y[11]==`其中:一等獎複式投注`:
        mm = x_id + "," + y[0] + "," + y[1].rstrip(" 元").replace(",","") + ","+ y[2].rstrip(" 元").replace(",","") + ","+ y[9] +","+  y[10].split("（")[0] + ","+ y[12] +","+  y[13].split("(含")[0]+ ","+ y[15].split("（")[0] +","+  y[16] + ","+ y[18] +","+  y[19] + ","+ y[21] +","+  y[22] + ","+ y[24] +","+  y[25] +","+str(qiu_h).replace("[","").replace("]","").replace(" ","").replace("`","")+","+qiu_l+","+address.replace(",","--").replace("。","").replace("共","").replace("注","")
    else:
        mm = x_id + "," + y[0] + "," + y[1].rstrip(" 元").replace(",","") + ","+ y[2].rstrip(" 元").replace(",","") + ","+ y[7] +","+  y[8].split("（")[0] + ",,,"+ y[10] +","+  y[11].split("(含")[0]+ ","+ y[13].split("（")[0] +","+  y[14] + ","+ y[16] +","+  y[17] + ","+ y[19] +","+  y[20] + ","+ y[22] +","+  y[23] +","+str(qiu_h).replace("[","").replace("]","").replace(" ","").replace("`","")+","+qiu_l+","+address.replace(",","--").replace("。","").replace("共","").replace("注","")
    return mm
url = `http://www.cwl.gov.cn/kjxx/ssq/kjgg/list.shtml`

url_list = []
url_list = url_list + url_find(url)
for i in range(29):
    url = `http://www.cwl.gov.cn/kjxx/ssq/kjgg/list_` + str(i+2) + `.shtml`
    url_list = url_list+url_find(url)
#print(url_list)
def save_file(somea):
    with open(`./data`, `a`) as f:
        f.write(somea )
for i in url_list:
    data=str(cat_text(i))+"
" 
    save_file(data)

資料科學家的命令列技巧
2018-12-13
資料科學命令列
女科學家流失之殤
2021-09-07
這七家BAT公司，誰家資料科學家更多
2019-07-12
BAT資料科學
依圖科技科創板IPO告敗 “AI第一股”花落誰家？
2021-07-09
AI
2025秋季入學，港科廣資料科學與分析全獎博士招生來了
2024-12-24
資料科學
49位科學家上榜，清華方璐、復旦周鵬等獲得科學探索獎
2024-08-26
利用Python做絕地科學家（外掛篇）
2019-02-28
Python
電腦科學的學科分類
2021-11-19
莊小威、陳志堅等9位科學家分享2100萬美元獎金：2019年科學突破獎公佈
2018-10-27
電腦科學家釋出不會被黑的加密程式碼
2019-04-09
加密
【資料科學家】如何成為一名資料科學家？
2018-05-05
資料科學
公民資料科學家的侷限性
2022-10-10
資料科學
圖靈獎獲得者：資料科學家或將取代業務分析師?
2022-02-12
圖靈資料科學
資料科學家需要的基礎技能
2019-07-22
資料科學
Web開發與資料科學家：誰在統治Python世界？
2018-03-30
Web資料科學Python
《科學·免疫學》：科學家首次證實，神經系統也是過敏性休克的幕後推手！
2023-03-28
在小公司如何做一名成功的資料科學家？
2019-02-15
資料科學
科學使用Python之conda
2024-08-26
Python
美國國家科學學院：地球上的生物分佈
2024-04-11
美國國家科學委員會：2020年科學與工程指標
2023-04-05
指標
資料科學家或將取代業務分析師? - Michael
2022-02-12
資料科學
科學的專案管理方法有哪些？
2021-01-15
專案管理
京東榮獲“中國智慧科學技術最高獎”——吳文俊人工智慧科學技術獎
2022-07-18
人工智慧
從玄學走向科學：AB測試驅動的科學增長
2023-02-09
用Python做資料科學時容易忘記的八個要點！
2018-07-23
Python資料科學
美國國家科學基金會：2018年科學與工程指標報告
2018-04-28
指標
資料科學家已死？AutoML使得資料科學更加普及化 - enterpriseai
2021-02-27
資料科學TOMLAI
首席科學家說：NLP的風口在哪裡？場景化應用！
2019-01-17
2018北京市科學技術獎勵大會隆重舉行，華勝天成榮獲科學技術獎
2018-03-02
機器學習工程師與資料科學家的大斗法
2020-07-20
機器學習工程師資料科學
香港查男女怎麼做，是否科學
2021-01-22
python應用資料科學的優勢
2021-09-11
Python資料科學
Python 資料科學之 Pandas
2020-03-16
Python資料科學
走進AI科學之美
2019-09-17
AI
【Python資料科學】之Numpy
2019-04-29
Python資料科學
科學家：在你做決定之前，人工智慧就先給你做決定
2019-07-22
人工智慧
Python科學計算之Numpy陣列生成與運算
2020-09-26
Python陣列
資料科學50年，資料科學家是否依然是21世紀最性感的職業？
2020-05-29
資料科學

[用科學的方法做不科學的事情繫列]—分析五百萬大獎-雙色球之花落誰家?(1)

獲取資料

環境搭建

相關文章