[用科學的方法做不科學的事情繫列]—分析五百萬大獎-雙色球之花落誰家?(1)
目的:
瞧瞧雙色球裡的各種資料.
用阿里雲的pai來分析分析雙色球相關的東西.
獲取資料
中獎公告:
http://www.cwl.gov.cn/kjxx/ssq/
環境搭建
安裝 python3
安裝 pip
安裝第三方模組
pip install BeautifulSoup
pip install requests
算了,不廢話,直接上程式碼吧.
import requests
from bs4 import BeautifulSoup
import json
import time
def url_find(url):
r = requests.get(url)
r.encoding=`utf-8`
soup = BeautifulSoup(r.text, `html.parser`)
x = soup.find_all(`a`)
xx = []
for i in x:
#print(i)
if str(i).find("期開獎公告")>0:
m = "http://www.cwl.gov.cn"+i.get(`href`)
#print(m)
xx.append(m)
return xx
def cat_text(url):
m={}
r = requests.get(url)
r.encoding=`utf-8`
soup = BeautifulSoup(r.text, `html.parser`)
y=[]
for x in soup.find_all(`td`):
y.append(x.get_text())
x_id=str(soup.h2.get_text())[10:17]
for i in soup.find_all("script"):
if str(i).find("var khHq") > 0:
qiu_h=json.loads(str(i)[24:55])
for i in soup.find_all("span"):
if i.get("class") == ["qiuL"]:
qiu_l=i.get_text()
for i in soup.find_all("div"):
if i.get("class") == ["zjqkzy"]:
address=i.find("dd").get_text()
if y[3]==`- 元`:
mm = x_id + "," + y[0] + "," + y[1].rstrip(" 元").replace(",","") + ","+ y[2].rstrip(" 元").replace(",","") + ","+ y[9] +","+ y[10].split("(")[0] + ","+ y[12] +",TEst"+ y[13].split("(含")[0]+ ","+ y[15].split("(")[0] +","+ y[16] + ","+ y[18] +","+ y[19] + ","+ y[21] +","+ y[22] + ","+ y[24] +","+ y[25] +","+str(qiu_h).replace("[","").replace("]","").replace(" ","").replace("`","")+","+qiu_l+","+address.replace(",","--").replace("。","").replace("共","").replace("注","")
elif y[11]==`其中:一等獎複式投注`:
mm = x_id + "," + y[0] + "," + y[1].rstrip(" 元").replace(",","") + ","+ y[2].rstrip(" 元").replace(",","") + ","+ y[9] +","+ y[10].split("(")[0] + ","+ y[12] +","+ y[13].split("(含")[0]+ ","+ y[15].split("(")[0] +","+ y[16] + ","+ y[18] +","+ y[19] + ","+ y[21] +","+ y[22] + ","+ y[24] +","+ y[25] +","+str(qiu_h).replace("[","").replace("]","").replace(" ","").replace("`","")+","+qiu_l+","+address.replace(",","--").replace("。","").replace("共","").replace("注","")
else:
mm = x_id + "," + y[0] + "," + y[1].rstrip(" 元").replace(",","") + ","+ y[2].rstrip(" 元").replace(",","") + ","+ y[7] +","+ y[8].split("(")[0] + ",,,"+ y[10] +","+ y[11].split("(含")[0]+ ","+ y[13].split("(")[0] +","+ y[14] + ","+ y[16] +","+ y[17] + ","+ y[19] +","+ y[20] + ","+ y[22] +","+ y[23] +","+str(qiu_h).replace("[","").replace("]","").replace(" ","").replace("`","")+","+qiu_l+","+address.replace(",","--").replace("。","").replace("共","").replace("注","")
return mm
url = `http://www.cwl.gov.cn/kjxx/ssq/kjgg/list.shtml`
url_list = []
url_list = url_list + url_find(url)
for i in range(29):
url = `http://www.cwl.gov.cn/kjxx/ssq/kjgg/list_` + str(i+2) + `.shtml`
url_list = url_list+url_find(url)
#print(url_list)
def save_file(somea):
with open(`./data`, `a`) as f:
f.write(somea )
for i in url_list:
data=str(cat_text(i))+"
"
save_file(data)
相關文章
- 資料科學家的命令列技巧資料科學命令列
- 這七家BAT公司,誰家資料科學家更多BAT資料科學
- 49位科學家上榜,清華方璐、復旦周鵬等獲得科學探索獎
- 依圖科技科創板IPO告敗 “AI第一股”花落誰家?AI
- 【資料科學家】如何成為一名資料科學家?資料科學
- 電腦科學家釋出不會被黑的加密程式碼加密
- 公民資料科學家的侷限性資料科學
- 利用Python做絕地科學家(外掛篇)Python
- 科學研究與大資料概念的濫用大資料
- 圖靈獎獲得者:資料科學家或將取代業務分析師?圖靈資料科學
- APENFT & TRON GameFi黑客鬆大賽成功落幕 50萬美元大獎花落誰家GAM黑客
- 當今世界最NB的25位大資料科學家大資料資料科學
- 資料科學家需要的基礎技能資料科學
- 資料科學家的15項原則資料科學
- 《科學·免疫學》:科學家首次證實,神經系統也是過敏性休克的幕後推手!
- 【資料科學家】跨入商業分析、資料科學、挖掘領域必須哪些基本數學知識資料科學
- 京東榮獲“中國智慧科學技術最高獎”——吳文俊人工智慧科學技術獎人工智慧
- 美國國家科學學院:地球上的生物分佈
- 莊小威、陳志堅等9位科學家分享2100萬美元獎金:2019年科學突破獎公佈
- 中國科學家獲大獎 成下一代網際網路“先鋒”
- 提高學習改進記憶的科學方法
- 讓科學重回資料科學資料科學
- 資料分析師、資料科學家、大資料專家三個職位的區別資料科學大資料
- 2018北京市科學技術獎勵大會隆重舉行,華勝天成榮獲科學技術獎
- 資料科學家必知的五大深度學習框架!(附插圖)資料科學深度學習框架
- 科學匠人 | 艾美工程獎背後的微軟人微軟
- 美國國家科學委員會:2020年科學與工程指標指標
- 在小公司如何做一名成功的資料科學家?資料科學
- Web開發與資料科學家:誰在統治Python世界?Web資料科學Python
- 人的資料科學與機器資料科學資料科學
- 用科學知識圖譜預測學科前沿趨勢
- 資料科學家或將取代業務分析師? - Michael資料科學
- 【人物誌】美團首席科學家夏華夏:不斷突破邊界的程式人生
- 2020 TapTap年度遊戲大賞花落誰家APT遊戲
- 大資料與生命科學大資料
- 業界 | 資料科學家“恐怖故事”資料科學
- 科學家最新發現:新磁性元素
- 資料科學家面試如何準備?資料科學面試