Python實戰-貴州茅臺和華能信託股權穿透研究(附完整程式碼)
#!/usr/bin/env python
# coding: utf-8
# In[1]:
from selenium import webdriver
import re
import time
import pandas as pd
# In[2]:
company_name = ' 華能信託 '
browser = webdriver.Chrome()
url = ' + company_name
browser.get(url)
data = browser.page_source
print(data)
# In[3]:
p_href = '<h3 data-v-4dc1d36e=""><a data-v-4dc1d36e="" target="_blank" href="(.*?)"'
href = re.findall(p_href, data)
url2 = ' + href[0]
browser.get(url2)
data = browser.page_source
# In[5]:
table = pd.read_html(data)
df = table[1]
df
# In[7]:
company = df[' 發起人 / 股東 '][1]
company
# In[12]:
company_split = company.split(' ')
company_split
# In[14]:
company = df[' 發起人 / 股東 '][0]
company_split = company.split(' ')
for i in company_split:
if ' 有限公司 ' in i:
print(i)
# In[13]:
company = df[' 發起人 / 股東 '][0]
company_split = company.split(' ')
for i in company_split:
if len(i) > 6:
print(i)
# In[15]:
def baidu(company_name):
browser = webdriver.Chrome()
url = ' + company_name
browser.get(url)
time.sleep(2) # 休息 2 秒,防止頁面沒載入完
data = browser.page_source
p_href = '<h3 data-v-4dc1d36e=""><a data-v-4dc1d36e="" target="_blank" href="(.*?)"'
href = re.findall(p_href, data)
url2 = ' + href[0]
browser.get(url2)
time.sleep(2) # 休息 2 秒,防止頁面沒載入完
data = browser.page_source
table = pd.read_html(data)
df = table[1]
browser.quit() # 退出模擬瀏覽器
company = 外匯跟單gendan5.comdf[' 發起人 / 股東 '][0]
company_split = company.split(' ')
for i in company_split:
if len(i) > 6: # 不要用 if ' 有限公司 ' in i ,這個不太好,例如國資委不含有“有限公司 ”字樣
return i
# In[16]:
baidu(' 中國華能集團有限公司 ')
# In[17]:
company_1 = baidu(' 華能信託 ')
company_2 = baidu(company_1)
company_3 = baidu(company_2)
# In[18]:
company_1, company_2, company_3
# In[ ]:
# In[ ]:
# In[19]:
company = ' 貴州茅臺 '
while True:
try:
company = baidu(company)
print(company)
except:
break
company
# In[ ]:
# In[ ]:
# In[38]:
num_sum = 0.0
num = 0
for i in df[' 持股比例 ']:
if i == '-':
num = 1
break
i = float(i[0:-1]) # 清除百分號,並轉為浮點數
print(i)
num_sum = i + num_sum
num += 1
if num_sum > 80:
break
print(num)
# In[17]:
for i in range(num):
company_i = df[' 發起人 / 股東 '][i]
company_split = company_i.split(' ')
for j in company_split:
if ' 有限公司 ' in j:
print(j)
# In[ ]:
# In[ ]:
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69946337/viewspace-2926985/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 【FIW2022精彩回顧】華能貴誠信託:核心業務系統 Kubernetes 落地實踐
- 億歐網:全球快消品市值TOP100 貴州茅臺進入前五
- 北京國際信託&畢馬威:2020年中國信託行業發展趨勢和戰略轉型研究報告(附下載)行業
- 託管程式碼和非託管程式碼
- 看完讓你徹底理解 WebSocket 原理,附完整的實戰程式碼(包含前端和後端)Web前端後端
- 璞華易投:股權投資募、投、管、退全流程管理平臺
- python3+tkinter實現的黑白棋,程式碼完整 100%能執行Python
- 《TensorFlow 機器學習方案手冊》(附 pdf 和完整程式碼)機器學習
- 京東股權眾籌平臺的玩法和價值
- Canvas實現放大鏡效果完整案例分析(附程式碼)Canvas
- Java和Python:程式碼作戰JavaPython
- git提交程式碼託管平臺流程Git
- .NET / Rotor原始碼研究3 – 除錯Rotor託管程式碼的利器:WinDbg和SOS原始碼除錯
- Code:美團程式碼託管平臺的演進與實踐
- 最新Python開發專案實戰(完整)Python
- 英國國家掃盲信託基金會:研究顯示玩遊戲能提高年輕人讀寫能力遊戲
- 最新Python教程全套合集專案實戰(完整)Python
- JPG學習筆記1(附完整程式碼)筆記
- JPG學習筆記2(附完整程式碼)筆記
- JPG學習筆記3(附完整程式碼)筆記
- 華雲資料"信創+"生態釋出 :賦能信創生態,成就信創夥伴
- UDP內網穿透和打洞原理的C語言程式碼實現UDP內網穿透C語言
- 通達信牛股啟動訊號,牛股啟動原始碼原始碼
- 北方信託、普華永道合作推出“即時”區塊鏈審計工具區塊鏈
- 如何從零開始用PyTorch實現Chatbot?(附完整程式碼)PyTorch
- 馬蜂窩&介面:貴州、內蒙古成國內避暑遊新貴
- 7個Python實戰專案(附原始碼),拿走就用Python原始碼
- 通達信穿透力指標公式原始碼穿透指標公式原始碼
- 外貿信託出錢,維信金科兜底,揭秘信託助貸模式模式
- WebRTC 音訊演算法 附完整C程式碼Web音訊演算法C程式
- 華勝天成收購中天安泰10%股權出手網路資訊保安
- [python爬蟲] BeautifulSoup爬取+CSV儲存貴州農產品資料Python爬蟲
- 吐血總結!10個Python實戰專案(附原始碼)Python原始碼
- Python 萬能程式碼模版:爬蟲程式碼篇Python爬蟲
- 通達信牛股平臺突破,副圖指標公式指標公式
- xB站參與中國電信A股IPO戰略配售 與中國電信達成戰略合作協議協議
- 機器學習實戰-邊學邊讀python程式碼(5)機器學習Python
- 機器學習實戰-邊學邊讀python程式碼(4)機器學習Python