爬蟲 - CNN Business

lulin916發表於2018-11-12
  • url:https://money.cnn.com/data/dow30/
  • 抓取道指成份股資料並將30家公司的程式碼、公司名稱和最近一次成交價放到一個列表中輸出。
  • 格式:
    在這裡插入圖片描述在這裡插入圖片描述
  • 程式碼:
# -*- coding: utf-8 -*-
"""
CNN Business
@author: LU
"""

import requests,re

def resultList():
    r = requests.get('https://money.cnn.com/data/dow30/')
    search_pattern = re.compile('class="wsod_symbol">(.*?)<\/a>.*?<span.*?>(.*?)<\/span>.*?\n.*?class="wsod_stream">(.*?)<\/span>')
    result = re.findall(search_pattern, r.text)
    return result

results = resultList()
print(results)
  • 執行結果:
    在這裡插入圖片描述

連結:https://pan.baidu.com/s/1ptN_isb1gsBZpUud3mWDeQ
提取碼:18u6

相關文章