python獲取歷屆金雞獎資料

mmz_77 發表於 2021-11-29
Python

29日,第34屆中國金雞百花電影節官宣將於2021年12月28日-30日在福建廈門舉辦,並公佈主視覺海報和提名名單。《中國醫生》《守島人》《我和我的家鄉》《我的姐姐》《革命者》《懸崖之上》入圍最佳故事片,這裡面有沒有大家看過的呢?好奇的我對歷屆的獲獎資料很感興趣,所以今天準備爬取一些金雞獎的歷屆獲獎資料。

使用python 獲取時間,獲獎作品,獲取者和相關的一些評論。簡單的爬蟲程式碼如下,程式碼主要也跟跟大家分享了關於代理的使用方式,對一些新手小白來說還是很有學習價值的。

#! -*- encoding:utf-8 -*-
    import requests
    import random
    # 要訪問的目標頁面
    targetUrl = "
    # 要訪問的目標HTTPS頁面
    # targetUrl = "
    # 代理伺服器(產品官網 )
    proxyHost = "t.16yun.cn"
    proxyPort = "31111"
    # 代理驗證資訊
    proxyUser = "username"
    proxyPass = "password"
    proxyMeta = "http://%(user)s:%(pass)[email protected]%(host)s:%(port)s" % {
        "host" : proxyHost,
        "port" : proxyPort,
        "user" : proxyUser,
        "pass" : proxyPass,
    }
    # 設定 http和https訪問都是用HTTP代理
    proxies = {
        "http"  : proxyMeta,
        "https" : proxyMeta,
    }
    #  設定IP切換頭
    tunnel = random.randint(1,10000)
    headers = {"Proxy-Tunnel": str(tunnel)}
    resp = requests.get(targetUrl, proxies=proxies, headers=headers)
    print resp.status_code
    print resp.text

從獲取的資料看, 截止至2020年11月,金雞獎一共舉行過32屆,所以獲取到的資料還是挺多的,我覺得有很多的影片是很值得看的,下次我整理出完整的資料表分享給大家,有需要的可以關注交流下。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31522063/viewspace-2844670/,如需轉載,請註明出處,否則將追究法律責任。