普京宣佈開戰,俄烏戰爭實時新聞採集整理
北京時間2022年2月24號10點50分,俄羅斯總統普京發表講話,宣佈在烏克蘭頓巴斯地區展開一項“特別的軍事行動”,並呼籲烏軍“放下武器”,同時警告烏克蘭政權將對可能發生的流血事件負全部責任,如果烏克蘭局勢受到外界干擾,俄羅斯將立即作出反應。隨後俄羅斯軍隊從多個方向對烏克蘭發起了進攻,重點摧毀和佔領機場、軍事指揮中心、交通要道等目標。
與此同時各種資訊不斷從網路傳來,短時間內難以分辨真實資訊和謠言,這時候爬蟲程式可以實時進行資訊的採集和分析,將焦點資訊進行比對核實,快速形成實時新聞線索,下面demo演示如何同時採集多個網站,可以參考修改後對新聞網站進行採集和整理:
#! -*- encoding:utf-8 -*- import urllib2 import random import httplib class HTTPSConnection(httplib.HTTPSConnection): def set_tunnel(self, host, port=None, headers=None): httplib.HTTPSConnection.set_tunnel(self, host, port, headers) if hasattr(self, 'proxy_tunnel'): self._tunnel_headers['Proxy-Tunnel'] = self.proxy_tunnel class HTTPSHandler(urllib2.HTTPSHandler): def https_open(self, req): return urllib2.HTTPSHandler.do_open(self, HTTPSConnection, req, context=self._context) # 要訪問的目標頁面 targetUrlList = [ " " " ] # 代理伺服器(產品官網 ) proxyHost = "t.16yun.cn" proxyPort = "31111" # 代理驗證資訊 proxyUser = "username" proxyPass = "password" proxyMeta = "http://%(user)s:%(pass)s@%(host)s:%(port)s" % { "host": proxyHost, "port": proxyPort, "user": proxyUser, "pass": proxyPass, } # 設定 http和https訪問都是用HTTP代理 proxies = { "http": proxyMeta, "https": proxyMeta, } # 設定IP切換頭 tunnel = random.randint(1, 10000) headers = {"Proxy-Tunnel": str(tunnel)} HTTPSConnection.proxy_tunnel = tunnel proxy = urllib2.ProxyHandler(proxies) opener = urllib2.build_opener(proxy, HTTPSHandler) urllib2.install_opener(opener) # 訪問三次網站,使用相同的tunnel標誌,均能夠保持相同的外網IP for i in range(3): for url in targetUrlList: r = urllib2.Request(url) print(urllib2.urlopen(r).read())
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69946368/viewspace-2857677/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- Yii 2.0.46 釋出,在俄烏戰爭背景下,時隔半年,終於更新了
- Python爬蟲實戰系列3:今日BBNews程式設計新聞採集Python爬蟲程式設計
- Python爬蟲實戰系列1:部落格園cnblogs熱門新聞採集Python爬蟲
- 匿名者駭入俄羅斯流媒體平臺播放俄烏戰爭畫面
- 俄烏戰爭中的俄羅斯APT網路攻擊部隊行為分析APT
- 俄烏開戰早有跡象,網路暗戰如何掌握先機?
- 烏俄兩國引發的“網路戰爭”最新訊息盤點!
- 俄烏戰爭下的國產資料庫替換思考-墨天輪資料庫
- Flutter 螢幕採集實戰分享Flutter
- Audio Unit採集音訊實戰音訊
- iOS視訊採集實戰(AVCaptureSession)iOSAPTSession
- 對Steam“宣戰”兩年,Epic的“革命戰爭”戰況如何?
- 網易宣佈與Creative Assembly戰略合作 將《全面戰爭》系列遊戲引入中國遊戲
- 普京宣佈明年也要開始探索火星 和馬斯克搶地盤馬斯克
- 《戰爭與征服》8月7日全平臺上線,開啟即時戰略新時代!
- flutter實戰4:新聞列表的懶載入和下拉手勢重新整理Flutter
- 全面戰爭:三國》突然宣佈停止更新,Steam頁面已遭如潮差評
- 有屏智慧音響的新戰爭、新挑戰、新變數變數
- 美的集團的零碳戰爭
- 歷史對話整理:古代戰爭討論
- Audio Queue 採集音訊實戰(支援不同格式)音訊
- 最新《 java實戰開發俄羅斯方塊教程》Java
- Python 實戰開發俄羅斯方塊遊戲Python遊戲
- 大戰場時代開啟!CF手遊官宣七月重磅版本《戰爭風雲:天瞳計劃》
- 華為下場,全屋智慧開啟新戰爭
- flex佈局實戰Flex
- 俄羅斯黑客組織Killnet向10個支援恐俄症的國家宣戰黑客
- 在Unity中為即時戰略遊戲實現戰爭迷霧(上)Unity遊戲
- 在Unity中為即時戰略遊戲實現戰爭迷霧(下)Unity遊戲
- AID:Tech宣佈獲BlockAsset Ventures戰略投資AIBloC
- vs聯合halcon——採集影像(實時採集與單次採集)
- client-go實戰之六:時隔兩年,重新整理版本繼續實戰clientGo
- Flutter Web 實戰 - 俄羅斯方塊FlutterWeb
- 架構之爭,Wave Computing 宣佈MIPS將開源架構
- Flutter完整開發實戰詳解(十六、詳解自定義佈局實戰)Flutter
- 由紛爭到融合,實時數倉演繹“戰國時代”
- 從激進、落幕再到追逐:美俄中的載人登月戰爭
- APENFT基金會宣佈與FoodpunksTron達成戰略合作