Python爬蟲經常爬不到資料,或許你可以看一下小編的這篇文章
原標題:解決Python爬蟲爬不到資料
前言:
近期,通過做了一些小的專案,覺得對於Python爬蟲有了一定的瞭解,於是,就對於Python爬蟲爬取資料做了一個小小的總結,希望大家喜歡!
1.最簡單的Python爬蟲
最簡單的Python爬蟲莫過於直接使用urllib.request.urlopen(url=某網站)或者requests.get(url=某網站)
例如:爬取漫客棧裡面的漫畫
文章連結:運用Python爬蟲下載漫客棧裡面的漫畫
程式碼和執行結果:
這是最簡單也是最基礎的Python爬蟲.
2.需要新增headers的Python爬蟲
有的網址爬取資料需要新增User-Sgent、Cookie等欄位資訊,這個時候我們需要新增一個請求頭,也就是一個字典,User-Sgent、Cookie等欄位資訊就放這裡面。
如:運用Python爬蟲下載表情包
文章連結:運用Python爬蟲下載表情包
沒加請求頭
加上請求頭:
是不是加與沒加,就有很大的區別.
3.所爬取的資料在NetWork裡面
有個時候,我們所爬取的資料新增請求頭之後,也爬取不到,這個時候,我們就需要想一想NetWork,下面有XHR和JS,也許所需要資料就在這兩個其中的一個裡面。
如:爬取王者榮耀英雄皮膚
爬取王者榮耀英雄皮膚
如果用上面第二種方法,可以發現,就算新增請求頭,也訪問不到資料,我們看一下網頁原始碼,發現,這些資料根本就不在原始碼中,所以這樣肯定爬不到資料。
我們點選電腦鍵盤F12,然後再點選NetWork下面的JS,按F5重新整理,可以發現,這些圖片的下載連結在JS下面的一個json檔案裡。
4.動態載入的資料
動態載入的,像網易雲音樂,雖然我們也可以在NetWork下面找到相應的資料,但是這是一個post請求,比較複雜,我們可以使用selenium模組,這個過程我就不講解了
這裡有關於它的文章連結:運用selenium下載網易雲音樂
5.總結
上面講解的這些,我都有關於它們的文章,讀者可以自行找到並閱讀。
也許我還是一個Python爬蟲小白吧!講解的深度還不夠,希望大家諒解,在以後的日子裡,我會加油學的。如果讀者覺得我的這篇文章對於你有所幫助,希望大家給我點一個小小的贊,謝謝!
相關文章
- python爬蟲總是爬不到資料,你需要解決反爬蟲了Python爬蟲
- 學透著13個爬蟲,這天下將沒有你爬不到的資料!爬蟲
- 什麼是Python爬蟲?一篇文章帶你全面瞭解爬蟲Python爬蟲
- python爬蟲小專案--飛常準航班資訊爬取variflight(上)Python爬蟲
- 你們都在用IntelliJ IDEA嗎?或許你需要看一下這篇文章IntelliJIdea
- python爬蟲抓取資料時失敗_python爬蟲 大佬 請教下 為什麼爬取的資料有時能爬到 有時有爬不到, 程式碼如下:...Python爬蟲
- 【Python學習】爬蟲爬蟲爬蟲爬蟲~Python爬蟲
- 利用python編寫爬蟲爬取淘寶奶粉部分資料.1Python爬蟲
- Python爬蟲可以幹什麼?Python爬蟲有什麼用?Python爬蟲
- Python爬蟲之小說資訊爬取與資料視覺化分析Python爬蟲視覺化
- python網路爬蟲_Python爬蟲:30個小時搞定Python網路爬蟲視訊教程Python爬蟲
- Python爬蟲小結(轉)Python爬蟲
- Python爬蟲可以做什麼?Python爬蟲
- 輕鬆利用Python爬蟲爬取你想要的資料Python爬蟲
- python爬蟲是什麼?爬蟲可以分為哪幾類?Python爬蟲
- python爬蟲---網頁爬蟲,圖片爬蟲,文章爬蟲,Python爬蟲爬取新聞網站新聞Python爬蟲網頁網站
- (python)爬蟲----八個專案帶你進入爬蟲的世界Python爬蟲
- Python爬蟲之資料解析(XPath)Python爬蟲
- Python【爬蟲實戰】提取資料Python爬蟲
- Python 第一個爬蟲,爬取 147 小說Python爬蟲
- python 小爬蟲 DrissionPage+BeautifulSoupPython爬蟲
- 基於nodejs編寫小爬蟲NodeJS爬蟲
- 什麼是Python網路爬蟲?常見的網路爬蟲有哪些?Python爬蟲
- Java爬蟲與Python爬蟲的區別?Java爬蟲Python
- 爬蟲抓取網路資料時經常遇到的六種問題爬蟲
- python就是爬蟲嗎-python就是爬蟲嗎Python爬蟲
- Python爬蟲框架:scrapy爬取高考派大學資料Python爬蟲框架
- Python爬蟲入門【3】:美空網資料爬取Python爬蟲
- Python超簡單超基礎的免費小說爬蟲!爬蟲入門從這開始!Python爬蟲
- 不會Python爬蟲?教你一個通用爬蟲思路輕鬆爬取網頁資料Python爬蟲網頁
- python 爬蟲Python爬蟲
- python爬蟲Python爬蟲
- 用PYTHON爬蟲簡單爬取網路小說Python爬蟲
- 導致Python爬蟲封禁的常見原因Python爬蟲
- python爬蟲常見的那點問題!Python爬蟲
- 【爬蟲】利用Python爬蟲爬取小麥苗itpub部落格的所有文章的連線地址(1)爬蟲Python
- Python爬蟲(1.爬蟲的基本概念)Python爬蟲
- Python爬蟲之路-chrome在爬蟲中的使用Python爬蟲Chrome