這些美食你吃過嗎！使用Python網路爬蟲獲取菜譜圖文資訊一起學習

湘九發表於2020-09-26

原文網址 : https://blog.csdn.net/y4544159/article/details/108817987

Python爬蟲

/1 前言/

在放假時，經常想嘗試一下自己做飯，下廚房這個網址是個不錯的選擇。

下廚房是必選的網址之一，主要提供各種美食做法以及烹飪技巧。包含種類很多。

今天教大家去爬取下廚房的菜譜，儲存在world文件，方便日後製作自己的小菜譜。

/2 專案目標/

獲取菜譜，並批量把菜名、原料、下載鏈接、下載儲存在world文件。

/ 3 專案準備/

軟體： PyCharm

需要的庫： requests 、 lxml 、 fake_useragent、 time

網站如下：

點選下一頁時，每增加一頁page自增加1，用{}代替變換的變數，再用for迴圈遍歷這網址，實現多個網址請求。

/4 反爬措施的處理/

主要有兩個點需要注意：

1、直接使用requests庫，在不設定任何header的情況下，網站直接不返回資料

2、同一個ip連續訪問多次，直接封掉ip，起初我的ip就是這樣被封掉的。

為了解決這兩個問題，最後經過研究，使用以下方法，可以有效解決。

1）獲取正常的 http請求頭，並在requests請求時設定這些常規的http請求頭。

2）使用 fake_useragent ，產生隨機的UserAgent進行訪問。

/5 專案實現/

1、定義一個class類繼承object，定義init方法繼承self，主函式main繼承self。匯入需要的庫和網址，程式碼如下所示。

2、隨機產生UserAgent。

3、傳送請求獲取響應, 頁面回撥，方便下次請求。

4、xpath解析一級頁面資料,獲取二級頁面網址。

5、for遍歷，定義一個變數food_info儲存，獲取到二級頁面對應的菜名、原料、下載鏈接。

6、儲存在world文件。

7、呼叫方法，實現功能。

8、專案優化

1）方法一：設定時間延時。

2）方法二：定義一個變數u,for遍歷，表示爬取的是第幾種食物。（更清晰可觀）。

/6 效果展示/

1、點選綠色小三角執行輸入起始頁，終止頁。

2、執行程式後，結果顯示在控制檯，如下圖所示。

3、將執行結果儲存在world文件中，如下圖所示。

4、雙擊檔案，內容如下圖所示。

/7 小結/

1 、本文章基於Python網路爬蟲，獲取下廚房網站菜譜資訊，在應用中出現的難點和重點，以及如何防止反爬，做出了相對於的解決方案。

2、介紹瞭如何去拼接字串，以及列表如何進行型別的轉換。

3、程式碼很簡單，希望能夠幫到你。

4、歡迎大家積極嘗試，有時候看到別人實現起來很簡單，但是到自己動手實現的時候，總會有各種各樣的問題，切勿眼高手低，勤動手，才可以理解的更加深刻。

5、可以選擇自己喜歡的分類，獲取自己喜歡的菜譜，每個人都是廚師。

此文轉載文，著作權歸作者所有，如有侵權聯絡小編刪除！如需原始碼或者素材請

點選這裡下載

python-python爬取豆果網（菜譜資訊）
2019-01-22
Python
最簡單的網路圖片的爬取 --Pyhon網路爬蟲與資訊獲取
2020-04-04
爬蟲
Python資料爬蟲學習筆記（11）爬取千圖網圖片資料
2018-09-18
Python爬蟲筆記
一起學爬蟲——使用Beautiful Soup爬取網頁
2018-11-26
爬蟲網頁
用Python網路爬蟲獲取Mikan動漫資源
2020-08-26
Python爬蟲
Python 爬蟲獲取網易雲音樂歌手資訊
2019-03-04
Python爬蟲
利用Python爬蟲獲取招聘網站職位資訊
2021-08-09
Python爬蟲網站
python爬蟲——爬取大學排名資訊
2019-08-02
Python爬蟲
python例項，python網路爬蟲爬取大學排名!
2018-11-20
Python爬蟲
小白學 Python 爬蟲（25）：爬取股票資訊
2019-12-24
Python爬蟲
python網路爬蟲合法嗎
2021-09-11
Python爬蟲
Python網路爬蟲2 - 爬取新浪微博使用者圖片
2018-04-10
Python爬蟲
學習Python，這些你瞭解嗎?
2020-10-09
Python
爬蟲Selenium+PhantomJS爬取動態網站圖片資訊（Python）
2018-03-24
爬蟲JS網站Python
[Python] 網路爬蟲與資訊提取（1）網路爬蟲之規則
2020-11-06
Python爬蟲
python網路爬蟲_Python爬蟲：30個小時搞定Python網路爬蟲視訊教程
2020-10-21
Python爬蟲
Python爬蟲入門學習線路圖2019最新版（附Python爬蟲視訊教程）
2019-01-09
Python爬蟲
python爬蟲是什麼?學習python爬蟲難嗎
2021-03-31
Python爬蟲
python爬蟲---網頁爬蟲，圖片爬蟲，文章爬蟲，Python爬蟲爬取新聞網站新聞
2019-01-04
Python爬蟲網頁網站
Python使用多程式提高網路爬蟲的爬取速度
2019-02-01
Python爬蟲
Python爬蟲—爬取某網站圖片
2020-11-19
Python爬蟲網站
python爬蟲獲取天氣網實時資料
2022-11-29
Python爬蟲
selenium 知網爬蟲之根據【關鍵詞】獲取文獻資訊
2023-10-28
爬蟲
Python爬蟲學習線路圖丨Python爬蟲需要掌握哪些知識點
2018-12-10
Python爬蟲
python爬蟲，獲取中國工程院院士資訊
2021-12-04
Python爬蟲
網路爬蟲---從千圖網爬取圖片到本地
2019-09-03
爬蟲
python爬蟲--爬取鏈家租房資訊
2020-05-16
Python爬蟲
【Python學習】爬蟲爬蟲爬蟲爬蟲~
2018-05-03
Python爬蟲
這些Python學習的步驟和訣竅，你聽過嗎？
2018-11-28
Python
python網路爬蟲--爬取淘寶聯盟
2018-07-17
Python爬蟲
python網路爬蟲（7）爬取靜態資料詳解
2019-06-07
Python爬蟲
教你用Python爬取圖蟲網
2019-02-26
Python
網路爬蟲如何獲取IP進行資料抓取
2022-05-19
爬蟲
Python爬蟲訓練：爬取酷燃網視訊資料
2020-10-23
Python爬蟲
python網路爬蟲（14）使用Scrapy搭建爬蟲框架
2019-07-27
Python爬蟲框架
學習Python爬蟲難嗎?入門好學嗎?
2020-04-26
Python爬蟲
用PYTHON爬蟲簡單爬取網路小說
2021-09-11
Python爬蟲
Python爬蟲的基本概念、分類、學習路線以及爬取資料思路
2019-01-03
Python爬蟲

這些美食你吃過嗎！使用Python網路爬蟲獲取菜譜圖文資訊一起學習

相關文章