python-python爬取豆果網（菜譜資訊）

峰寒發表於2019-01-22

原文網址 : https://flycode.co/archives/252156

#-*- coding = utf-8 -*-
#獲取豆果網圖片
import io
from bs4 import BeautifulSoup
import requests

#爬取菜譜的地址
url = "https://www.douguo.com/cookbook/2029254.html"
#防止網址的反爬蟲
header = {`User-Agent`:`Mozilla/5.0 (Windows NT 6.1; WOW64; rv:23.0) Gecko/20100101 Firefox/23.0`}
#獲取網頁資訊
html = requests.get(url,headers = header)
#解析網頁資訊
text = BeautifulSoup(html.content,"lxml")
#獲取主要菜譜圖片的地址（在此僅僅獲取了一張圖片）
img_title = text.select("#banner img")
imgg = img_title[0].get("src")
#根據url將圖片儲存到當地
def get_img_data(ul):
    htm = requests.get(ul,headers = header)
    filename = "1.jpg"
    #這個地方的filename可以根據需求進行修改
    f =  open(filename,"wb")
    #將圖片寫到檔案中
    f.write(htm.content)
    f.close()
get_img_data(imgg)

#分別獲取菜譜資訊
menu_title_0 = text.select(`.title.text-lips`)[0].text
menu_intro   = text.select(`.intro`)[0].text
menu_title_1 = text.select(`.mini-title`)[0].text
menu_content_scname = text.find_all(`span`,class_=`scname`)
menu_content_scnum = text.find_all(`span`,class_=`scnum`)
menu_title_2 = text.select(`.mini-title`)[1].text
menu_step = text.select(`.stepinfo`)

print(menu_title_0)
print(menu_intro)
print(menu_title_1)
count = 0
for i in menu_content_scname:
    print(i.text," ",menu_content_scnum[count].text)
    count = count + 1
print(menu_title_2)
for menu_step_i in menu_step:
    print(menu_step_i.text)

菜譜-黃豆燜豬蹄
2024-11-11
這些美食你吃過嗎！使用Python網路爬蟲獲取菜譜圖文資訊一起學習
2020-09-26
Python爬蟲
Python爬蟲訓練：爬取酷燃網視訊資料
2020-10-23
Python爬蟲
Java爬蟲-爬取疫苗批次資訊
2024-06-03
Java爬蟲
最簡單的網路圖片的爬取 --Pyhon網路爬蟲與資訊獲取
2020-04-04
爬蟲
利用requests+BeautifulSoup爬取網頁關鍵資訊
2018-11-13
網頁
Python筆記：網頁資訊爬取簡介（一）
2020-11-11
Python筆記網頁
python爬取北京租房資訊
2018-05-18
Python
淘寶商品資訊爬取
2020-12-20
python爬蟲——爬取大學排名資訊
2019-08-02
Python爬蟲
python爬蟲--爬取鏈家租房資訊
2020-05-16
Python爬蟲
爬蟲Selenium+PhantomJS爬取動態網站圖片資訊（Python）
2018-03-24
爬蟲JS網站Python
蘇寧易購網址爬蟲爬取商品資訊及圖片
2021-10-12
爬蟲
Python 爬蟲獲取網易雲音樂歌手資訊
2019-03-04
Python爬蟲
利用Python爬蟲獲取招聘網站職位資訊
2021-08-09
Python爬蟲網站
小白學 Python 爬蟲（25）：爬取股票資訊
2019-12-24
Python爬蟲
Puppeteer爬取網頁資料
2019-03-22
網頁
java爬取豆瓣書籍資訊
2019-01-03
Java
夠味美食網-基於菜譜的社交網站
2019-05-11
網站
Python爬蟲爬取淘寶，京東商品資訊
2020-02-11
Python爬蟲
菜譜-黃燜雞
2024-11-04
菜譜-擂椒皮蛋
2024-11-04
菜譜-尖椒幹豆腐
2024-11-03
菜譜-酸湯肥牛
2024-11-08
菜譜-白菜豆腐
2024-11-09
爬蟲實踐之獲取網易雲評論資料資訊
2022-03-29
爬蟲
拉勾網職位資料爬取
2018-08-26
Python爬取噹噹網APP資料
2020-10-21
PythonAPP
使用 Python 爬取網站資料
2024-07-27
Python網站
python itchat 爬取微信好友資訊
2018-06-02
Python
初識Scrapy框架+爬蟲實戰(7)-爬取鏈家網100頁租房資訊
2018-06-12
框架爬蟲
Python爬蟲實戰：爬取淘寶的商品資訊
2021-09-11
Python爬蟲
爬蟲01:爬取豆瓣電影TOP 250基本資訊
2020-12-29
爬蟲
是時候 Get 新技能了：使用 Java 爬取網頁資訊
2019-01-27
Java網頁
C#爬取動態網頁上的資訊：B站主頁
2024-09-27
C#網頁
快速爬取登入網站資料
2020-11-20
網站
Puppeteer 爬取豆瓣小組公開資訊
2020-05-21
用python爬取鏈家的租房資訊
2020-10-29
Python

python-python爬取豆果網（菜譜資訊）

相關文章