網路爬蟲筆記2， requests庫入門-2(程式設計例項)

史努B發表於2018-05-10

原文網址 : https://blog.csdn.net/f2157120/article/details/80262018

實驗1：爬取京東網。

import requests
url = "http://item.jd.com/10460106645"
try:
    r = requests.get(url)
    r.raise_for_status()
    r.encoding = r.apparent_encoding
    print(r.text[:1000])
except:
    print("爬取失敗")

實驗二：爬取amazon網

import requests
url = "https://www.amazon.cn/dp/B00RT6LB9W/ref=cngwdyfloorv2_recs_0?pf_rd_p=05f2b7d6-37ec-49bf-8fcf-5d2fec23a061&pf_rd_s=desktop-2&pf_rd_t=36701&pf_rd_i=desktop&pf_rd_m=A1AJ19PSB66TGU&pf_rd_r=TYTEFRZ086W1AQREBTFK&pf_rd_r=TYTEFRZ086W1AQREBTFK&pf_rd_p=05f2b7d6-37ec-49bf-8fcf-5d2fec23a061"
try:
    kv = {'user-agent':'Mozilla/5.0'}

    #此處把user-agent標誌變更為合法的標準瀏覽器。因為有的網頁會禁止爬蟲訪問。如果不修改，用r.request.headers 命令檢視，則輸出如下資訊
   #{'User-Agent': 'python-requests/2.18.4', 'Accept-Encoding': 'gzip, deflate', 'Accept': '*/*', 'Connection': 'keep-alive'}
   # 網站可能會設定來自python的user-agent的訪問。
   #當修改後，再次用r.request.headers 命令檢視，則會顯示如下內容
   #{'user-agent': 'Mozilla/5.0', 'Accept-Encoding': 'gzip, deflate', 'Accept': '*/*', 'Connection': 'keep-alive'}

    r = requests.get(url,headers = kv)
    r.raise_for_status()
    r.encoding = r.apparent_encoding
    print(r.text)
except:
    print("爬取失敗")

實驗三百度360搜尋關鍵詞提交

搜尋引擎關鍵詞提交介面：

百度：http://www.baidu.com/s?wd=keyword

360: http://www.so.com/s?q=keyword

Baidu爬蟲全碼

import requests
keyword = "Python"
try:
    kv = {'wd':keyword}
    r = requests.get("http://www.baidu.com/s",params = kv)
    print(r.request.url)
    r.raise_for_status()
    print(len(r.text))
except:

print("Failed")

//360全碼

import requests
keyword = "Python"
try:
    kv = {'q':keyword}
    r = requests.get("http://www.so.com/s",params = kv)
    print(r.request.url)
    r.raise_for_status()
    print(len(r.text))
except:

print("Failed")

實驗4 網路圖片的爬取

網路圖片的連結格式： http://www.example.com/picture.jpg

import requests
path = "C:/zhj/abc.jpg"
url = "https://www.nationalgeographic.com/content/dam/travel/2018-digital/wild-wonders-of-europe/wild-wonders-of-europe-23.ngsversion.1525723673468.adapt.676.1.jpg"
r = requests.get(url)

r.status_code

with open(path,'wb') as f:
f.write(r.content)

實驗五 IP地址歸屬地自動查詢

http://m.ip138.com/ip.asp?ip-ipaddress

import requests
url = "http://m.ip138.com/ip.asp?ip="
try:
    r = requests.get(url + '202.116.65.13')
    r.raise_for_status()
    r.encoding = r.apparent_encoding
    print(r.text[-500:])
except:
    print("Failed")

Python2爬蟲利器：requests庫的基本用法
2021-09-11
Python爬蟲
python爬蟲—學習筆記-2
2024-04-10
Python爬蟲筆記
爬蟲之requests庫
2022-03-20
爬蟲
python例項，python網路爬蟲爬取大學排名!
2018-11-20
Python爬蟲
python網路爬蟲筆記（一）
2020-10-25
Python爬蟲筆記
爬蟲入門學習筆記3
2021-01-05
爬蟲筆記
讀書筆記：《Python3網路爬蟲開發實戰》——第2章：爬蟲基礎
2019-04-09
筆記Python爬蟲
Python爬蟲入門教程 2-100 妹子圖網站爬取
2018-12-13
Python爬蟲網站
【Python3網路爬蟲開發實戰】3-基本庫的使用 2-使用requests 2-高階用法
2018-03-15
Python爬蟲
Python網路爬蟲4 - scrapy入門
2018-05-29
Python爬蟲
好程式設計師Python學習路線之python爬蟲入門
2019-08-14
程式設計師Python爬蟲
Python網路爬蟲資料採集實戰：Requests和Re庫
2020-03-22
Python爬蟲
手把手教你寫網路爬蟲（2）：迷你爬蟲架構
2018-04-27
爬蟲架構
使用Python和requests庫的簡單爬蟲程式
2023-11-13
Python爬蟲
[翻譯]返回導向程式設計例項入門
2021-06-02
程式設計
[Python3網路爬蟲開發實戰] 2-爬蟲基礎 2-網頁基礎
2018-03-08
Python爬蟲網頁
Python網路爬蟲實戰(一)快速入門
2019-09-16
Python爬蟲
網路爬蟲詳細設計方案
2018-08-17
爬蟲
【Python3網路爬蟲開發實戰】3-基本庫的使用 2-使用requests 1-基本用法
2018-03-15
Python爬蟲
Python爬蟲神器requests庫的使用
2024-11-07
Python爬蟲
《網路爬蟲開發實戰案例》筆記
2020-08-10
爬蟲筆記
vue入門筆記體系（一）vue例項
2018-07-29
Vue筆記
python爬蟲之 BeautifulSoup庫入門
2019-12-09
Python爬蟲
筆記requests庫
2019-03-23
筆記
設計模式筆記（2）
2018-05-27
設計模式筆記
python爬蟲常用庫之requests詳解
2019-03-04
Python爬蟲
爬蟲的例項專案
2019-04-26
爬蟲
爬蟲入門
2024-04-13
爬蟲
Struts2框架快速入門筆記
2018-04-09
框架筆記
python爬蟲2
2019-01-07
Python爬蟲
Python爬蟲--2
2024-03-24
Python爬蟲
python入門012～使用requests爬取網路圖片並儲存到本地
2021-09-09
Python
手把手教你寫網路爬蟲（4）：Scrapy入門
2018-05-05
爬蟲
Python3網路爬蟲快速入門實戰解析
2020-04-23
Python爬蟲
Python——astroplan庫入門例項（二）
2020-12-13
PythonAST
爬蟲——Requests模組
2019-01-13
爬蟲
爬蟲-Requests模組
2022-03-03
爬蟲
Netty雜記2—NIO網路程式設計
2019-03-01
Netty程式設計

網路爬蟲筆記2， requests庫入門-2(程式設計例項)

相關文章