Request模組實戰01 ---簡單爬取頁面
Request模組實戰01 — 簡單爬取頁面(四步曲)
1.request模組
- urllib模組
- request模組
2.request模組:
python中原生的一款基於網路請求的模組,功能強大,簡單便捷,效率高
作用:模擬瀏覽器傳送請求
3.如何使用:(request模組的編碼流程)
- 1.指定url
- 2.發起請求
- 3.獲取響應資料
- 4.持久化儲存
4.程式碼實現
# -*- coding: utf-8
# @Time : 2020/12/7 23:24
# @Author : ZYX
# @File : request01_firstblood.py
# @software: PyCharm
import requests
if __name__ == '__main__':
# 1.指定url
url = "https://www.sogou.com/"
# 2.傳送請求
# get方法會返回一個響應物件
response = requests.get(url)
# 3.獲取響應資料.text 返回的是字元形式的響應資料
page_text = response.text
print(page_text)
# 4.持久化儲存
with open('./data/sogou.html','w',encoding='utf-8') as fp:
fp.write(page_text) # 將爬取的資料寫入檔案
print('爬取資料結束!!!')
通過執行結果可以看出,爬蟲小程式成功完成,並且將對應的檔案儲存在了指定檔案目錄下。
開啟儲存的html檔案,使用谷歌瀏覽器開啟,成功執行。至此,第一個爬蟲小程式順利完成!
相關文章
- [實戰演練]python3使用requests模組爬取頁面內容Python
- go語言實現簡單爬蟲獲取頁面圖片Go爬蟲
- Request模組實戰02 --- 實現簡易網頁採集器(UA偽裝反爬策略、處理有引數url)網頁
- 「小程式JAVA實戰」小程式模組頁面引用(18)Java
- 01模組化簡介
- python爬蟲:爬蟲的簡單介紹及requests模組的簡單使用Python爬蟲
- scrapy實戰專案(簡單的爬取知乎專案)
- http request-01-XMLHttpRequest XHR 簡單介紹HTTPXML
- Puppeteer 實戰-爬取動態生成的網頁網頁
- python 爬取 blessing skin 的簡單實現Python
- 單頁面開發--爬坑
- 爬蟲實戰(二):Selenium 模擬登入並爬取資訊爬蟲
- 簡單聊聊模組
- [Python3網路爬蟲開發實戰] 7-動態渲染頁面爬取-4-使用Selenium爬取淘寶商品Python爬蟲
- nodejs request模組用法NodeJS
- 網路爬蟲——Urllib模組實戰專案(含程式碼)爬取你的第一個網站爬蟲網站
- Paramiko模組簡單使用
- 使用策略模式和簡單工廠模式重寫支付模組(二)-優化$request模式優化
- [Python3網路爬蟲開發實戰] 7-動態渲染頁面爬取-1-Selenium的使用Python爬蟲
- puppeteer 頁面爬取例項(元素遍歷)
- 簡單的網頁登入頁面網頁
- 從module的簡單實現到模組化
- 使用策略模式和簡單工廠模式重寫支付模組(二)-最佳化$request模式
- python inspect模組簡單使用Python
- 初識Scrapy框架+爬蟲實戰(7)-爬取鏈家網100頁租房資訊框架爬蟲
- Python 爬蟲進階篇-利用beautifulsoup庫爬取網頁文章內容實戰演示Python爬蟲網頁
- 用PYTHON爬蟲簡單爬取網路小說Python爬蟲
- 爬取子頁
- webscoket+jsp實現簡單的多人聊天頁面WebJS
- 使用WebSocket實現一個簡單的頁面聊天Web
- 讓 scrapy 重複爬取同一個頁面
- 記錄一次使用jsoup爬取頁面JS
- 進擊的模組化+webpack的簡單實現Web
- [Python3網路爬蟲開發實戰] 7-動態渲染頁面爬取-3-Splash負載均衡配置Python爬蟲負載
- 爬蟲實戰——58同城租房資料爬取爬蟲
- 前端模組化簡單總結前端
- 簡單介紹python process模組Python
- 簡單擼了個 GitHub trending 爬取 APIGithubAPI