Python爬蟲教程-17-ajax爬取例項（豆瓣電影）

肖朋偉發表於2018-09-06

原文網址 : https://www.cnblogs.com/xpwi/p/9600894.html

Python爬蟲

Python爬蟲教程-17-ajax爬取例項（豆瓣電影）

ajax： 簡單的說，就是一段js程式碼，通過這段程式碼，可以讓頁面傳送非同步的請求，或者向伺服器傳送一個東西，即和伺服器進行互動

對於ajax：

1.一定會有 url，請求方法(get, post)，可能有資料
2.一般使用 json 格式

爬取豆瓣電影

網站分析：
- 開啟豆瓣電影網站：https://movie.douban.com/，選擇【排行榜】，點選【動作】分類
- 一直往下滑，可以看到這樣的效果：快到低的時候又有了新的內容，也就是往下沒完
- 基本可以判定使用了 ajax 請求，進行非同步的載入
- 然後進去檢查請求的資訊：
  - 1.右鍵【檢查】>【Network】
  - 2.向下滾動頁面
  - 3.可以看到請求在不斷不更新，點選一個請求，就可以看到請求的資訊
程式碼檔案：https://xpwi.github.io/py/py%E7%88%AC%E8%99%AB/py19db.py

# 爬取豆瓣電影資料
# 瞭解ajax的爬取方式
# https://movie.douban.com/

from urllib import request
import json

# url資訊：interval_id表示排名段（可自行修改），limit限制20個
url = "https://movie.douban.com/j/chart/top_list?type=5&interval_id=100%3A90&action=&start=20&limit=20"

rsp = request.urlopen(url)
data = rsp.read().decode()

data = json.loads(data)

print(data)

執行結果

可以看到結果在一行顯示
這裡寫圖片描述

修改輸出格式

對於返回的json資料，我們選擇想要的內容，想要的格式輸出
程式碼檔案：https://xpwi.github.io/py/py%E7%88%AC%E8%99%AB/py19db2.py

# 爬取豆瓣電影資料
# 瞭解ajax的爬取方式
# https://movie.douban.com/

from urllib import request
import json

# url資訊：interval_id表示排名段（可自行修改），limit限制20個
url = "https://movie.douban.com/j/chart/top_list?type=5&interval_id=100%3A90&action=&start=20&limit=20"

rsp = request.urlopen(url)
data = rsp.read().decode()

data = json.loads(data)

# 遍歷輸出每個'k'和'v'的值
for item in data:
      print("排名：", item['rank'], "\n",
            "名稱：", item['title'], "\n",
            "型別：", item['types'], "\n",
            "主演：", item['actors'], "\n",
            "分數：", item['score'],"\n-------------",)

執行結果

這裡寫圖片描述
這裡結果就比較順眼了，如果需要更改排名段，因為是get請求，修改需要在url引數即可

更多文章連結：Python 爬蟲隨筆

本筆記不允許任何個人和組織轉載

Python爬蟲例項：爬取貓眼電影——破解字型反爬
2019-02-26
Python爬蟲
Python爬蟲筆記（4）：利用scrapy爬取豆瓣電影250
2018-11-10
Python爬蟲筆記
python爬蟲爬取豆瓣電影 1-10 ajax 資料
2024-07-04
Python爬蟲
爬蟲01:爬取豆瓣電影TOP 250基本資訊
2020-12-29
爬蟲
【python爬蟲案例】利用python爬取豆瓣電影TOP250評分排行資料！
2024-09-18
Python爬蟲
Python爬取分析豆瓣電影Top250
2018-09-07
Python
使用python爬取豆瓣電影TOP250
2021-03-11
Python
爬蟲教程——用Scrapy爬取豆瓣TOP250
2018-10-31
爬蟲
python例項，python網路爬蟲爬取大學排名!
2018-11-20
Python爬蟲
scrapy爬取豆瓣電影資料
2021-09-11
python更換代理爬取豆瓣電影資料
2019-08-03
Python
擼個爬蟲，爬取電影種子
2019-05-11
爬蟲
【Python】從0開始寫爬蟲——轉身扒豆瓣電影
2018-08-16
Python爬蟲
python 爬蟲實現增量去重和定時爬取例項
2020-03-06
Python爬蟲
手把手教你網路爬蟲（爬取豆瓣電影top250，附帶原始碼）
2023-03-04
爬蟲原始碼
Python爬取電影天堂
2018-11-01
Python
scrapy入門：豆瓣電影top250爬取
2019-02-16
Python爬蟲專案100例，附原始碼！100個Python爬蟲練手例項
2021-09-09
Python爬蟲原始碼
爬蟲豆瓣美女
2018-11-28
爬蟲
06、豆瓣爬蟲
2019-04-11
爬蟲
Python爬蟲入門教程 50-100 Python3爬蟲爬取VIP視訊-Python爬蟲6操作
2019-02-14
Python爬蟲
爬取豆瓣電影Top250和資料分析
2022-06-20
爬蟲如何爬取貓眼電影TOP榜資料
2019-06-17
爬蟲
Python網路爬蟲實踐案例：爬取貓眼電影Top100
2024-11-21
Python爬蟲
教你用python登陸豆瓣並爬取影評
2019-03-04
Python
python——豆瓣top250爬取
2021-01-02
Python
python爬蟲---網頁爬蟲，圖片爬蟲，文章爬蟲，Python爬蟲爬取新聞網站新聞
2019-01-04
Python爬蟲網頁網站
Python網路爬蟲（正則, 內涵段子，貓眼電影, 鏈家爬取）
2018-10-30
Python爬蟲
python-爬蟲-css提取-寫入csv-爬取貓眼電影榜單
2023-04-05
Python爬蟲CSS
python爬蟲學習01--電子書爬取
2020-07-13
Python爬蟲
正規表示式_爬取豆瓣電影排行Top250
2021-07-07
python爬蟲例項專案大全-GitHub 上有哪些優秀的 Python 爬蟲專案？
2020-10-30
Python爬蟲Github
Springboot+JPA下實現簡易爬蟲--爬取豆瓣電視劇資料
2020-10-15
Spring Boot爬蟲
Python爬蟲新手教程：知乎文章圖片爬取器
2019-07-20
Python爬蟲
用python寫一個豆瓣短評通用爬蟲(登入、爬取、視覺化)
2020-10-24
Python爬蟲視覺化
Python爬蟲教程-01-爬蟲介紹
2018-09-06
Python爬蟲
爬蟲的例項專案
2019-04-26
爬蟲
一小時入門Python爬蟲，連我都會了！Python爬取租房資料例項
2019-08-02
Python爬蟲

Python爬蟲教程-17-ajax爬取例項（豆瓣電影）

Python爬蟲教程-17-ajax爬取例項（豆瓣電影）

對於ajax：

爬取豆瓣電影

執行結果

修改輸出格式

執行結果

更多文章連結：Python 爬蟲隨筆

相關文章