Node.js爬取豆瓣資料

雞湯小弟發表於2018-02-24

一直自以為自己vue還可以，一直自以為webpack還可以，今天在慕課逛node的時候，才發現，自己還差的很遠。眾所周知，vue-cli基於webpack，而webpack基於node，對node不瞭解，談什麼瞭解webpack。所以就自己給自己出了一道題，爬取豆瓣資料，目前還處於初級階段。今天就淺談爬取到豆瓣的資料，再另一個頁面用自己的方式展現，後續會跟進。

需要解決的問題

搭建服務
怎麼處理爬到的資料
怎麼自動開啟預設瀏覽器

搭建服務

搭建服務有好幾種方式，一開始我用的http，但是http有個弊端就是不能解析https協議的url，所以就用了express，解析https協議的網址我用了request包，豆瓣的網址是https的，

今天爬取的是https://movie.douban.com/chart這個網址；如下圖，我要獲取的有三個部分，圖片、電影名字、電影連結。

Node.js爬取豆瓣資料

怎麼處理爬到的資料

我們用request爬到的資料，怎麼處理呢？cheerio包可以讓我們像Jq那樣處理爬到的html資料。

①、首先解析資料，取到爬取網頁的html資料；

Node.js爬取豆瓣資料

②、然後利用cheerio包操作爬到的資料，取到你想要的資料。

Node.js爬取豆瓣資料

③、取到資料，建立html，輸出到頁面。如下圖，我用的字串拼接，辦法有點笨，還沒有找到更好的辦法。

Node.js爬取豆瓣資料

怎麼自動開啟預設瀏覽器

不知道你有沒有看vue-cli中webpack的配置，自動開啟瀏覽器，vue-cli用的opn包。

Node.js爬取豆瓣資料

這個包用起來很方便，引入包，直接呼叫opn（url）即可；

展示

Node.js爬取豆瓣資料

Node.js爬取豆瓣資料

關注微信公眾號雞湯小弟

Node.js爬取豆瓣資料

相關文章

scrapy爬取豆瓣電影資料
2021-09-11
豆瓣top250資料爬取
2020-11-09
python更換代理爬取豆瓣電影資料
2019-08-03
Python
爬取豆瓣電影Top250和資料分析
2022-06-20
全棧 - 9 實戰爬取豆瓣電影資料
2017-03-03
全棧
python爬蟲爬取豆瓣電影 1-10 ajax 資料
2024-07-04
Python爬蟲
java爬取豆瓣書籍資訊
2019-01-03
Java
Springboot+JPA下實現簡易爬蟲--爬取豆瓣電視劇資料
2020-10-15
Spring Boot爬蟲
python——豆瓣top250爬取
2021-01-02
Python
爬蟲教程——用Scrapy爬取豆瓣TOP250
2018-10-31
爬蟲
爬蟲01:爬取豆瓣電影TOP 250基本資訊
2020-12-29
爬蟲
【python爬蟲案例】利用python爬取豆瓣電影TOP250評分排行資料！
2024-09-18
Python爬蟲
房產資料爬取、智慧財產權資料爬取、企業工商資料爬取、抖音直播間資料python爬蟲爬取
2024-07-11
Python爬蟲
node.js爬取資料並定時傳送HTML郵件
2019-03-26
Node.jsHTML
【python爬蟲案例】利用python爬取豆瓣讀書評分TOP250排行資料
2024-09-20
Python爬蟲
nodejs 30行程式碼爬豆瓣電影資料
2017-12-14
NodeJS行程
爬取高考資料
2012-06-20
scrapy入門：豆瓣電影top250爬取
2019-02-16
使用python爬取豆瓣電影TOP250
2021-03-11
Python
Python爬取分析豆瓣電影Top250
2018-09-07
Python
06、豆瓣爬蟲
2019-04-11
爬蟲
爬蟲豆瓣美女
2018-11-28
爬蟲
Python爬蟲筆記（4）：利用scrapy爬取豆瓣電影250
2018-11-10
Python爬蟲筆記
Python爬蟲教程-17-ajax爬取例項（豆瓣電影）
2018-09-06
Python爬蟲
Python爬取豆瓣電影的短評資料並進行詞雲分析處理
2019-01-05
Python
教你用python登陸豆瓣並爬取影評
2019-03-04
Python
正規表示式_爬取豆瓣電影排行Top250
2021-07-07
爬蟲爬取資料如何繞開限制？
2022-06-10
爬蟲
Puppeteer爬取網頁資料
2019-03-22
網頁
鬥魚彈幕資料爬取
2018-12-08
同花順資料爬取
2024-06-27
Node.js爬取妹子圖-crawler爬蟲的使用
2018-04-04
Node.js爬蟲
上天的Node.js之爬蟲篇 15行程式碼爬取京東資源
2019-03-22
Node.js爬蟲行程
python爬蟲知識點三--解析豆瓣top250資料
2017-11-19
Python爬蟲
爬蟲實戰——58同城租房資料爬取
2019-12-04
爬蟲
如何保障爬蟲高效穩定爬取資料？
2022-05-27
爬蟲
利用Python爬蟲爬取天氣資料
2018-02-06
Python爬蟲
用python寫一個豆瓣短評通用爬蟲(登入、爬取、視覺化)
2020-10-24
Python爬蟲視覺化