Nodejs爬取新聞列表
爬取地址
使用到的庫
superagent (頁面資料下載)
cheerio (頁面資料解析)
程式碼
app.js
// 引入依賴const superagent = require('superagent'); // superagent是nodejs裡一個非常方便的客戶端請求程式碼模組const cheerio = require('cheerio'); // 可以理解為一個Node.js版本的Jquery// 爬取地址const url = '';// 讀取頁面資料superagent.get(url).end((err, res) => { if (err) throw Error(err); let postlist = getFilterHtml(res.text); // 存入資料庫操作...})// 過濾資料function getFilterHtml(html) { let $ = cheerio.load(html); // 使用cheerio let postList = []; // 存放新聞列表的陣列 // F12分析後的節點資料,用Jquery的語法進行過濾、摘取 $('#listContent .news_li').each((index, item) => { let elem = $(item); let post = { icon: elem.find('.tiptitleImg img').attr('src'), title: elem.find('h2 a').text(), intro: elem.find('p').text(), link: elem.find('h2 a').attr('href'), target: elem.find('.pdtt_trbs a').text(), hot: elem.find('.pdtt_trbs .trbszan').text() } postList.push(post); }) return postList; }
作者:daydreammoon
連結:
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/3349/viewspace-2813017/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 爬取網站新聞網站
- python爬蟲---網頁爬蟲,圖片爬蟲,文章爬蟲,Python爬蟲爬取新聞網站新聞Python爬蟲網頁網站
- 爬蟲搭建代理池、爬取某網站影片案例、爬取新聞案例爬蟲網站
- java爬蟲入門--用jsoup爬取汽車之家的新聞Java爬蟲JS
- css去掉新聞列表最後一個新聞的下劃線CSS
- 大規模非同步新聞爬蟲:實現一個同步定向新聞爬蟲非同步爬蟲
- 大規模非同步新聞爬蟲:簡單的百度新聞爬蟲非同步爬蟲
- jQuery新聞列表垂直滾動詳解jQuery
- CSS 帶有時間日期的新聞列表CSS
- css如何將新聞列表前面的點去掉CSS
- 用Nodejs Cheerio爬取NPM包詳細資訊NodeJSNPM
- 爬蟲實戰:探索XPath爬蟲技巧之熱榜新聞爬蟲
- scrapy入門教程2:建立一個簡單的爬取南郵新聞標題的爬蟲demo爬蟲
- ul li實現的新聞列表程式碼例項
- jQuery具有暫停功效果新聞列表向上滾動jQuery
- Node.js爬取科技新聞網站cnBeta(附前端及服務端原始碼)Node.js網站前端服務端原始碼
- Go秒爬部落格園100頁新聞Go
- Python爬蟲百度新聞標題Python爬蟲
- nodejs 爬蟲NodeJS爬蟲
- 爬取GoCn每日新聞並推送到微信/郵箱Go
- 具有間歇效果的新聞列表垂直滾動程式碼
- ul和li實現的新聞列表程式碼例項
- 使用 puppeteer + nodejs 爬取喜歡的動漫資源NodeJS
- Jsoup + HtmlUtil 實現網易新聞網頁爬蟲JSHTML網頁爬蟲
- 通用新聞爬蟲開發系列(專案介紹)爬蟲
- 大規模非同步新聞爬蟲: 用asyncio實現非同步爬蟲非同步爬蟲
- Flutter 新聞詳情頁二——WebView和列表豎直滾動FlutterWebView
- ReactJS新聞 #21 React Native中更好的列表檢視JSReact Native
- nodejs爬蟲獲取漫威超級英雄電影海報NodeJS爬蟲
- 大規模非同步新聞爬蟲的實現思路非同步爬蟲
- 撿了滑鼠開網咖系列——nodejs爬取電影連結NodeJS
- 大規模非同步新聞爬蟲的分散式實現非同步爬蟲分散式
- 大規模非同步新聞爬蟲:網頁正文的提取非同步爬蟲網頁
- 爬蟲監控1000家企業新聞動態爬蟲
- 創新專案實訓:資料爬取
- 移動新聞網站,掌上移動新聞,移動新聞客戶端,jQuery Mobile移動新聞網站,移動新聞網站demo,新聞閱讀器開發網站客戶端jQuery
- puppeteer+mysql—爬蟲新方法!抓取新聞&評論so easy!MySql爬蟲
- Python爬蟲工具列表Python爬蟲