好玩的github專案-微信公眾號爬蟲 (只需設定代理, 一鍵可以爬取所有歷史文章)
轉自github使用者:sundyli
使用方法: 執行後, 設定手機的代理為 本機ip 8899埠, 開啟微信客戶端, 點選任一公眾號檢視歷史文章按鈕, 即可爬取該公眾號的所有歷史文章(已經支援自動翻頁爬取)
自定義輸出源,實現Processor介面的Output方法即可, custom_output_server.go
微信會遮蔽頻繁的請求,所以歷史文章的翻頁請求呼叫了Sleep()方法, 預設每個請求休眠50ms,可以根據實際情況自定義Processor覆蓋此方法
一個簡單的Demo simple_server.go
package main
import (
"log"
"net/http"
"github.com/sundy-li/wechat_spider"
"github.com/elazarl/goproxy"
)
func main() {
var port = "8899"
proxy := goproxy.NewProxyHttpServer()
//open it see detail logs
// wechat_spider.Verbose = true
proxy.OnResponse().DoFunc(
wechat_spider.ProxyHandle(wechat_spider.NewBaseProcessor()),
)
log.Println("server will at port:" + port)
log.Fatal(http.ListenAndServe(":"+port, proxy))
}
相關文章
- 爬取微信公眾號文章工具
- 網路爬蟲——專案實戰(爬取糗事百科所有文章)爬蟲
- 爬蟲實戰專案-公眾號:AI悅創爬蟲AI
- 爬蟲爬取微信小程式爬蟲微信小程式
- python爬蟲簡歷專案怎麼寫_爬蟲專案咋寫,爬取什麼樣的資料可以作為專案寫在簡歷上?...Python爬蟲
- github上的python爬蟲專案_GitHub - ahaharry/PythonCrawler: 用python編寫的爬蟲專案集合GithubPython爬蟲
- 【爬蟲】利用Python爬蟲爬取小麥苗itpub部落格的所有文章的連線地址(1)爬蟲Python
- “微信公眾號-設定-基本配置”的配置
- python爬蟲例項專案大全-GitHub 上有哪些優秀的 Python 爬蟲專案?Python爬蟲Github
- 微信公眾號獲取AccessToekn
- Python爬蟲技巧---設定代理IPPython爬蟲
- python 爬蟲 爬取 learnku 精華文章Python爬蟲
- python爬蟲---網頁爬蟲,圖片爬蟲,文章爬蟲,Python爬蟲爬取新聞網站新聞Python爬蟲網頁網站
- 某微信公眾號AI文章清單AI
- GitHub上有哪些優秀的爬蟲專案?Github爬蟲
- 微信不看公眾號的影片號動態的設定方法
- python爬蟲實戰:爬取西刺代理的代理ip(二)Python爬蟲
- vue專案使用微信公眾號支付總結Vue
- 爬蟲雙色球所有的歷史資料並儲存到SQLite爬蟲SQLite
- 歷史股票資料的爬取
- python爬蟲初探--第一個python爬蟲專案Python爬蟲
- 【爬蟲】利用Python爬蟲爬取小麥苗itpub部落格的所有文章的連線地址並寫入Excel中(2)爬蟲PythonExcel
- GitHub 上有哪些優秀的 Python 爬蟲專案?GithubPython爬蟲
- 【爬蟲】爬蟲專案推薦 / 思路爬蟲
- selenium+python設定爬蟲代理IP的方法Python爬蟲
- 爬蟲專案爬蟲
- 【PhpSelenium】3.定時爬蟲 + 多工爬蟲 + 代理池PHP爬蟲
- [PhpSelenium] 3.定時爬蟲 + 多工爬蟲 + 代理池PHP爬蟲
- 微信公眾號需要設定哪些專案?市場營銷新媒體運營
- 精通Scrapy網路爬蟲【一】第一個爬蟲專案爬蟲
- 【Markdown】如何在微信公眾號上寫markdown的文章
- 微信公眾號讀者討論怎麼發起? 微信公眾號文章加讀者討論的技巧
- 【爬蟲】專案篇-使用selenium爬取大魚潮汐網爬蟲
- 爬蟲專案實戰(一)爬蟲
- 某微信公眾號2019年度文章列表
- Python實現微博爬蟲,爬取新浪微博Python爬蟲
- 爬蟲搭建代理池、爬取某網站影片案例、爬取新聞案例爬蟲網站
- 新手爬蟲教程:Python爬取知乎文章中的圖片爬蟲Python
- 如何用海外HTTP代理設定python爬蟲代理ip池?HTTPPython爬蟲