好玩的github專案-微信公眾號爬蟲 (只需設定代理, 一鍵可以爬取所有歷史文章)

wwdyy發表於2016-10-27

轉自github使用者：sundyli

使用方法: 執行後, 設定手機的代理為本機ip 8899埠, 開啟微信客戶端, 點選任一公眾號檢視歷史文章按鈕, 即可爬取該公眾號的所有歷史文章(已經支援自動翻頁爬取)

自定義輸出源,實現Processor介面的Output方法即可, custom_output_server.go

微信會遮蔽頻繁的請求,所以歷史文章的翻頁請求呼叫了Sleep()方法, 預設每個請求休眠50ms,可以根據實際情況自定義Processor覆蓋此方法

一個簡單的Demo simple_server.go

package main

import (
    "log"
    "net/http"

    "github.com/sundy-li/wechat_spider"

    "github.com/elazarl/goproxy"
)

func main() {
    var port = "8899"
    proxy := goproxy.NewProxyHttpServer()
    //open it see detail logs
    // wechat_spider.Verbose = true
    proxy.OnResponse().DoFunc(
        wechat_spider.ProxyHandle(wechat_spider.NewBaseProcessor()),
    )
    log.Println("server will at port:" + port)
    log.Fatal(http.ListenAndServe(":"+port, proxy))

}

github連結：https://github.com/sundy-li/wechat_spider

爬取微信公眾號文章工具
2021-03-31
網路爬蟲——專案實戰（爬取糗事百科所有文章）
2020-02-07
爬蟲
爬蟲實戰專案-公眾號：AI悅創
2020-04-05
爬蟲AI
爬蟲爬取微信小程式
2019-02-16
爬蟲微信小程式
python爬蟲簡歷專案怎麼寫_爬蟲專案咋寫，爬取什麼樣的資料可以作為專案寫在簡歷上？...
2020-12-01
Python爬蟲
github上的python爬蟲專案_GitHub - ahaharry/PythonCrawler: 用python編寫的爬蟲專案集合
2022-02-18
GithubPython爬蟲
【爬蟲】利用Python爬蟲爬取小麥苗itpub部落格的所有文章的連線地址（1）
2018-12-26
爬蟲Python
“微信公眾號-設定-基本配置”的配置
2018-03-19
python爬蟲例項專案大全-GitHub 上有哪些優秀的 Python 爬蟲專案？
2020-10-30
Python爬蟲Github
微信公眾號獲取AccessToekn
2020-12-16
Python爬蟲技巧---設定代理IP
2018-07-12
Python爬蟲
python 爬蟲爬取 learnku 精華文章
2020-04-17
Python爬蟲
python爬蟲---網頁爬蟲，圖片爬蟲，文章爬蟲，Python爬蟲爬取新聞網站新聞
2019-01-04
Python爬蟲網頁網站
某微信公眾號AI文章清單
2019-06-20
AI
GitHub上有哪些優秀的爬蟲專案？
2019-04-18
Github爬蟲
微信不看公眾號的影片號動態的設定方法
2024-01-25
python爬蟲實戰：爬取西刺代理的代理ip（二）
2019-02-16
Python爬蟲
vue專案使用微信公眾號支付總結
2018-10-23
Vue
爬蟲雙色球所有的歷史資料並儲存到SQLite
2020-10-28
爬蟲SQLite
歷史股票資料的爬取
2021-12-31
python爬蟲初探--第一個python爬蟲專案
2018-05-18
Python爬蟲
【爬蟲】利用Python爬蟲爬取小麥苗itpub部落格的所有文章的連線地址並寫入Excel中（2）
2018-12-27
爬蟲PythonExcel
GitHub 上有哪些優秀的 Python 爬蟲專案？
2020-04-13
GithubPython爬蟲
【爬蟲】爬蟲專案推薦 / 思路
2020-04-21
爬蟲
selenium+python設定爬蟲代理IP的方法
2019-04-17
Python爬蟲
爬蟲專案
2019-06-07
爬蟲
【PhpSelenium】3.定時爬蟲 + 多工爬蟲 + 代理池
2019-12-17
PHP爬蟲
[PhpSelenium] 3.定時爬蟲 + 多工爬蟲 + 代理池
2019-12-17
PHP爬蟲
微信公眾號需要設定哪些專案？市場營銷新媒體運營
2021-04-01
精通Scrapy網路爬蟲【一】第一個爬蟲專案
2021-06-19
爬蟲
【Markdown】如何在微信公眾號上寫markdown的文章
2018-07-03
微信公眾號讀者討論怎麼發起? 微信公眾號文章加讀者討論的技巧
2020-09-09
【爬蟲】專案篇-使用selenium爬取大魚潮汐網
2024-04-05
爬蟲
爬蟲專案實戰（一）
2020-06-15
爬蟲
某微信公眾號2019年度文章列表
2019-12-30
Python實現微博爬蟲，爬取新浪微博
2020-12-14
Python爬蟲
爬蟲搭建代理池、爬取某網站影片案例、爬取新聞案例
2023-03-16
爬蟲網站
新手爬蟲教程：Python爬取知乎文章中的圖片
2019-01-17
爬蟲Python
如何用海外HTTP代理設定python爬蟲代理ip池？
2022-08-30
HTTPPython爬蟲

好玩的github專案-微信公眾號爬蟲 (只需設定代理, 一鍵可以爬取所有歷史文章)

相關文章