爬取微信公眾號文章工具

luler發表於2021-03-31

準備條件

  • 執行環境php7.0+
  • mysql資料庫
  • 一個公眾號

安裝

github地址(自覺給星喲):github.com/luler/weixin_article_sp...

git clone https://github.com/luler/weixin_article_spider.git

配置

編輯專案目錄下的.env檔案

[database]
TYPE=mysql
HOSTNAME=192.168.0.3
DATABASE=weixin_article
USERNAME=root
PASSWORD=root
HOSTPORT=3306
CHARSET=utf8mb4
PREFIX=zc_

[wechat_config]
#公眾號完整名稱,多個用逗號隔開
wechat_list=智慧莞工,東莞理工學院
token='登入公眾號後,F12開啟Network,隨便從某個介面獲取到token'
cookie='登入公眾號後,F12開啟Network,隨便從某個介面獲取到cookie'

執行

sh spider.sh

注意點

  • 該程式不能自動登入微信公眾號,需要使用者自己登陸自己可以登陸的公眾號,獲取到相應的配置

  • 每次獲取到的公眾號cookie等資訊都是有有效期的,大概幾小時吧

  • 執行太多次,可能會被微信發現,對介面進行封禁,這個時候不要急,最多等24小時,再次登入公眾號獲取配置,再次執行就可以了,建議多個公眾號做備用

相關截圖

  • 登入公眾號後獲取關鍵配置

爬取微信公眾號文章工具

  • 抓取到的資料(部分欄位)

爬取微信公眾號文章工具

  • 微信流控產生(這時候需要更換公眾號cookie等資訊,或者等待一段時間再重試)

爬取微信公眾號文章工具

討論一下

部落格:爬取微信公眾號文章工具

本作品採用《CC 協議》,轉載必須註明作者和本文連結
我只想看看藍天

相關文章