關於爬蟲工具 colly 的問題

aidongsheng發表於2018-12-07
c.OnHTML("div[class] p", func(element *colly.HTMLElement) {
        //能否在此處獲取所有想獲取的 html 元素資訊並插入資料庫獲取其他
        //用途,而不是另外再開闢一個 c.OnHTML 回撥函式?
    })

比如說我不止想獲得所有的 "div[class] p" ,還想獲得 "div[class] a" 等等,根據我的測試,當我執行多個 c.OnHTML 程式碼塊時,回撥總是按照上下順序依次執行,這樣我就不能同時獲取到 同一個 "div[class]" 下面的元素資訊了。 因為剛接觸爬蟲技術,並且對 html 不是那麼熟悉,不知道我描述得清不清楚?

更多原創文章乾貨分享,請關注公眾號
  • 關於爬蟲工具 colly 的問題
  • 加微信實戰群請加微信(註明:實戰群):gocnio

相關文章