爬蟲學習日記（五）

KIM曉峰發表於2018-12-14

本來應該昨天來做這個的，但是Cindy有了一個新的東西讓我去做。

Solr上面的跑SUDU的Crawler被block掉了，估計是經常爬取資料，被遮蔽了，Cindy姐說SUDU那邊只要訪問的是Linux的機子就都會被block掉了，說到這裡，突然想到，可以在請求頭修改我們這邊的系統的資訊嗎，就是偽造，到時候去查檢視。然後Cindy姐要去看看ssm的SUDU，裡面原先是用HttpClient來爬取資料的，看改用selenium能不能爬到資料。

然後我就去看了，發現大多數route裡面用的都是httpclient的方式，而我之前自學的也是用的httpclient。百度了一下，selenium是模擬使用者操作的而已，來完成一些操作，比較主要的功能就是獲取動態網頁的資料，就譬如，你在百度圖片裡面，剛開啟的時候，是隻會顯示一部分圖片的，只有當你有往下拉的操作的時候，才會載入出後面的圖片。你用普通的方式爬，就只能爬到剛開始顯示出來的資料。但是用selenium就能實現這個滾動的功能，好像有方法，是可以模擬滾動的，而且我也看到了其他的方法，可以實現點選和其他的動作。

我新建了一個類，繼承了原先那些crawler要繼承的東西，因為要返回跟之前一樣的東西嘛。傳進來跟以前一樣的資料，只是我不對他進行處理，直接，模仿寫vessel的方式，呼叫之前的方法宣告瞭一個WebDriver物件，傳url進去，getPageSource返回原始碼，放在log裡面。commit，傳送請求，成功。

本來今天想繼續完成QA裡面在Excel加多幾欄的需求的，剛剛Cindy要我把SUDU換成selenium的方式，哈哈哈哈。臥槽，這個有點難吧，雖然好像也不是很難，哈哈哈，但還是比寫QA要難吧我覺得，這個真的就是後臺的東西，慢慢來咯，QA的東西只能先放放了。

那就這樣吧，到時候開始做了再寫寫一些新心得體會。

感覺又沒寫什麼，但是碼了這麼多刪掉有點可惜。後面寫QA的時候再繼續往下寫吧。

和狗子一起成為更好的人。

爬蟲學習日記（六）
2019-01-14
爬蟲
爬蟲學習日記（八）
2019-01-18
爬蟲
爬蟲學習日記（七）
2019-01-15
爬蟲
爬蟲學習日記（三）
2018-12-07
爬蟲
爬蟲學習日記（二）
2018-11-28
爬蟲
爬蟲學習日記（一）
2018-11-28
爬蟲
爬蟲學習日記（十二）解析PDF
2019-03-18
爬蟲
爬蟲學習日記（四）分析Freenium
2018-12-12
爬蟲
爬蟲學習日記（六）完成第一個爬蟲任務
2019-01-10
爬蟲
爬蟲學習日記（十）selenium frame的切換
2019-03-12
爬蟲
爬蟲學習日記（十一）selenium 頁面元素更新
2019-03-14
爬蟲
【Python學習】爬蟲爬蟲爬蟲爬蟲~
2018-05-03
Python爬蟲
python爬蟲—學習筆記-4
2024-04-23
Python爬蟲筆記
python爬蟲—學習筆記-2
2024-04-10
Python爬蟲筆記
Python爬蟲學習筆記(三)
2021-01-30
Python爬蟲筆記
python爬蟲學習筆記（二）
2020-11-24
Python爬蟲筆記
python爬蟲日記01
2021-05-11
Python爬蟲
爬蟲入門學習筆記3
2021-01-05
爬蟲筆記
爬蟲學習筆記：練習爬取多頁天涯帖子
2019-02-16
爬蟲筆記
一入爬蟲深似海，總結python爬蟲學習筆記！
2019-02-14
爬蟲Python筆記
爬蟲學習日記（九）Selenium點選事件超時改用執行JS
2019-03-04
爬蟲事件JS
Python 開發簡單爬蟲 (學習筆記)
2019-08-05
Python爬蟲筆記
爬蟲學習-初次上路
2020-11-21
爬蟲
selenium爬蟲學習1
2024-08-29
爬蟲
python爬蟲學習1
2020-11-29
Python爬蟲
AngularJS學習日記（五）UI-Route
2018-11-29
AngularJSUI
什麼是爬蟲?學習Python爬蟲難不難?
2019-11-05
爬蟲Python
python爬蟲是什麼?學習python爬蟲難嗎
2021-03-31
Python爬蟲
一個Python爬蟲工程師學習養成記
2020-06-29
Python爬蟲工程師
Python爬蟲學習筆記（三、儲存資料）
2020-10-03
Python爬蟲筆記
Android 淘寶爬蟲學習
2019-03-18
Android爬蟲
11.18爬蟲學習（BeautifulSoup類）
2024-11-18
爬蟲
逆向爬蟲知識學習
2022-03-21
爬蟲
Python學習筆記——爬蟲之Scrapy專案實戰
2018-09-03
Python筆記爬蟲
python爬蟲學習筆記4-正規表示式
2020-12-12
Python爬蟲筆記
python爬蟲js逆向學習（二）
2020-07-03
Python爬蟲JS
爬蟲之CSS語法學習
2024-10-23
爬蟲CSS
為什麼學習python及爬蟲，Python爬蟲[入門篇]？
2018-11-21
Python爬蟲

爬蟲學習日記（五）

相關文章