用java爬取京東商品頁注意點

zjhgx發表於2024-12-08

1. 爬取商品頁時,需要在header裡帶上cookie,否則會返回302跳轉到一個驗證頁面。

2. 如果頁面返回的是亂碼,是由於header的 "accept-encoding" 裡有一個br,此時response的 contentEncoding是 “br”,把“accept-encoding”的br去掉就可以了

(response.contentEncoding()

相關文章