Python爬蟲群作業-Week3-BeautifulSoup
經過不太努力的嘗試,今天把BeautifulSoup的爬蟲也做出來了。
上面是向右老師的糗事百科示例:
import requests
from bs4 import BeautifulSoup
html = requests.get('http://www.qiushibaike.com/text/').content
soup = BeautifulSoup(html,'lxml')
links = soup.select('a.contentHerf > div > span')
for link in links:
print link.get_text()
下面是我爬的煎蛋網的段子。
import requests
from bs4 import BeautifulSoup
html = requests.get('http://jandan.net/duan/').content
soup = BeautifulSoup(html,'lxml')
links = soup.find_all('div',class_="text")
for link in links:
print link.p.get_text()
因為這兒的段子是用< p>分隔的,所以主要在最後一行列印的p.get_text()
小結一:感覺BS的比XPath的好用一些;
小結二:還是要熟悉網頁結構,避免徒勞的排列組合嘗試。要好好的把html再學習一下。
<blockquote>下週計劃:1. 學習html
2.繼續看書和視訊
3.把向右老師的三篇文章繼續好好理解,爭取獨立自主的爬個網頁
4.如果還有餘力,爭取學會把資料寫入excel表。</blockquote>
然後就差不多大功告成了吧~
相關文章
- 爬蟲作業一爬蟲
- 【Python學習】爬蟲爬蟲爬蟲爬蟲~Python爬蟲
- 【python爬蟲】python爬蟲demoPython爬蟲
- 二期Python爬蟲作業No.1一簡書Python爬蟲
- python爬蟲---網頁爬蟲,圖片爬蟲,文章爬蟲,Python爬蟲爬取新聞網站新聞Python爬蟲網頁網站
- python就是爬蟲嗎-python就是爬蟲嗎Python爬蟲
- python爬蟲利用requests製作代理池sPython爬蟲
- python爬蟲Python爬蟲
- python 爬蟲Python爬蟲
- Python爬蟲教程-01-爬蟲介紹Python爬蟲
- Java爬蟲與Python爬蟲的區別?Java爬蟲Python
- python爬蟲初探--第一個python爬蟲專案Python爬蟲
- Python asyncio 爬蟲Python爬蟲
- python爬蟲2Python爬蟲
- Python爬蟲——XPathPython爬蟲
- Python 爬蟲系列Python爬蟲
- Python爬蟲-xpathPython爬蟲
- Python爬蟲--2Python爬蟲
- python網路爬蟲_Python爬蟲:30個小時搞定Python網路爬蟲視訊教程Python爬蟲
- 什麼是Python爬蟲?python爬蟲入門難嗎?Python爬蟲
- python爬蟲是什麼?學習python爬蟲難嗎Python爬蟲
- 什麼是Python爬蟲?Python爬蟲常用框架有哪些?Python爬蟲框架
- 【Python爬蟲9】Python網路爬蟲例項實戰Python爬蟲
- Python爬蟲入門教程 50-100 Python3爬蟲爬取VIP視訊-Python爬蟲6操作Python爬蟲
- 網路爬蟲如何運作?爬蟲
- 【python--爬蟲】彼岸圖網高清桌布爬蟲Python爬蟲
- 什麼是爬蟲?Python爬蟲框架有哪些?爬蟲Python框架
- 【爬蟲】python爬蟲從入門到放棄爬蟲Python
- Python爬蟲之路-chrome在爬蟲中的使用Python爬蟲Chrome
- Python爬蟲與Java爬蟲有何區別?Python爬蟲Java
- python爬蟲實戰,爬蟲之路,永無止境Python爬蟲
- Python爬蟲(1.爬蟲的基本概念)Python爬蟲
- 圖靈樣書爬蟲 - Python 爬蟲實戰圖靈爬蟲Python
- 不踩坑的Python爬蟲:Python爬蟲開發與專案實戰,從爬蟲入門 PythonPython爬蟲
- python爬蟲-33個Python爬蟲專案實戰(推薦)Python爬蟲
- Python爬蟲可以幹什麼?Python爬蟲有什麼用?Python爬蟲
- Python分散式爬蟲(三) - 爬蟲基礎知識Python分散式爬蟲
- python網路爬蟲(14)使用Scrapy搭建爬蟲框架Python爬蟲框架