【爬蟲工具】下載部落格轉成Markdown的形式

我的孫女叫小芳發表於2019-02-16

原文網址 : https://flycode.co/archives/80445

爬蟲

簡單的爬蟲工具

下載部落格，並轉成Markdown的形式

為什麼要寫這個工具

主要是為了收集好的網上資源，每次看到一篇好的文章就像儲存下來，但是儲存網頁的可讀性太差了，如果轉換成Markdown的形式就很舒服。但是網頁中會有許多無聊的標籤干擾，於是寫個簡單的工具

使用的python庫

beautifulsoup4
requests
html2text

使用方法舉例

import html2md

url_list = [
        `http://blog.csdn.net/qq_37482544/article/details/63720726`, # csdn
        `https://www.jianshu.com/p/b6220e99df2d`, # jianshu
        `https://juejin.im/post/5a68437b6fb9a01ca47aabc6`, # juejin
        `https://segmentfault.com/a/1190000011929414`, # segmentfault
        `http://www.voidcn.com/article/p-giqfrkhb-bbr.html`, # 其他
        `https://www.cnblogs.com/zxqstrong/p/4789105.html`
    ]
for url in url_list:
    checkSite(url)

專案地址

https://github.com/No-96/Feng…

01、部落格爬蟲
2019-04-11
爬蟲
Markdown 寫部落格
2018-07-06
[雪峰磁針石部落格]python爬蟲cookbook1爬蟲入門
2018-09-10
Python爬蟲
【爬蟲】利用Python爬蟲爬取小麥苗itpub部落格的所有文章的連線地址（1）
2018-12-26
爬蟲Python
每天一個爬蟲-learnku我的部落格列表
2021-06-17
爬蟲
如何轉載CSDN部落格
2018-04-27
如何轉載部落格，很不錯的
2018-08-07
部落格園記錄：汽車引數爬蟲
2024-11-06
爬蟲
分享5個爬蟲專業部落格網站
2021-10-12
爬蟲網站
Go Markdown 部落格系統
2021-12-03
Go
小工具-markdown檔案匯入部落格園cnblogs
2024-11-20
【轉載】如何轉發部落格園中的文章
2024-10-29
中小學教材下載爬蟲
2020-07-24
爬蟲
爬蟲 Scrapy框架爬取圖蟲圖片並下載
2018-08-27
爬蟲框架
我的第一篇部落格（從爬蟲開始）
2020-09-29
爬蟲
Windows下安裝配置爬蟲工具Scrapy及爬蟲環境
2018-09-19
Windows爬蟲
Python 實用爬蟲-04-使用 BeautifulSoup 去水印下載 CSDN 部落格圖片
2019-06-16
Python爬蟲
ByBlog 支援markdown 書寫部落格
2019-05-11
Python爬蟲-部落格園首頁推薦部落格排行(整合詞雲+郵件傳送)
2019-05-14
Python爬蟲
【爬蟲】利用Python爬蟲爬取小麥苗itpub部落格的所有文章的連線地址並寫入Excel中（2）
2018-12-27
爬蟲PythonExcel
markdown 表格形式
2021-06-29
部落格園 Markdown 圖片本地上傳工具釋出新版了
2020-11-27
解決部落格園md格式部落格的下載與上傳問題
2024-03-10
使用 Markdown 自由地寫部落格
2020-11-15
Python爬蟲——批次爬取douyin影片，下載到本地
2024-12-06
Python爬蟲
GB標準文件爬蟲下載程式
2024-04-11
爬蟲
如何用python爬蟲下載小說？
2021-09-11
Python爬蟲
Python 爬蟲的工具鏈
2018-09-22
Python爬蟲
Python爬蟲入門教程 40-100 部落格園Python相關40W部落格抓取 scrapy
2019-02-25
Python爬蟲
[雪峰磁針石部落格]pythonGUI工具書籍下載-持續更新
2018-12-03
PythonNGUI
你的部落格可能被爬了
2019-07-25
爬取部落格園文章
2020-07-31
洛穀日報 & 原來部落格（轉載）
2020-11-15
1.markdown文件同步到部落格園
2024-08-11
部落格園主題美化（僅相容 Markdown）
2022-07-11
下載指定的 Tumblr 部落格中的圖片，影片。
2018-04-21
爬蟲福利----妹子圖網MM批量下載
2020-01-06
爬蟲
Python爬蟲批次下載電影連結
2021-09-09
Python爬蟲

【爬蟲工具】下載部落格轉成Markdown的形式

簡單的爬蟲工具

為什麼要寫這個工具

使用的python庫

目錄

使用方法舉例

專案地址

相關文章