傾情奉獻 部落格園部落格下載工具 完美下載所有部落格 儲存格式為DOC,PDF,EPUB,XPS

資訊化建設發表於2013-06-23

做技術經常要查詢資料,也有儲存收藏資料的習慣。 部落格園是個好地方,資料的質量比較高,整體關注某一個系列的資料,從這邊入手會比較好。我自己也經常寫部落格,收集有用的技術資料。在前年,我設計了一套Data Solution解決方案,後來因多方原因擱淺,沒有深入下去。具體內容請參考相關連線,地址是http://www.cnblogs.com/JamesLi2015/archive/2011/11.html

Data Solution中有一個重要的元件是爬蟲。從部落格園中抓取文章到本地檔案,可以儲存為DOC,PDF,XPS,EPUB等多種格式。最近在群(QQ群: 1637 21037) 裡面有需求是要備份部落格內容,正好我有這個元件,於是整理一下,奉獻給大家下載使用。

整個程式只有一個介面,不需要第三方執行庫,編譯時以.NET 4為編譯平臺。如果不能執行,請先下載.NET 4 執行庫。

image

有二種方法下載部落格知識文章。一種方法是以博主Id為主,我把它放在User Id皮膚中。如上圖所示

輸入的資料格式是:

http://www.cnblogs.com/dudu/
http://www.cnblogs.com/JamesLi2015/

之後點選Start即可開始下載。

第二種方式是,從一堆html文字中,下載這裡麵包含的html文章,比如,我比較喜歡一個系列的文章,你可以進去找到相關的聯接,拷貝到這裡,點Analysis分析一下有多少聯接,再根據需要選擇,再點Start開始下載。

image

以我的喜好,我把這個網頁中的 http://www.cnblogs.com/AllBloggers.aspx

排名前300的文字拷貝到Text皮膚中,點Analysi按鈕,再點Select All按鈕,進行下載。

配置頁面的內容是儲存格式的配置
image

預設勾選DOC格式,以Word 2003的格式儲存。Remove Temp File是下載完成後,刪掉中間檔案。

這就是全部的內容。這個工具可以用來下載你喜歡的專題或是博主文章。

來看一下效果,最終下載完成後的效果:

image

 

1  儲存為DOC格式是必須的,這個可以編輯,修改,剪下。再延伸一點,你可以把喜歡的片段儲存到自己的知識庫中。

以我自己的方式,我喜歡EverNote,2.2 綠色版,不到8M的大小,與資料庫檔案放在一起。

image

2 PDF,XPS為只讀格式,如果你不想要,可以從Configuration皮膚中去掉,不勾選。

3 EPUB格式是方便手機閱讀的,雖然手機中用Office 格式看也可以,以我的經驗,不理想,螢幕小,上下左右移動很頻繁。我這邊沒有測試EPUB格式的手機,如果EPUB格式有問題,請向我報告問題。

4  暫時只支援部落格園,其它的流行的部落格有的有問題,待完整測試後再整合進去。寧可讓系統穩定,少一點功能,也不希望看到經常崩潰或是莫名奇妙的問題出現。

 

程式下載地址: Document Exporter

有好的建議或是問題報告,請加群或是給我寫郵件,謝謝支援。

 

1.1 版已經更新,請大家重新下載新的檔案。

1.  可支援下載附件。如果文章中有附件,也會同時將附件下載到與文章相同的目錄中,當前支援格式為ZIP和RAR。

2.  目錄文字框可以選擇目錄。

3.  可支援下載取消。

 

相關文章