學習筆記 - 如何一次性獲得頁面所有URL

茅五發表於2020-12-05

 

 

1、需求

自己電腦是window 10作業系統,想獲得自己部落格的所有文章URL列表,比如下面:

 

2、實現方法

比較笨的是,一個個點開,然後在上面的輸入框裡面copy出來,這種是最笨的辦法,但是太累了,效率比較低,面對幾百上千個部落格文章,那要累死人了,有什麼比較搞笑的辦法沒有,發動腦筋思考了下,想到了一個稍微高效一點點的辦法。

 

2.1 部落格列表右鍵檢視原始碼

 

開啟如下所示,是一頁html指令碼程式碼

 

 

2.2 並把原始碼的所有html程式碼copy出來

Ctrl + a 全選中,Ctrl + c 直接全部複製到1.txt檔案裡面,用Notepadd++開啟1.txt,就可以看到所有的當前部落格列表裡面的所有文章url了,html程式碼有些多,搜尋data-articleid就能發現了。

 

2.3 git cmd命令將這些url都找出來

開啟git cmd視窗,使用命令 more 1.txt |grep https://moneyfree.blog.csdn.net/article/details 就可以找到所有的url列表

 

 

3、總結

這裡最核心的就是以下兩點

a、檢視原始碼,原始碼裡面有url資訊

b、git cmd支援linux命令,能根據關鍵字通過grep過濾出來所有的url資訊

 

相關文章