學習筆記：robots.txt檔案

ScopeAstro發表於2024-08-29

原文網址 : https://www.cnblogs.com/DanielSong/p/18387662

筆記

1.1 介紹

robots.txt檔案是一種用於指導搜尋引擎爬蟲在網站上哪些頁面可以被抓取，哪些頁面不應該被抓取的文字檔案。這個檔案通常放置在網站的根目錄下。

1.2 由來

robots.txt標準最早出自1994年，由荷蘭的網路管理員和搜尋引擎專家Martijn Koster編寫。最初稱為"Robots Exclusion"標準。

1.3 作用

提供網站管理員一種方式，使他們能夠指導搜尋引擎爬蟲如何訪問他們的網站。
協助網站管理者更好地控制他們網站上的資訊被搜尋引擎檢索的方式。

1.4 語法示例

User-agent: *
Disallow: /private/
Allow: /public/

User-agent: * 表示這個規則適用於所有的爬蟲。
Disallow: /private/ 表示不允許爬蟲訪問/private/路徑。
Allow: /public/ 表示允許爬蟲訪問/public/路徑。

1.5 建立和維護

由網站的管理員或所有者建立和維護。
位於網站的根目錄下。

1.6 遵循與忽略

大多數搜尋引擎通常會遵循robots.txt檔案中的規定，但並非所有爬蟲都遵循這個協議。
一些不誠實或惡意的爬蟲可能會選擇忽略robots.txt檔案中的規則。

1.7 強制力

robots.txt協議本身並不具有強制力。
遵守這個協議是出於各方的自願和合作。

1.8 安全考慮

對於一些不守規矩的爬蟲，網站管理員可能需要考慮其他更強大的安全措施來保護他們的網站免受不受歡迎的訪問。

總體來說，robots.txt仍然是網路管理中一個有用的工具，用於指導搜尋引擎爬蟲的行為，但它並非是絕對可靠的安全措施。在考慮網站安全性時，網站管理員可能需要綜合考慮其他手段。

DVWA-檔案包含學習筆記
2019-05-19
筆記
忽略某些檔案 —— Git 學習筆記 05
2020-04-04
Git筆記
Python學習筆記|Python之檔案操作
2018-12-21
Python筆記
Python學習筆記|Python之特殊檔案
2018-12-21
Python筆記
C++學習筆記----讀寫檔案
2024-06-24
C++筆記
VC++學習筆記---配置檔案（一） ini檔案和proprities
2018-04-08
C++筆記
python學習筆記：第8天檔案操作
2018-10-26
Python筆記
Android學習筆記之build.gradle檔案
2018-08-08
Android筆記UIGradle
JVM學習筆記——Class類檔案解讀
2019-02-18
JVM筆記
Laravel 學習筆記一: 專案框架和配置檔案
2022-07-31
Laravel筆記框架
Linux 學習筆記--檔案打包與解壓縮
2020-04-08
Linux筆記
4、Linux入門學習筆記檔案操作命令
2020-11-04
Linux筆記
【PB案例學習筆記】-04檔案瀏覽器
2024-06-10
筆記瀏覽器
Python零基礎學習筆記（三十）——讀檔案
2019-01-25
Python筆記
vim學習筆記——多檔案、多視窗編輯
2024-07-04
筆記
搜尋引擎指南robots.txt檔案
2020-04-05
Qt 程式設計 —— 專案工程檔案（.pro）介紹【學習筆記】
2020-10-06
QT程式設計筆記
Angular 專案裡 angular.json 檔案內容的學習筆記
2021-05-03
AngularJSON筆記
Android學習筆記之AndroidManifest.xml檔案解析(詳解)
2018-11-13
Android筆記XML
Linux學習筆記：rm刪除檔案和資料夾
2018-08-16
Linux筆記
Linux 學習筆記--環境變數與檔案查詢
2020-04-07
Linux筆記變數
Linux 學習筆記--目錄結構及檔案基本操作
2020-04-06
Linux筆記
libigl專案102學習筆記
2020-11-21
筆記
Mybatis 學習筆記（一）——配置檔案SqlMapConfig.xml和對映檔案Mapper.xml
2018-10-13
MyBatis筆記SQLXMLAPP
實習筆記之 components 包下檔案描述
2024-04-07
筆記
Linux 學習筆記--使用者及檔案許可權管理
2020-04-06
Linux筆記
Android學習筆記之檔案分類和線性佈局
2024-07-25
Android筆記
numpy的學習筆記\pandas學習筆記
2018-03-18
筆記
學習筆記專案實踐（python）
2020-10-03
筆記Python
build.prop檔案學習記錄
2024-11-02
UI
Python 3 學習筆記之——鍵盤輸入和讀寫檔案
2018-10-24
Python筆記
學習筆記(30):Python資料清洗實戰-Excel檔案讀寫
2020-02-21
筆記PythonExcel
Django2學習筆記--引用本地靜態檔案css，js等
2020-11-07
Django筆記CSSJS
UI自動化學習筆記- Selenium操作檔案上傳下載
2021-08-09
UI筆記
OpenXml SDK學習筆記（4）：設定檔案級別的樣式
2021-11-10
XML筆記
學習筆記
2024-04-14
筆記
字幕檔案srt筆記
2020-11-10
筆記
hadoop學習筆記：執行wordcount對檔案字串進行統計案例
2021-10-20
Hadoop筆記字串

學習筆記：robots.txt檔案

1.1 介紹

1.2 由來

1.3 作用

1.4 語法示例

1.5 建立和維護

1.6 遵循與忽略

1.7 強制力

1.8 安全考慮

相關文章