PJzhang:搜尋引擎高階語法與滲透測試

PJzhang白話安全發表於2019-05-24

貓寧!!!

參考連結:

https://www.freebuf.com/articles/network/169601.html

https://www.jianshu.com/p/f8062e2cc1d7

 

百度搜尋高階語法很多,但在滲透測試中有效的語法也就10多個,它們通過自由組合,幫我們實現高效搜尋目標。

相比語法,語法的應用場景更為關鍵,exp-db中的google hacking提供了大量的參考場景,給我們提供了多種多樣的彈藥。

https://www.exploit-db.com/google-hacking-database

 

能用百度演示,就不用了谷歌了,原因結尾說。

 

雙引號 "" ,英文雙引號,鎖定關鍵詞

我試了一下百度,"百度網盤"加引號與不加引號搜尋結果區別不大,藉助谷歌。

不加引號,你看網頁說明出,還有 百度 這個結果標紅,搜尋結果1.36億條。

加引號,截圖之外的網頁說明處也都是標紅 百度網盤 這個關鍵詞,更精準,搜尋結果3800萬條。

 

加號,讓搜尋中儘可能出現加號之後的關鍵詞,這個功能在谷歌和百度中都比較雞肋。星號,英文的小點以及“~”用處同樣不明顯。搜尋引擎高階語法本身也是區分可用性程度的。

百度 +網盤,百度 網盤,沒有什麼大的差別,雖然搜尋結果上 百度 網盤 的結果是前者的2倍,但對使用者沒產生明顯影響。

 

減號,讓搜尋中儘可能不出現減號之後的關鍵詞

搜尋百度會有 百度一下,結果1億條。

採用減號,百度 -一下,可見效果還是比較顯著的,截圖之外也如此,結果也是1580萬條,較少。

 

site語法,site:qq.com,可以看到很多騰訊公司的子域名,有助於騰訊公司域名資產的收集,對於其他域名是同樣道理。

 

filetype語法,filetype:pdf,搜尋出來的幾乎全都是pdf文件,pdf也可以替代,例如ppt/doc/xls等文件型別均可,如果使用谷歌php/asp/action/aspx這種字尾也可以搜尋。

 

cache語法,cache:www.pku.edu.cn,可以找到北京大學主頁的快取,但是需要用谷歌,百度不支援,快取的是2天前的。

 

info語法,可以顯示在標題,url,網頁說明中的關鍵詞資訊,info:pku.edu.cn,可以看到很多的郵箱,子域名以及外鏈的資訊,可以和別的語法先後使用,獲取更多資訊。

 

phonebook語法,phonebook:russia,可以顯示俄羅斯的開源個人電話資訊查詢站點,可以認為是開源社工庫,當然USA/UK等國家的也都可以找到。

 

 

 link,define,inanchor,datarange,related,music,movie,wheather等語法處境和加號類似,應用場景不是很多,可用性較差,但並不代表它們是沒用的,只是在滲透測試資訊收集中作用不明顯。

 

接下來介紹的是很重要的6個語法。

intitle語法,intitle:後臺,這個時候會發現能看到很多的後臺站點出現,而在站點標題無疑都有後臺這個字眼,當然換成別的詞彙或者英文都是可以的。

allintitle語法,allintitle:後臺 登入,標題中儘可能顯示後臺和登入兩個關鍵詞。

intitle:後臺 intitle:登入 ,可以搜到更多結果,而且在中文字元上百度遠好過谷歌,谷歌對於顯示的頁數有限制,只能檢視20個頁面的結果。

intitle:後臺 登入,則表示標題一定要有後臺,但是 登入 可以出現在網頁說明中。

不過實際上,搜尋語法與最終顯示結果並不是絕對的,只能說不同的語法更傾向於某種搜尋結果。

能用intitle最好不選用allintitle。

 intext語法,intext:百度,因為百度不明顯,這個用谷歌展示,在網頁說明中會出現 百度 這個關鍵詞的字眼。

allintext語法,allintext:百度 周鴻禕,在網頁說明中有百度 周鴻禕 兩個關鍵詞同時出現。allintext:周鴻禕 百度,兩個關鍵詞調轉位置,結果基本一樣。

inurl語法,inurl:admin,在網頁URL中一定含有admin這個關鍵詞,administrator也是包含admin的,一般這樣的站點多是後臺。

allinurl語法,allinurl:admin login,在URL中含有admin,login,百度表現不明顯,用谷歌展示出來。

 現在說一些組合語法

intitle:index.of,其中的點表示一個單字元,index.of出現在標題中,開啟第一個連結,這種型別目錄可以發現很多。

 intext:"the WordPress" inurl:wp-config ext:txt,網頁說明精準含有the WordPress這個關鍵詞,url中含有wp-config,連結的副檔名是txt檔案,包含對方的配置檔案資訊。

 intitle: "Index of" intext:log,在網頁標題中精準含有Index of,網頁說明中含有log關鍵詞,獲取一些日誌類檔案。

 site:com inurl:jboss filetype:log -github.com,站點一定是com的,url中含有jboss,檔案型別是log,並且不能是來自github。

filetype:mdb inurl:com,檔案型別是mdb的資料庫檔案,url中含有com,可以獲取大量的資料庫檔案。

這裡就用5個例子說明一下,場景一方面是參考他人案例,另外自己也需要根據實踐,採用適合的組合拳。

 

搜尋引擎高階語法需要掌握,搜尋引擎直接提供的高階搜尋框也應該熟悉裡面各個選項的用途,在實際使用中也許更高效。

這是谷歌的高階搜尋框,還有一大堆的解釋說明,比較貼心。

還有搜尋框工具,可以快速調節時間還有結果型別,verbatim是精準匹配的意思。

這是百度的高階搜尋框,相比谷歌少了語言和地區選項,其他基本一樣,倒是顯得簡約不少。

百度的搜尋框工具倒是更齊全,除了時間還有檔案型別,以及站點鎖定功能,即使日常用起來也可以帶來不少便利。

 

谷歌作為一個全球性搜尋引擎,在爬取全球各國各地區網頁上不遺餘力,百度主要夠專注於中國市場,在中文搜尋上還是要略勝一籌,百度自建的這個生態可謂相當重要,例如百度百科,百度知道,百度文件等,因此在搜尋國內站點時,谷歌百度結合使用會更好,而且谷歌對於頻繁訪問的行為還進行人機識別,但是國內訪問百度還沒有遇到過。

此外在國內,除去百度其他搜尋也有自己的特色。

搜狗搜尋,其中的搜狗微信和搜狗知乎是百度所欠缺的,也是搜狗獨有特色,目前微信APP搜尋功能顯示結果很多就是搜狗的結果。

https://www.sogou.com/

微軟必應搜尋,目前國內的搜狗英文還有360英文搜尋採用的都是必應提供技術支援,國外的雅虎搜尋,除去雅虎日本外,也是完全由必應提供搜尋技術支撐,必應學術在搜尋英文文獻上比百度好很多,可以一定程度替代谷歌。即使在國內如果搜尋英文技術文章,使用必應國際版,也是很好的。

https://cn.bing.com

國內還有的神馬搜尋,只做移動端;360搜尋,靠360瀏覽器、360導航、360安全衛士引流量;中國搜尋,號稱搜尋引擎國家隊。這幾個很多搜尋引擎高階語法都不怎麼支援。

 

選擇百度來演示,並不是說百度比谷歌好,而是為了說百度有自己天然的本土優勢,對中國站點資訊收集,絕對不能輕視。

目前掌握搜尋引擎核心技術的國家有4個,中國,美國,俄羅斯,韓國。

俄羅斯的yandex是獨聯體國家市場份額最大的一家,如同百度在中國地位,在site收集國內站點子域名的時候,可以給你帶來意想不到的收穫,不過也有人機識別認證,如果收集俄語資訊,yandex是你繞不開的一個,此外俄羅斯的mail.ru搜尋也佔據較大市場,主營社交軟體、郵箱和視訊業務,主要做俄語搜尋。

yandex英文版

mail.ru俄語版

https://mail.ru/

韓國人的第一大搜尋引擎同樣不是谷歌,而是Naver搜尋,而且該公司是著名社交軟體Line的開發者,朝鮮語的搜尋領域也是不可或缺的。

 

國外的一個號稱隱私保護搜尋站點DuckDuckGo搜尋千萬不要錯過,尤其是對於注重隱私的人,每次訪問這個網站就相當於第一次訪問,它們的盈利手段是基於關鍵詞來展示廣告,而不是跟蹤分析你的喜好來展現。

DuckDuckGo,開啟直接顯示中文,對於隱私保護,我有點質疑。

https://duckduckgo.com

 

美國人的一個手冊,google hacking:滲透測試者的利劍,對谷歌搜尋語法進行了詳盡分析,京東有售中文翻譯版。

這裡有一個PPT版的,而且是書的作者早年做的。

http://www.mrjoeyjohnson.com/Google.Hacking.Filters.pdf

 

防止資訊洩露和伺服器入侵的措施:(來自freebuf-K0rz3n)

1.檢查所有的文件能否被Google搜尋到,避免敏感檔案能出現在公眾的視野中

2.選擇一個強大的自動化工具來掃描你網站上是否有資訊的洩露

3.不要使用預設的登入入口,以防止登入入口被hacker猜解

4.關閉資料庫的遠端管理工具

5.刪除明顯的顯示軟體版本的資訊

6.配置伺服器只能下載特定的檔案型別(白名單比黑名單要簡單有效得多)

7.正確的配置你的伺服器,不要抱有僥倖心理,任何的鬆懈帶來的災難是巨大的

8.不要把原始碼的備份放在未經授權就能訪問的地方,並且及時刪除網站上的無用的備份檔案

9.不要使用弱密碼,防止攻擊者輕易攻破後臺

10.登入請加上強度相對較高的驗證手段,防止攻擊者採用爆破的手段

11.關閉伺服器不必要的埠

12.請不要使用網站上的任何資訊作為密碼,否則都屬於容易爆破的型別

13.備份的原始碼請經過專業的混淆,防止被下載之後輕易讀取到內容

14.及時更新伺服器的系統,修復潛在的漏洞

15.安裝正規的安全防護軟體

 

破除一個誤解,千萬不要以為常規搜尋引擎就可以覆蓋大部分,不是如此,淘寶,京東,亞馬遜,wikihow,以及一些垂直的專業類站點都是很重要的資訊獲取途徑,現在這個時代資訊很多,這也造成了更多的資訊鴻溝和資訊壁壘,人與人之間的資訊不對等反而愈發擴大,如何高效獲取有效且專業及時的資訊,顯得尤為必要。

 

相關文章