# About Me 葉柏毅 Alex Contact: alrex5401@gmail.com Linkedin:https://www.linkedin.com/in/alrex5401/ # CEH上課筆記-Google Hacking ## Google Hacking Google Search: ### Logical operator AND NOT (-) OR (|) ### Symbols ~ (synonyms and similar words) " (particular phrase) . (single-character wildcard) * (single-word wildcard) ### Operator site: (搜尋特定網址) inurl: (搜尋特定連結) intext: (搜尋網頁內文字) intitle: (搜尋網頁標題) filetype: (搜尋特定檔案格式) link: (搜尋互相連結的網頁) "index of" (搜尋開放目錄瀏覽) cache: (顯示網頁在google中的暫存資料) ### 如何防止Google Hacking #### robots.txt user-agent: * 表示:第1行宣告下面的規則適用於所有網路蜘蛛 disallow: /cig-bin 表示:禁止存取cgi-bin目錄中的資訊 disallow:/members/data 表示:members目錄底下的 data目錄不希望被擷取,但members目錄底下如有其他目錄存在則不受影響 disallow:/*.pdf$ 表示:所有PDF格式的檔案禁止擷取,必須注意的是附檔名後面要加 上「$」符號 #### HTML\<head> <META NAME="ROBOTS" CONTENT="NOINDEX"> 表示:不希望搜尋引擎處理、儲存這個網頁。 <META NAME="ROBOTS" CONTENT="NOARCHIVE"> 表示:希望搜尋引擎處理這個網頁,但是不儲存網頁,也就是說,不會有庫存頁。 <META NAME="ROBOTS" CONTENT="NOFOLLOW"> 表示:希望搜尋引擎處理這個網頁,但是不繼續處理這個網頁中另外連結的網頁。 <META NAME="ROBOTS" CONTENT="NOINDEX,NOFOLLOW"> 表示:不希望搜尋引擎處理、儲存這個網頁,以及這個網頁中另外連結的所有資訊。 #### 參考資料 [NISRA 資訊安全研究會](https://sites.google.com/a/nisra.net/nisra/user/bear/google-hacking) [Google Hacking Database](https://www.exploit-db.com/google-hacking-database)