Keynote - A New Era of SSRF - Exploiting URL Parser in Trending Programming Languages!

# Keynote - A New Era of SSRF - Exploiting URL Parser in Trending Programming Languages! ### [R0]Keynote - A New Era of SSRF - Exploiting URL Parser in Trending Programming Languages! ### [slide](https://www.blackhat.com/docs/us-17/thursday/us-17-Tsai-A-New-Era-Of-SSRF-Exploiting-URL-Parser-In-Trending-Programming-Languages.pdf) [Case Study - How I Chained 4 vulnerabilities on GitHub Enterprise, From SSRF Execution Chain to RCE!](http://blog.orange.tw/2017/07/how-i-chained-4-vulnerabilities-on.html) SSRF網頁安全的攻擊手法 * 2008被提出 * 因XXE(Attack through XML)而繁榮 SSRF漏洞一再出現在臉書和google中 - 預覽功能 - 網址上傳圖片（內網網址->無視防火牆保護去抓圖） - http://orange/logo.gif (normal) - http://10.0.56.254/logo.gif (abnormal) 熟悉SSRF新的攻擊手法很重要，讓SSRF重返榮耀 SSRF漏洞：繞過防火牆碰觸到內網資源，企業內網越大，攻擊力越強如何進一步利用SSRF？(很吃基本功：對**網路架構**的了解) SSRF仍然常見，所以了解是必要的 SSRF可繞過防火牆去取得內網資源，內網資源越多，SSRF的觸碰面越多，被攻擊面也越多從一些有趣的案例來介紹 * SSRF bypass * protocol smuggling ## What Is SSRF Server Side Request Forgery * 繞過防火牆，碰觸到內網資源 * 被戲稱為專打有錢人的漏洞, 因為有錢人的內網比較大(SSRF攻擊力道愈大) * XSPA (Cross Site Port Attack, 概念似 side channel attack) attack:based on 時間差可知哪些port 有開，可作port scan -> 有開哪些services * http://10.0.56.254:80 -OK * http://10.0..56.254:81 -Timeout * http://10.0.56.254:82 -Timeout * ![內網中的服務使用的不同的lib，可能會有不同的解讀](https://i.imgur.com/zhwF8q5.png) 例如：python 抓某網址之內容時，不同之內建http lib的解析會不同。 ## SSRF Digging - 常見參數？url,link, src, target, u, imageURL, host - 從網址上傳？ - 資源 import/文章中網址？ - URL 預覽; 分享連結(since tittle or meta data needs server-side information) - 有無存取 web server (Tool: Skull security) - DNS 有無來存取 (Tool: Dnslogger) - Special XML insert - schemaLocation - noNamespeaceSchemaLocation - Xlnclude - XML External Entity (XXE): XML 中，定義變數 - 特殊 SSRF 的地方(下敘為弱點) - Oracle UTL_HTTP：?id=1 and 1=1 - ImageTragick：SSRF.gif(.mvg) - FFMPEG：SSRF.m3u8(加字幕功能) - HTTPoxy：HTTP request header 會被取代成環境變數 incording to CGI spec - HTTP lib 將環境變數 http_proxy 當作 proxy 使用 e.g. CURL - SVG to SSRF：SVG Parser implement 抓取外部資源 ## Protocol Smuggling in SSRF * Make SSRF more powerful * HTTP based protocol: Elastic, CouchDB, MongoDB, Docker（可被攻擊的內網服務） * Text-based protocol: FTP, SMTP * 在原有的協議中走私其他的協議 * SMTP 的 protocol 是 line by line * 利用 CR-LF injection 將 payload 插到 HTTP protocol 中 * 現在的SMTP Server 會阻止HTTP connection * if SMTP connection 第一行有 HTTP pattern then close connection * GOPHER(a protocol (?)) ### HTTPS 中偽造 SMTP(:25/) HTTPS Protocol 所有訊息都會在SSL中被加密，那如何在HTTPS中偽造SMTP? ->思考有哪些東西在SSL/HTTPS中不會被加密？->SNI(Server Name Indication)(?) #### 對攻擊目標之:25/送 HTTPS connection -> bypass ![](https://i.imgur.com/OgaleLo.png) > 將攻擊payload 放在SSL SNI中 hello message 中 sni 的 extension 如果我們能在 hostname 插一些奇怪的字元在這個例子中黃色框框是一個空白這個空白非常重要，因為能讓我們有機會塞一些奇怪的東西，但他還是能正常連上這邊用到的 trick 在 linux 的 glibc 中（//先記住，晚點說）剛剛是用 16 進位的方式來看封包現在用人類方式來看(?) ![](https://i.imgur.com/KlFqxjq.png) ## Make SSRF Great Again: 4 methods URL Parsing Issues: URL parser and requester 對同一個網址有不同解釋 * checking URL is defficult because WHATWG的RFC3986 只有定義規格無定義實作。以人魚為例，spec 是半人半魚，但不知道哪一半是人哪一半是魚啊！實作成品會出乎意料之外。 ![URL Components (RFC3968)](https://i.imgur.com/5lJi8vc.png) - Scheme: SSRF 攻擊面 - Authority: 是否可以SSRF攻擊 - Path: SSRF 攻擊深度 ### SSRF 利用 **Local** - Ruby's open(parans[:url]) - url: /etc/passwd - http:/../../etc/passwd: Because there is not http://, therefore, if there is an folder named http, the url will be seems file route note url. **Remote** - 可使用的協議 - Gopher (萬用協議-可偽造任意TCP封包) - 限制：需要Handshake/加密/認證，則無法利用 - Jar: 在目標伺服器製造可控的暫存檔案 - DOS - LFY - FTP / SMB: pwd BruteForece - UNC Path - Pass the Hash - 可擁有的服務 - 攻擊內網常見的 HTTP/HTTPS service - Struts2: Java framework - ElasticSearch - Port 9200 - Docker - Port 2375 - Neo4j, CouchDB, MongoBD: 直接訪問API 可透過修改設定甚至導致ROC - HeartBleed - Tomcat Port 8005 - Zabbix Port 10050 - Radis Port 6379 - SAVE write shell - .. SSH Key - .. Cribtab - SET modify value for 二次利用 - SMTP Port 25 - 內部主機寄信：test.smtp.org/ - test/smtp.org/log 記錄攻擊是否成功 - Memcached Port 11211 - SET modify value for 二次利用 - Memcached + Rails: Memcahed & Dalli lib 會經過 Marshal - FastCGI Port 9000 #### 演練 Q1: https://blog.ephrain.net/wp-content/uploads/2015/08/1439478873-964214684.png http://127.0.0.1/ file://../etc/passwd ![今天會涵蓋的漏洞列表](https://i.imgur.com/M7fdgMC.png) 這段 php code 只有 7 行 ![A php code for read a file](https://i.imgur.com/GmupdP4.png) programmers use parse_url(php內建的) method to check port & host are legal or not; However, RFC 只定義冒號(分隔 port&host) spec，但有的 parser 會從帽號前面來解釋，有的 parser 會從冒號後面來解釋 ![Example1: Different parseres have different result](https://i.imgur.com/SujkMSw.png) ![Example2: Different parseres have different result](https://i.imgur.com/M0fptNm.png) // PHP parse_url讀前面 PHP readfile讀後面 **How about CURL(?)** Curl(A lib) 很大量的人用，用於抓取資源。內建 http lib很爛，故幾乎都改用 Curl，但給 Curl 更新之後，後續用一個空白一樣可以打穿這個弱點。開發團隊回覆：無法過濾來源網址，請程式設計師自行檢查，只能用文件提醒大家… ((誰會看文件啊 XD ![Example3: Different parseres have different result](https://i.imgur.com/Ugjbf5q.png) ![Example4: Different parseres have different result](https://i.imgur.com/AQfkuDA.png) ##### Attack NodeJS by Unicode ![A Nodejs code](https://i.imgur.com/A2Oeviw.png) - 使用者同名目錄當成加目錄，會檢查..以外的字（為了防止什麼攻擊？）-> 無法存取sandbox 以外的目錄： - 假設現在有個密碼檔在根目錄下，如何繞過此限制存取到該檔案？-> 用 Unicode 全型字母 N。 **JavaScript 內部使用UCS2實作來處理全型字母** - UCS2 處理全型字串->轉為十六進位->N = \xFF\x2E (Differences between UCS-2 and UTF-16: https://mathiasbynens.be/notes/javascript-encoding) ![JavaScript UCS2 處理全型字母前之URL](https://i.imgur.com/wP1IZPM.png) ![JavaScript UCS2 處理全型字母後之URL1](https://i.imgur.com/IobWtQn.png) Moreover, NodeJs(C++實作，以byte為單位) bufferString will discard the fist byte when encoding conversion. ![JavaScript UCS2 處理全型字母後之URL2](https://i.imgur.com/tGoQDLK.png) . = \x2E ![JavaScript UCS2 處理全型字母後之URL3](https://i.imgur.com/ctxoqn6.png) **若插換行呢？** 可以用剛剛這個 unicode 的特性 U+FF0D, U+FF0A 繞過這個保護(when BufferString, FF會被拿掉->變換行符號) #### GLibc NSS 的特性 ![GLibc sourcecode](https://i.imgur.com/y4WZAyA.png) - RFC1035: DNS 支援十進位的轉換。 or\097nge = orange - 反斜線後面若非數字，會把反斜線直接拿掉->用一堆反斜線來混淆host name域名。(python@linux). For example, \o\r\a\n\g\e.\o\r\g - Getaddressinfo(): 合法IP address+空白字元後面的東西給過濾掉![linux'll return 127.0.0.1](https://i.imgur.com/Cy7qyYN.png) \o\r\a\n\g\e.\o\r\g = orange.org #### 攻擊URL parsing (\t encoding 問題)32:40 ![](https://i.imgur.com/s23miFF.png) ![](https://i.imgur.com/LS0qDHF.png) 換行 & 可以用相同的 Host 塞奇怪的東西進來，以"換行"參雜其他協定。(繞過相同的Host，傳送至其他的Request) **Attacks by Glibc NSS feature** - HTTP 1.1 要求 a Host header; 網址 host name will put in request host header. 34:00 - .......(?) ![參雜radis protocol(?)](https://i.imgur.com/kfBmOGw.png) SET foo 0 60 5\r\n:443/ ![\t](https://i.imgur.com/gra14xi.png) ![\t URL encode](https://i.imgur.com/Om6rYdS.png) ![\t URL double encode](https://i.imgur.com/sbVARLt.png) 感謝 Redis 跟 memcached 用前面的空白去繞過亦可。 (用於多一個空白，可用於最新版本的python) #### Attack IDNA - IDNA => 定義Unicode的標準 //複雜的排版上是否為合法之類的標準 - IDNA standars 目前常用的標準有兩個 2003, 2008 過渡期：2003+UTS46->如果 URL 的 parser 跟 url requester 用不同標準就會有問題 ![](https://i.imgur.com/o48d5nr.png) - 拉丁字母 ß (德母的字母沒有相對應的大寫字母，就會轉成兩個大寫s) However, ss!=ß; 但如果用瀏覽器去開啟，會有可以繞過黑名單的洞。For example, WordPreß = WordPress -> 目前還沒修 XD 繞過 IIS 的方式：找出標準中的不一致，就可以達到繞過的方式。 ### SSRF Bypass - DNS Bypass - 方便的host name反解提供商 - xip.io - DNS Rebinging - Round-Robin DNS: 使某DNS記錄可對應到哪個IP - TTL = 1 - attack.com 第一次解析 1.2.3.4 - attack.com 第二次解析 127.0.0.1 - 網址 Bypass - 127.0.0.1 - localhost - 127.0.1 - 127.1 - 0.0.0.0 - 0.0 - 0 - IP 表達形式 - ping 127.2.3.4 - ping 0x7f.0x0.0x0.0x1 - ping 0177.01.01.01 - ping 0x7f000001 - ......... - IPv6 可接 interface(IP....%1, %後接的是interface) - WordPress SSRF - 各種 localhost 的不同表達方式 - 雜項 - 302 Rederection - Fingerprinting: intranet 有哪些services **檢查要檢查什麼？** Scheme Host Port ### Case study: 3個繞過的方法 1. Time-of-check to time-of-use(TOCTTOU) problem ![三者對SSRF的防禦方法](https://i.imgur.com/YNeEavM.png) - URL parser: 檢查網址是否在白名單內 - DNS checker:確保IP不再黑名單內 - URL requstster:存取網址(此時會再產生一次DNS query)並抓回內容 BUT!!!!若檢查時狀態與使用時狀態不同！！ ![TOCTTOU問題之精髓（？）41:00](https://i.imgur.com/E2c3lVr.png) 2. 對 IDNA 標準支援的差異 CURL 支援 Unicode 域名自動轉換但PHP之gethostbyname()不支援-> SSRF bypass 3. URL parser and URL requester 的解讀不一致-> bypass 即使 curl 7.54, PHP 後來修復了 SSRF 的問題，但是大多數專案(ex. Ubuntu 17.0.1?的 curl)沒有跟上 **空白的弱點**，curl 永遠不會修復XD #### SSRF Execution Chain: 4個漏洞串成RCE (?)44:00 GitHub WebHuck 用了一個Ruby gem 作為黑名單保護，然而可以用 0 輕鬆繞過。**在 linux 中 0 = localhost**->有一個SSRF 但，此SSRF有以下限制導致無法利用此漏洞做事情： 1. 只能用http/https 的 skeme&沒有302重導向跳轉(?)可以轉換成其他skeme(第一次第二次沒檢查header可能被插入location 轉去其他地方) 2. 無法控制POST header&其他內容 3. 前面介紹的CR LF injection(?)在這邊都無法做到 -> 無法做到 protocol smuggling 那，內網中的http服務中有什麼可以做利用咧？ localhost:8000 有個服務會抓GET()參數並訪問->第二個SSRF->用兩個 SSRF 結合成Chain，偽造 protocol &url=127.0.0.1:6379/%0D%0ASET... 一個假造協定，一個假造目標（？）為什麼Github 能存下 ruby object (？) 用marshal(?)的方式包起來 ![完全不懂（？）](https://i.imgur.com/igtt4Qj.png) #### Prevent(Mitigation) 1. Software(Application): 唯一IP(不用再問一次DNS Server) and hostname(一個IP可能會有多個網站)，不要reuse使用者提供的IP 2. Network: firewall/network policy 阻擋intranet traffics(不可以做192.168.../172.20...等內網的請求) Some library you can use like SafeCurl or Advocate