利用XSLT繼續擊垮XML

wyzsk發表於2020-08-19
作者: 小飛 · 2016/02/23 11:26

0x00 介紹


XSL

首先我們要說的是,這個XSLT應該這麼斷句:XSL-T。XSL指的是EXtensible Stylesheet Language,中文被很直白地翻譯成擴充套件樣式表語言。這種語言和xml有莫大關係:XSL之於XML相當於CSS之於HTML。HTML的每個元素都是預定義好的,比如<table>用來定義表格,瀏覽器也知道怎麼識別這個標籤,此時CSS就能輕鬆地告訴瀏覽器該怎麼顯示這個表格,然而由於XML裡面的任何標籤都可以由程式設計師自己定義,所以需要一種XSL語言來描述如何顯示xml文件。 這是一篇web安全文章,所以我們還是討論web相關的xsl安全,而支援在web上呼叫的是xslt v1,所以我們只討論version1發生的故事。

XSLT

XSL包括三個部分:XSLT,XPath,XSL-FO。在安全領域,Xpath已經有前人的研究 (xpath injection),而其他兩個幾乎無人問津。去年black hat駭客大會,終於有安全組織(IOActive)共享出自己的研究成果Abusing XSLT。 XSLT顧名思義,就是用來將XML轉換成XHTML或者是其他XML文件。

當用XML來生成其他文件時(e.g. xhtml),XSL可以作為XML的引用。同時,XSL能夠內嵌到XML中發揮作用。

既然談XSLT安全,就得考慮他們的應用場景,這篇文章我們將從客戶端和服務端兩個方面分析XSLT實現的脆弱性。為了簡化討論,我們討論這幾個vendor的安全問題:

  • libxslt:libxslt為後端的Python,PHP,PERL,RUBY及前端的safari,opera,chrome提供XSL解析。
  • Transformiix:討論它是因為它被firefox呼叫,用來處理xsl
  • Microsoft:不用解釋也能明白,微軟自家的IE,肯定用的是自己的解析庫了。

0x01 攻擊模型


客戶/服務端:數字表示及運算風險

XSL對數學有自己的一套"獨特"的理解.我們先討論下它對大整數的處理:

Large Integers

比如

p1

以及它的樣式

p2

在諸如Xsltproc, Php, Perl, Ruby, Python, Safari, Chrome和Opera的libxslt系的處理軟體上,都會將上面這段xml解釋成這樣(chrome):

p3

問題很明顯了。

IOActive給出了他們研究調查的結果

p4

隨機數

同樣的,xsl的某些vendor對於隨機數的生成也是相當寫意的。而這個粗糙的vendor竟然還是應用最廣泛的libxslt,由於這個庫在生成隨機數的時候根本就沒有IV,所以每一次生成的隨機數,都是根本不變的。

p5

讓我們將這個和PRG一起hi起來。。。

客戶端:Safari SOP繞過

Safari的同源策略同樣可能被這個xml的樣式語言被破壞。

前面提到過,safari早就支援xml和xhtml的轉換。然而利用XSLT中的document(), 我們能夠帶著相應的cookies跨域讀取safari其他域內的資源。 這樣一來,我們就能可以透過 document()->value-of()/copy-of()這個流程被竊取到其他網站的使用者資訊,最終,透過JavaScript傳送給攻擊者。

我復現了ioactive的poc,然而結果卻和IOActive不一樣:

在IOActive的報告中

p6

無疑成功取到了結果,成功BYPASS。

而我本地測試的時候卻在Safari控制塔得到這樣的提示

p7

無疑是被sop ban掉了。

是apple修復了,還是利用姿勢不對,我將POC放到了文章最後,大家可以下載下來研究。

服務端:任意檔案讀取

XSLT文件在執行錯誤的時候回立即終止,它和他的兄弟XML類似,一小丁點錯誤就會丟擲一個錯誤。然而錯誤資訊也是能夠給攻擊者帶來一些有用的資訊的。

XSLT提供了三個用來讀檔案的方法

  • document(): 用來訪問另一個xml文件內的資訊(剛剛的跨域中同樣用到)
  • include(): 用來將兩個樣式表合併
  • import(): 用來將一個樣式表覆蓋另一個

比如如下這個樣式表A

#!xml
<?xml-stylesheet type="text/xsl" href="2-9-Reading_Non-XML-Files.xsl"?>
<file>/etc/passwd</file>

和B

#!xml
<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform"> <xsl:template match="/">
<xsl:value-of select="document(file)"/> </xsl:template>
</xsl:stylesheet>

當B被解析時,會嘗試呼叫A表,而A表會試著用document()讀取/etc/passwd的內容,很明顯這不是一個xml文件,所以不可能讀取,幸運的是在輸出的錯誤資訊裡面,我們可以看到目標文字的第一行被輸出了。

p8

雖然只有第一行,但是第一行能夠獲取的銘感資訊可不少了

  • /etc/passwd: Linux root password
  • /etc/shadow: Linux root password
  • .htpasswd: Apache password
  • .pgpass: PostgreSQL password

這次,xsltproc php perl ruby這四種語言的所有方法(document() ,import() ,include())都受到影響 (php不愧是世界上最好的語言,什麼事兒都有他的份)

本文章來源於烏雲知識庫,此映象為了方便大家學習研究,文章版權歸烏雲知識庫!

相關文章