程式碼混淆與反混淆學習-第二彈

xiaoxiao發表於2023-04-09

原文網址 : https://www.cnblogs.com/Only-xiaoxiao/p/17300639.html

deflat 指令碼學習【去除OLLVM混淆】

deflat指令碼連結：GitHub - cq674350529/deflat: use angr to deobfuscation

deflat 指令碼測試

這裡以程式碼混淆與反混淆學習-第一彈中的OLLVM 混淆樣本為例進行去除。【LLVM-4.0】

控制流平坦前	控制流平坦後

python deflat.py --file main-bcf --addr 0x401180

deflat.py 成功去除後效果：

去混淆後，效果還算可以，能分析程式流程了。

deflat 指令碼分析【angr】

利用符號執行去除控制流平坦化 - 部落格 - 騰訊安全應急響應中心 (tencent.com)

angr documentation

利用angr符號執行去除控制流平坦化 - 0x401RevTrain-Tools (bluesadi.github.io)

序言：函式的第一個執行的基本塊
主(子)分發器：控制程式跳轉到下一個待執行的基本塊
retn塊：函式出口
真實塊：混淆前的基本塊，程式真正執行工作的版塊
前處理器：跳轉到主分發器

如第一彈中分析：OLLVM 的控制流平坦化是將程式的一般邏輯劃分為很多個真實執行的塊，然後透過分發器進行連結。其實就是一個Switch結構，每次執行完真實塊後，進行預處理，再跳轉到主分發器，繼續分發，最終達到平坦化的效果。

顯然，去控制流平坦化就是要找到真實塊間的跳轉邏輯，打破Switch結構束縛。

具體來說，有如下步驟：

靜態分析CFG得到序言/入口塊、主分發器、子分發器/無用塊、真實塊、預分發器和返回塊。
利用符號執行恢復真實塊的前後關係，重建控制流
根據第二步重建的控制流Patch程式，輸出恢復後的可執行檔案

靜態分析

首先明確：【以下結論針對OLLVM專案，其他大佬加料的OLLVM混淆還需要單獨分析】

函式的開始地址為序言的地址
序言的後繼為主分發器
後繼為主分發器的塊為前處理器
後繼為前處理器的塊為真實塊
無後繼的塊為retn塊
剩下的為無用塊

angr 獲取類似Ida的 CFG

獲取真實塊、主分發器、前處理器、序言、retn塊和無用塊

獲取真實塊的細節

angr 恢復真實塊執行邏輯，重建控制流

利用angr 強大的符號執行功能，找到各真實塊的連線邏輯。

這裡對於兩個分支的模擬執行，只需關注cmov指令，就可以分別對應得到eax、ecx，然後獲得後續真實塊。【侷限性很大】

符號執行 symbolic_execution（）函式，返回後繼真實塊。

Patch程式恢復執行邏輯

如此便完成了 deflat指令碼的簡單處理分析。

小結

分析下來，其實就是定位到所有真實塊，然後利用angr符號執行將真實塊間的執行邏輯進行串聯。最後進行patch程式，重建控制流。

但顯然存在一些問題，我們預設了如下規則:

函式的開始地址為序言的地址
序言的後繼為主分發器
後繼為主分發器的塊為前處理器
後繼為前處理器的塊為真實塊
無後繼的塊為retn塊
剩下的為無用塊

但是在實際去除控制流平坦化過程中，上面的預設思路已經被加混淆的開發者做了處理。

例如：

後繼為前處理器的塊不一定是真實塊；
前處理器不一定存在；
存在分支的真實塊跳轉的判斷邏輯，不一定是cmov指令;
deflat指令碼預設模擬執行最多兩個分支，但真實情況可能不只兩個分支；
可能存在一個向前更新的陣列，依據程式執行進行更新，決定當前真實塊的跳轉【這導致angr對於該塊的模擬執行得不到正確的跳轉】
程式在加混淆前，已經被新增了花指令或其他處理，程式CFG圖已經被打破；
某個塊存在死迴圈，會使angr符號執行卡死……

這也導致了，這個deflat指令碼的普適性較低，除了能夠處理OLLVM官方專案做的混淆，對加了其他PASS或者處理的混淆，基本用不了。

所以對於去除不了的OLLVM混淆，我們需要根據程式的實際混淆效果，對deflat指令碼進行修改，再進行去混淆。

【這也要求對deflat 指令碼比較熟悉，可以更快上手】

失敗的花指令控制流平坦化嘗試

使用程式碼混淆與反混淆學習-第一彈中加了花指令的程式，進行OLLVM控制流平坦化混淆，看看效果。

原始碼如下：

# clang 執行內聯彙編加 -fasm-blocks 或者 -fms-extensions 或者 -masm=intel

clang -mllvm -fla -mllvm -split -mllvm -split_num=3 main-call-加花.cpp -lm -fasm-blocks -o main-call-加花

# 需要對原始碼作一些修改

存在較大的問題，我的OLLVM 環境是在Ubuntu上搭建的，對於上述內聯彙編加的花指令無法編譯透過！

【或許可以在Windows 上移植OLLVM，進行編譯（好像挺難的）】

可以看到，花指令用到的標籤、$ 出現報錯。

【最終也沒解決編譯問題，或許本就不可以，ollvm 不具備這樣的處理能力，也可能是我程式碼的問題，如果部落格前的你有任何想法，歡迎與我交流】

TSCTF-J 2022-upx_revenge實戰分析

TSCTF-J 2022 WP

對upx_revenge題目進行分析。

首先直接使用deflat 指令碼。

python deflat.py --file upx_revenge_test --addr 0x4016D0

發現沒有找到retn 塊。

處理多個retn塊

回到ida 檢視cfg 圖發現原因：存在其他的退出塊。

這裡需要改進deflat 指令碼，使其存在很多retn塊。

# 其他位置的retn_node，對應改為list處理
if supergraph.out_degree(node) == 0:
            retn_node.append(node)

成功執行，但是去除效果不行。

去除後CFG圖

多個comv的處理

很明顯看出，程式的真實塊間的邏輯串聯失敗，也就是重建控制流失敗。

產生原因

顯然，這裡存在2個分支，因為有兩個cmov【相同判斷】，並且call 函式，對分支跳轉是有作用的，這裡var_CC是順序執行，動態更新的。

【deflat 指令碼只處理了執行有一個cmov指令的情況，且hook了call函式】

【由於var_CC是順序執行，動態更新也可以看出，deflat 指令碼的模擬執行思路已經無法對真實塊的後繼進行確定了】

但這裡做個測試，不hook call 看是什麼效果。

可以知道，取消hook call 對真實塊後繼的查詢毫無影響，這是因為deflat中的模擬執行，只是基於comv 處的模擬。對前文並無任何關聯。

顯然，該deflat指令碼的無法處理了。【】

總結

angr

就upx_revenge 這道題而言，

deflat 指令碼中angr 對區域性的模擬執行顯然無法獲取真實塊間的執行順序，重建控制流顯然也無從談起。當然靜態查詢各個控制流平坦化的功能塊效果還是可以的。

那麼如何透過angr,有序的、聯絡上文地進行模擬執行，獲取真實塊的執行邏輯，顯然是關鍵點！

【??? 後續學習了，有思路再更新】

unicorn

[原創]ARM64 OLLVM反混淆-Android安全-看雪論壇-安全社群|安全招聘|bbs.pediy.com (kanxue.com)

Unicorn反混淆：恢復被OLLVM保護的程式(一) - 簡書 (jianshu.com)

使用unicorn 模擬執行框架獲取真實塊間的執行順序，重建控制流。

【還沒學過 unicorn 使用，，，】

ida

使用IDA microcode去除ollvm混淆(上) - 先知社群 (aliyun.com)

GitHub - PShocker/de-ollvm: IDA Python Script for anti ollvm

利用ida 現成的CFG 圖，以及idc 指令碼，動態執行程式，獲取真實塊的執行順序，從而恢復控制流。

SpringBoot程式碼混淆與反混淆加密工具詳解
2023-12-20
Spring Boot加密
Flutter 程式碼混淆混淆Dart程式碼
2021-08-19
FlutterDart
【程式碼混淆】react-native 程式碼混淆
2023-12-26
React
前端程式碼安全與混淆
2023-04-12
前端
Android程式碼混淆&元件化混淆方案
2020-11-20
Android元件化
python程式碼混淆與編譯
2024-08-08
Python編譯
程式碼混淆防止APP被反編譯指南
2018-09-14
APP編譯
js程式碼混淆
2024-11-19
JS
Python程式碼混淆工具，Python原始碼保密、加密、混淆
2024-02-05
Python原始碼加密
ios加固，ios程式碼混淆，ios程式碼混淆工具， iOS原始碼混淆使用說明詳解
2020-06-11
iOS原始碼
android 混淆規則作用,Android程式碼混淆詳解
2024-02-27
Android
Android 程式碼混淆規則
2018-07-17
Android
iOS 初探程式碼混淆（OC）
2018-05-24
iOS
Python 程式碼混淆工具概述
2024-04-01
Python
powershell程式碼混淆繞過
2020-06-21
使用proguard混淆springboot程式碼
2019-03-04
Spring Boot
鴻蒙程式碼配置混淆
2021-05-06
鴻蒙
程式碼混淆工具ipaguard：如何使用ipaguard保護和混淆iOS應用程式程式碼
2023-09-20
iOS
estools 輔助反混淆 Javascript
2020-08-19
JavaScript
Spring Boot使用Allatori程式碼混淆
2019-03-03
Spring Boot
iOS應用加固--程式碼混淆
2018-08-07
iOS
Python 的控制流程式碼混淆
2020-04-13
Python
聊聊如何進行程式碼混淆
2022-01-26
行程
【教程】深入探究 JS程式碼混淆與加密技術
2024-03-22
JS加密
【JS 逆向百例】反混淆入門，某鵬教育 JS 混淆還原
2021-12-02
JS
程式碼安全之程式碼混淆及加固（Android）?
2023-11-15
Android
Python 程式碼混淆和加密技術
2018-11-15
Python加密
.NET 程式碼混淆工具-JIEJIE.NET
2024-10-09
Java程式碼混淆工具入門——Allatori～
2021-08-19
Java
ios-class-guard - iOS程式碼混淆與加固實踐
2023-12-01
iOS
Vue混淆與還原
2023-12-06
Vue
程式碼混淆的原理和方法詳解
2023-11-29
如何進行程式碼混淆？方法與常見工具介紹
2023-12-08
行程
逆向破解js程式碼加密，程式碼混淆不是難事
2019-05-12
JS加密
JAVA逆向&反混淆-追查Burpsuite的破解原理
2020-08-19
JavaUI
ArkTS 應用的程式碼混淆策略：提升安全性與效能
2024-10-29
Fairplay DRM與混淆實現
2021-11-15
AI
JS混淆程式碼資料集構建方法
2024-04-17
JS