ollvm反混淆學習 - 網安 - 專業的網絡安全產業、社區、知識平臺

看了@無名俠大佬發的一篇關于使用unicorn模擬執行還原ollvm的貼子受到了很大的啟發, 自己也基于這個思路做了些樣本學習，下面來探討一下。

ollvm原理

Ollvm大致可分為 bcf(虛假塊), fla(控制流展開), sub(指令膨脹), Split(基本塊分割)

bcf：

克隆一個真實塊，并隨機替換其中的一些指令，然后用一個永遠為真的條件建立一個分支。克隆后的塊是不會被執行的。

Fla：

將所有的真實塊使用一個switch case結構包裹起來，每個真實塊執行完畢后都會重新賦值switch var，對于有分支的塊會使用select指令，并跳轉到switch起始代碼塊（分發器）上，根據switch var來執行下一個真實塊。

Sub：

指令膨脹，將一條運算指令，替換為多條等價的運算指令。

Split：

利用隨機數產生分割點，將一個基本塊分割為兩個，并使用絕對跳轉連接起來。

關于ollvm具體的實現，可參考源碼。

還原思路

網上有很多還原ollvm的腳本，但是只能還原特征很明顯的ollvm，或者說只是debug版的ollvm。在debug版中ollvm的特征非常明顯，一個分發器，和引用了這個分發器的真實塊。但經過編譯器優化后，分發器可能會變成多個，基本塊會合并造成虛假塊也可能會和真實塊合并，等等。

現實情況是，你基本上碰不到簡單的ollvm，所以那些東西個人感覺意義不是很大，還是需要靠自己。

談下還原思路

Bcf：

Bcf塊是執行不到的塊，所以說當使用unicorn 跑過一遍函數后，其中沒有執行到的塊肯定有包括bcf塊，我們只需要將它挑出來標記下就好。

但函數中可能存在分支，只跑一遍函數是無法覆蓋到所有分支的，所以要想辦法找到函數的所有分支。一開始采用的是無名俠大佬的方法，當碰到csel指令時人工干預讓其覆蓋所有分支，但整個函數經常陷入死循環，分析過后發現虛假塊的跳轉也有可能使用csel指令。

后來想到了在二進制漏洞挖掘中的思路fuzz（模糊測試），即變異函數的參數傳遞給函數，來覆蓋更多的分支。這樣做也不能說能夠找到函數的所有分支。影響一個函數的分支執行大概有三種情況，參數，全局變量，內部函數調用的返回值。后兩種情況的話留意下模糊執行的trace應該能找到些蛛絲馬跡，可能會比較麻煩。

Fla

這個環節會產生控制流塊，我們只需要將這些塊挑出來標記，找出所有的真實塊，并通過模擬執行還原真實塊之間的關系就好。

控制流塊的剔除采用了無名俠大佬對基本塊簽名的方法。

Sub：

指令膨脹的還原，使用llvm的pass優化效果還可以，但目前一些ir翻譯工具對arm64的支持不怎么樣。

Split：

基本塊分割更多是用來增加bcf和fla效果的。

總結整體思路：

（1）利用模擬執行和fuzz技術，找出bcf塊并剔除。

（2）使用基本塊簽名剔除控制流塊。

（3）將剩余的塊標記為真實塊，并使用模擬執行找出對應關系。

（4）根據對應關系，重構cfg。

實戰

自己編譯的一個樣本如下：

void HexDump(char *buf,int len,int addr)__attribute((__annotate__(("split"))))__attribute((__annotate__(("fla"))))__attribute((__annotate__(("bcf")))){    int i,j,k;    char binstr[80];     for (i=0;i        if (0==(i%16)) {            sprintf(binstr,"%08x -",i+addr);            sprintf(binstr,"%s %02x",binstr,(unsigned char)buf[i]);        } else if (15==(i%16)) {            sprintf(binstr,"%s %02x",binstr,(unsigned char)buf[i]);            sprintf(binstr,"%s  ",binstr);            for (j=i-15;j<=i;j++) {                sprintf(binstr,"%s%c",binstr,('!''~')?buf[j]:'.');            }            printf("%s",binstr);        } else {            sprintf(binstr,"%s %02x",binstr,(unsigned char)buf[i]);        }    }    if (0!=(i%16)) {        k=16-(i%16);        for (j=0;j            sprintf(binstr,"%s   ",binstr);        }        sprintf(binstr,"%s  ",binstr);        k=16-k;        for (j=i-k;j            sprintf(binstr,"%s%c",binstr,('!''~')?buf[j]:'.');        }        printf("%s",binstr);    }}