最近做RCTF,结果pwn一道没做出来(虽然精力全放在更擅长的reverse上了),然后复盘的时候发现RNote4有个关于ret2dl-resolve的利用,遂在网上查之,发现很多资料讲的不是很清楚,但是还是慢慢琢磨弄懂了。这个技巧貌似是一个挺基础的技巧,玩pwn一段时间了,发现自己还有这种知识遗漏。。。所以这篇文章新手向,大神可以绕道了。。。。
我们知道,无论是windows下还是linux下,程序想要调用其他动态链接库的函数,必须要在程序加载的时候动态链接,比方说,windows下,叫作IAT表,linux下,叫作GOT表。调用库函数时,会有个类似call [xxx] 或者 jmp [xxx]的指令,其中xxx是IAT表或者GOT表的地址。在这里因为是linux的pwn,我们主要讨论GOT表,以及在linux下更为常见的jmp [xxx].
首先一个hello world程序
其中,这个puts是调用的libc这个动态链接库导出的一个函数。编译它,看看puts是怎么被调用的。
跟一下,看看这个off_804A00C在第一次调用时是什么东西
可以发现,是0x80482e6这个地址,并不直接是libc的puts函数的地址。这是因为linux在程序加载时使用了延迟绑定(lazy load),只有等到这个函数被调用了,才去把这个函数在libc的地址放到GOT表中。接下来,会再push一个0,再push一个dword ptr [0x804a004],待会会说这两个参数是什么意思,最后跳到libc的_dl_runtime_resolve去执行。这个函数的目的,是根据2个参数获取到导出函数(这里是puts)的地址,然后放到相应的GOT表,并且调用它。而这个函数的地址也是从GOT表取并且jmp [xxx]过去的,但是这个函数不会延迟绑定,因为所有函数都是用它做的延迟绑定,如果把它也延迟绑定就会出现先有鸡还是先有蛋的问题了。
section,segment是什么东西不说了,不知道的话呢谷歌百度一下
包含了一些关于动态链接的关键信息,在这个hellopwn上它长这样,事实上这个section所有程序都差不多
这个section的用处就是他包含了很多动态链接所需的关键信息,我们现在只关心DT_STRTAB, DT_SYMTAB, DT_JMPREL这三项,这三个东西分别包含了指向.dynstr, .dynsym, .rel.plt这3个section的指针,可以readelf -S hellopwn看一下,会发现这三个section的地址跟在上图所示的地址是一样的。
DT_STRTAB
DT_SYMTAB
DT_JMPREL
.dynstr
.dynsym
.rel.plt
readelf -S hellopwn
一个字符串表,index为0的地方永远是0,然后后面是动态链接所需的字符串,0结尾,包括导入函数名,比方说这里很明显有个puts。到时候,相关数据结构引用一个字符串时,用的是相对这个section头的偏移,比方说,在这里,就是字符串相对0x804821C的偏移。
这个东西,是一个符号表(结构体数组),里面记录了各种符号的信息,每个结构体对应一个符号。我们这里只关心函数符号,比方说上面的puts。结构体定义如下
这里是重定位表(不过跟windows那个重定位表概念不同),也是一个结构体数组,每个项对应一个导入函数。结构体定义如下:
这个想要深入理解的话呢可以去看glibc/elf/dl-runtime.c的源码,这里我就不贴了,因为有一堆宏,看着让人晕,我就直接说下他做了哪些事情。
glibc/elf/dl-runtime.c
首先说第一个参数,[0x804a004]是一个link_map的指针,这个结构是干什么的,我们不关心,但是有一点要知道,它包含了.dynamic的指针,通过这个link_map,_dl_runtime_resolve函数可以访问到.dynamic这个section
link_map
.dynamic
_dl_runtime_resolve
0x08049f14是.dynamic的指针,与前面图中一致;而第二个参数,是当前要调用的导入函数在.rel.plt中的偏移(不过64位的话就直接是index下标),比方说这里,puts就是0,__libc_start_main就是1*sizeof(Elf32_Rel)=8。
__libc_start_main
1*sizeof(Elf32_Rel)=8
如果阅读libc源码的话会发现实际顺序可能跟我上面所说的有一点偏差,不过意思都一样,我这样说会比较好理解。
那么,这个怎么去利用呢,有两种利用方式
这个只有在checksec时No RELRO可行,即.dynamic可写。因为ret2dl-resolve会从.dynamic里面拿.dynstr字符串表的指针,然后加上offset取得函数名并且在动态链接库中搜索这个函数名,然后调用。而假如说我们能够改写这个指针到一块我们能够操纵的内存空间,当resolve的时候,就能resolve成我们所指定的任意库函数。比方说,原本是一个free函数,我们就把原本是free字符串的那个偏移位置设为system字符串,第一次调用free("bin/sh")(因为只有第一次才会resolve),就等于调用了system("/bin/sh")。
No RELRO
ret2dl-resolve
free
system
free("bin/sh")
system("/bin/sh")
例题就是RCTF的RNote4,题目是一道堆溢出,NO RELRO而且NO PIE溢出到后面的指针可以实现任意地址写。
NO RELRO
NO PIE
所以呢,可以先add两个note,然后编辑第一个note使得堆溢出到第二个note的指针,然后再修改第二个note,实现任意写。至于写什么,刚刚也说了,先写.dynamic指向字符串表的指针,使其指向一块可写内存,比如.bss,然后再写这块内存,使得相应偏移出刚好有个system\x00。exp如下
.bss
system\x00
如果.dynamic不可写,那么以上方法就没用了,所以有第二种利用方法。要知道,前面的_dl_runtime_resolve在第二步时
.rel.plt + 第二个参数求出当前函数的重定位表项Elf32_Rel的指针,记作rel
.rel.plt + 第二个参数
Elf32_Rel
rel
这个时候,_dl_runtime_resolve并没有检查.rel.plt + 第二个参数后是否造成越界访问,所以我们能给一个很大的.rel.plt的offset(64位的话就是下标),然后使得加上去之后的地址指向我们所能操纵的一块内存空间,比方说.bss。
然后第三步
rel->r_info >> 8作为.dynsym的下标,求出当前函数的符号表项Elf32_Sym的指针,记作sym
rel->r_info >> 8
Elf32_Sym
sym
所以在我们所伪造的Elf32_Rel,需要放一个r_info字段,大概长这样就行0xXXXXXX07,其中XXXXXX是相对.dynsym表的下标,注意不是偏移,所以是偏移除以Elf32_Sym的大小,即除以0x10(32位下)。然后这里同样也没有进行越界访问的检查,所以可以用类似的方法,伪造出这个Elf32_Sym。至于为什么是07,因为这是一个导入函数,而导入函数一般都是07,所以写成07就好。
r_info
0xXXXXXX07
0x10
然后第四步
.dynstr + sym->st_name得出符号名字符串指针
.dynstr + sym->st_name
同样类似,没有进行越界访问检查,所以这个字符串也能够伪造。
所以,最终的利用思路,大概是
构造ROP,跳转到resolve的PLT,push link_map的位置,就是上图所示的这个地方。此时,栈中必须要有已经伪造好的指向伪造的Elf32_Rel的偏移,然后是返回地址(system的话无所谓),再然后是参数(如果是system函数的话就要是指向"/bin/sh\x00"的指针)
push link_map
"/bin/sh\x00"
最后来道经典例题,
明显的栈溢出,但是没给libc,ROPgadget也少,所以要用ret2dl-resolve。
利用思路如下:
第一次调用read函数,返回地址再溢出成read函数,这次参数给一个.bss的地址,里面放我们的payload,包括所有伪造的数据结构以及ROP。注意ROP要放在数据结构的前面,不然ROP调用时有可能污染我们伪造的数据结构,而且前面要预留一段空间给ROP所调用的函数用。调用完第二个read之后,ROP到leave; retn的地址,以便切栈切到在.bss中我们构造的下一个ROP链
read
leave; retn
第二次调用read函数,此时要sendROP链以及所有相关的伪造数据结构
send
至于offset这些东西要自己慢慢撸,反正我搞了挺久的。。。就在IDA里把地址copy出来然后慢慢算偏移就好了。。。
完整exp写的有点丑,放附件了。
PS: 其他一些大佬博客的exp我没有很看懂。。。不知道为啥要写那么长。。。我是弄懂了方法就按照自己的思路写的,不过也对就是了。。。
然后貌似有个自动得出ROP的工具叫作roputils,这样就不用自己搞这么一串ROP了。。。不过用工具前还是要先搞懂原理的不然就成脚本小子了嘛。。。
貌似也可行,而且64位下link_map+0x1c8 好像要置0,所以可能要自己伪造link_map。但是link_map结构有点复杂,网上也没有关于这种利用方式的资料,以后有空会再研究一下。。。
link_map+0x1c8
caaK9s2c8@1M7q4)9K6b7g2)9J5c8W2)9J5c8Y4m8Z5M7X3q4U0K9#2)9J5k6h3!0J5k6#2)9J5c8X3W2K6M7%4g2W2M7#2)9J5c8U0f1^5i4K6u0r3y4q4)9J5k6h3S2@1L8h3H3`.
c13K9s2c8@1M7q4)9K6b7g2)9J5c8W2)9J5c8Y4m8%4L8U0c8Q4x3X3g2X3N6h3&6Q4x3V1j5J5x3o6p5$3i4K6u0r3x3e0q4Q4x3V1j5H3z5g2)9J5c8W2u0W2N6s2g2J5L8W2)9J5k6s2c8G2i4K6u0V1k6r3I4Q4x3X3c8J5k6i4y4G2L8s2k6W2i4K6u0r3
a18K9s2c8@1M7q4)9K6b7g2)9J5c8W2)9J5c8Y4y4Z5L8%4N6D9K9h3&6C8M7X3!0G2L8g2)9J5k6h3#2W2i4K6u0r3x3U0l9I4y4#2)9J5c8U0l9@1i4K6u0r3x3o6W2Q4x3V1k6J5k6i4b7J5k6r3I4Q4x3X3c8J5k6i4y4G2L8s2k6W2i4K6u0r3
fdeK9s2c8@1M7s2y4Q4x3@1q4Q4x3V1k6Q4x3V1j5H3P5o6l9H3M7$3g2U0i4K6u0W2L8%4u0Y4i4K6u0r3N6q4)9J5c8X3I4A6L8Y4g2^5i4K6u0V1K9h3&6@1k6i4u0F1j5h3I4K6i4K6u0V1N6r3S2W2i4K6u0V1j5i4u0@1i4K6u0V1L8$3k6Q4x3X3c8K6P5h3#2T1L8$3I4Q4x3X3c8J5k6i4y4G2L8s2g2@1K9h3!0F1i4K6u0r3x3e0b7^5z5l9`.`.
2ecK9s2c8@1M7s2y4Q4x3@1q4Q4x3V1k6Q4x3V1k6Y4K9i4c8Z5N6h3u0Q4x3X3g2U0L8$3#2Q4x3V1k6X3K9i4u0E0K9h3q4F1j5i4W2Q4x3V1k6o6g2p5k6Q4x3X3c8m8L8r3I4Q4x3X3c8u0L8W2)9J5k6p5!0F1k6g2)9J5c8X3u0D9L8$3u0Q4x3V1k6E0j5i4y4@1k6i4u0Q4x3V1k6V1L8$3y4Q4x3V1j5$3i4K6u0W2x3g2)9J5k6e0y4Q4y4h3k6H3N6$3&6Q4y4h3k6^5k6r3y4@1k6U0t1H3x3e0g2Q4y4h3k6H3N6$3^5J5x3o6m8Q4x3X3g2E0k6l9`.`.
[培训]内核驱动高级班,冲击BAT一流互联网大厂工作,每周日13:00-18:00直播授课
ninebianbian 楼主你好,我最近遇到一个问题,也是ret2dlresolve的,64位,.dynamic不可写,原因是_dl_fixup会读取.dynamic的versym表项的内容,它指向了.gun_version ...
holing 你就控制这个偏移,让他指到.bss呗,64要把link_map也处理下
ninebianbian emmmm,可能是我表述不是很清楚,要不然我把程序和目前的脚本给你,你看一下
holing 直接发这
VINKKe 请问指到bss段的时候为什么要在bss基址的基础上再加上一段偏移地址呢