目录
流程
前言
定位句柄泄露问题,目前掌握的最好用的就是strace命令.可以监测指定进程的系统调用,来寻找是否存在持续创建socket并且未释放的地方.当前,strace命令还有其他用武之处,但不在本文所描述的范畴内
说明
本文主要讲解strace的用法.用尝试写一个简单的句柄泄露的Demo来分析
strace介绍
strace命令是一个集诊断、调试、统计与一体的工具,我们可以使用strace对应用的系统调用和信号传递的跟踪结果来对应用进行分析,以达到解决问题或者是了解应用工作过程的目的。当然strace与专业的调试工具比如说gdb之类的是没法相比的,因为它不是一个专业的调试器。
strace的最简单的用法就是执行一个指定的命令,在指定的命令结束之后它也就退出了。在命令执行的过程中,strace会记录和解析命令进程的所有系统调用以及这个进程所接收到的所有的信号值。
strace参数
参数名 | 说明 |
---|---|
-c | 统计每一系统调用的所执行的时间,次数和出错的次数等 |
-d | 输出strace关于标准错误的调试信息 |
-f | 跟踪由fork调用所产生的子进程 |
-F | 尝试跟踪vfork调用.在-f时,vfork不被跟踪 |
-ff | 如果提供-o filename,则所有进程的跟踪结果输出到相应的filename.pid中,pid是各进程的进程号 |
-h | 输出简要的帮助信息 |
-i | 输出系统调用的入口指针 |
-q | 禁止输出关于脱离的消息 |
-r | 打印出相对时间,关于每一个系统调用 |
-t | 在输出中的每一行前加上时间信息 |
-tt | 在输出中的每一行前加上时间信息,微秒级 |
-T | 显示每一调用所耗的时间 |
-v | 输出所有的系统调用.一些调用关于环境变量,状态,输入输出等调用由于使用频繁,默认不输出 |
-V | 输出strace的版本信息 |
-x | 以十六进制形式输出非标准字符串 |
-xx | 所有字符串以十六进制形式输出 |
-a column | 设置返回值的输出位置.默认为40 |
-e expr | 指定一个表达式,用来控制如何跟踪 |
-e trace=set | 跟踪指定的系统 调用.例如:-e trace=open,close,rean,write表示只跟踪这四个系统调用.默认的为set=all. |
-e trace=file | 只跟踪有关文件操作的系统调用 |
-e trace=process | 只跟踪有关进程控制的系统调用 |
-e trace=network | 跟踪与网络有关的所有系统调用 |
-e strace=signal | 跟踪所有与系统信号有关的系统调用 |
-e trace=ipc | 跟踪所有与进程间通讯有关的系统调用 |
-e abbrev=set | 设定strace输出的系统调用的结果集.-v 等与 abbrev=none.默认为abbrev=all |
-e raw=set | 将指定的系统调用的参数以十六进制显示 |
-e signal=set | 指定跟踪的系统信号.默认为all.如 signal=!SIGIO(或者signal=!io),表示不跟踪SIGIO信号 |
-e read=set | 输出从指定文件中读出 的数据.例如: -e read=3,5 |
-e write=set | 输出写入到指定文件中的数据 |
-o filename | 将strace的输出写入文件filename |
-p pid | 跟踪指定的进程pid |
-s strsize | 指定输出的字符串的最大长度.默认为32.文件名一直全部输出 |
-u username | 以username的UID和GID执行被跟踪的命令 |
demo实践
写了个最简化的句柄泄露的Demo,思路是客户端创建socket后发给本机一个没被监听的端口.connect失败后直接return.当前也可以用open后直接return等方法.这里顺便再熟悉下socket的创建流程.
#include<stdio.h>
#include<stdlib.h>
#include<string.h>
#include<errno.h>
#include <unistd.h>
#include<sys/types.h>
#include<sys/socket.h>
#include<netinet/in.h>
#include<arpa/inet.h>
int main()
{
int iConnFd = 0;
char szAddr[] = {"127.0.0.1"};
struct sockaddr_in stServerAddr = {0};
for (int i = 0; i < 10000; ++i)
{
if ((iConnFd = socket(AF_INET, SOCK_STREAM, 0)) < 0)
{
perror("Failed to create socket!");
return -1;
}
stServerAddr.sin_family = AF_INET;
stServerAddr.sin_port = htons(7777);
if (inet_pton(AF_INET, szAddr, (void*)&stServerAddr.sin_addr) <= 0)
{
perror("Failed to swicth ip addr!");
close(iConnFd);
iConnFd = -1;
return -1;
}
if (connect(iConnFd, (struct sockaddr*)&stServerAddr, sizeof(stServerAddr)) < 0)
{
perror("Failed to connect!");
//close(iConnFd);
}
sleep(1);
}
return 0;
}
如图:
可以清晰的看出来,进程一直在创建socket,然后connect,cconnect失败后没有回收socket.当然这是很理想的情况,生产环境下比较复杂了,需要具体问题具体分析.