TheRiver | blog

You have reached the world's edge, none but devils play past here

0%

句柄泄露的定位过程

目录

流程

前言

定位句柄泄露问题,目前掌握的最好用的就是strace命令.可以监测指定进程的系统调用,来寻找是否存在持续创建socket并且未释放的地方.当前,strace命令还有其他用武之处,但不在本文所描述的范畴内

说明

本文主要讲解strace的用法.用尝试写一个简单的句柄泄露的Demo来分析

strace介绍

strace命令是一个集诊断、调试、统计与一体的工具,我们可以使用strace对应用的系统调用和信号传递的跟踪结果来对应用进行分析,以达到解决问题或者是了解应用工作过程的目的。当然strace与专业的调试工具比如说gdb之类的是没法相比的,因为它不是一个专业的调试器。

strace的最简单的用法就是执行一个指定的命令,在指定的命令结束之后它也就退出了。在命令执行的过程中,strace会记录和解析命令进程的所有系统调用以及这个进程所接收到的所有的信号值。

strace参数

参数名 说明
-c 统计每一系统调用的所执行的时间,次数和出错的次数等
-d 输出strace关于标准错误的调试信息
-f 跟踪由fork调用所产生的子进程
-F 尝试跟踪vfork调用.在-f时,vfork不被跟踪
-ff 如果提供-o filename,则所有进程的跟踪结果输出到相应的filename.pid中,pid是各进程的进程号
-h 输出简要的帮助信息
-i 输出系统调用的入口指针
-q 禁止输出关于脱离的消息
-r 打印出相对时间,关于每一个系统调用
-t 在输出中的每一行前加上时间信息
-tt 在输出中的每一行前加上时间信息,微秒级
-T 显示每一调用所耗的时间
-v 输出所有的系统调用.一些调用关于环境变量,状态,输入输出等调用由于使用频繁,默认不输出
-V 输出strace的版本信息
-x 以十六进制形式输出非标准字符串
-xx 所有字符串以十六进制形式输出
-a column 设置返回值的输出位置.默认为40
-e expr 指定一个表达式,用来控制如何跟踪
-e trace=set 跟踪指定的系统 调用.例如:-e trace=open,close,rean,write表示只跟踪这四个系统调用.默认的为set=all.
-e trace=file 只跟踪有关文件操作的系统调用
-e trace=process 只跟踪有关进程控制的系统调用
-e trace=network 跟踪与网络有关的所有系统调用
-e strace=signal 跟踪所有与系统信号有关的系统调用
-e trace=ipc 跟踪所有与进程间通讯有关的系统调用
-e abbrev=set 设定strace输出的系统调用的结果集.-v 等与 abbrev=none.默认为abbrev=all
-e raw=set 将指定的系统调用的参数以十六进制显示
-e signal=set 指定跟踪的系统信号.默认为all.如 signal=!SIGIO(或者signal=!io),表示不跟踪SIGIO信号
-e read=set 输出从指定文件中读出 的数据.例如: -e read=3,5
-e write=set 输出写入到指定文件中的数据
-o filename 将strace的输出写入文件filename
-p pid 跟踪指定的进程pid
-s strsize 指定输出的字符串的最大长度.默认为32.文件名一直全部输出
-u username 以username的UID和GID执行被跟踪的命令

demo实践

写了个最简化的句柄泄露的Demo,思路是客户端创建socket后发给本机一个没被监听的端口.connect失败后直接return.当前也可以用open后直接return等方法.这里顺便再熟悉下socket的创建流程.

#include<stdio.h>
#include<stdlib.h>
#include<string.h>
#include<errno.h>
#include <unistd.h>
#include<sys/types.h>
#include<sys/socket.h>
#include<netinet/in.h>
#include<arpa/inet.h>

int main()
{
    int iConnFd = 0;
    char szAddr[] = {"127.0.0.1"};
    struct sockaddr_in  stServerAddr = {0};

    for (int i = 0; i < 10000; ++i)
    {
        if ((iConnFd = socket(AF_INET, SOCK_STREAM, 0)) < 0)
        {
            perror("Failed to create socket!");
            return -1;
        }

        stServerAddr.sin_family = AF_INET;
        stServerAddr.sin_port = htons(7777);

        if (inet_pton(AF_INET, szAddr, (void*)&stServerAddr.sin_addr) <= 0)
        {
            perror("Failed to swicth ip addr!");
            close(iConnFd);
            iConnFd = -1;
            return -1;
        }

        if (connect(iConnFd, (struct sockaddr*)&stServerAddr, sizeof(stServerAddr)) < 0)
        {
            perror("Failed to connect!");
            //close(iConnFd);
        }

        sleep(1);
    }


    return 0;
}
  • 如图:



    可以清晰的看出来,进程一直在创建socket,然后connect,cconnect失败后没有回收socket.当然这是很理想的情况,生产环境下比较复杂了,需要具体问题具体分析.

----------- ending -----------