C语言套接字读取数据时空白字符问题：原因及解决方案

Linux

2024-03-25 03:42:39

从C语言套接字中提取可读数据：常见问题及解决方案

在处理C语言套接字时，从套接字中读取数据是一个常见的任务。然而，直接打印所读取的缓冲区内容通常会导致大量空白字符输出，让人感到困惑。本文将深入探讨这一问题的原因，并提供多种解决方案，帮助您正确提取和打印数据。

问题根源：非打印字符

从套接字读取的数据本质上是二进制数据，其中可能包含非打印字符，例如控制字符。这些字符对于打印输出而言是不可见的，因此会被printf函数解释为空白字符，从而导致不必要的输出。

解决方案：过滤非打印字符

为了正确打印从套接字中读取的数据，需要采用特定的处理方法来过滤掉非打印字符。以下列出了几种有效的方法：

1. 使用转义序列：

printf("read: %.*s\n", amntRead, readBuffer);

此方法使用%.*s格式化字符串，其中*号表示可变宽度。它将自动处理非打印字符。

2. 使用特殊函数：

for(int i = 0; i < amntRead; ++i)
{
    if(isgraph(readBuffer[i]))
    {
        printf("%c", readBuffer[i]);
    }
}

isgraph函数检查给定字符是否可以打印，并过滤掉非打印字符。

3. 使用自定义过滤函数：

char *filter_buffer(char *buf, int len)
{
    char *filtered_buf = malloc(len + 1);
    int j = 0;
    for(int i = 0; i < len; ++i)
    {
        if(isgraph(buf[i]))
        {
            filtered_buf[j++] = buf[i];
        }
    }
    filtered_buf[j] = '\0';
    return filtered_buf;
}

printf("read: %s\n", filter_buffer(readBuffer, amntRead));