Linux UART 读取优化：降低 CPU 负载的 5 个技巧

2024-11-17 16:47:48

Linux UART 读取优化：减少 read() 调用次数

在嵌入式Linux系统（例如i.MX6 ULL，Linux 6.1）中使用UART接收数据时，高波特率下频繁的 read() 调用会导致CPU负载过高。本文探讨如何减少 read() 调用次数，从而降低CPU负载，并提供几种优化方案。

问题

在非规范模式下，使用 termios::c_cc[VMIN] = 0 和 termios::c_cc[VTIME] = 20 配置UART。read() 函数在接收到至少一个字节或超时200毫秒后返回。以921600波特率接收每秒100个200字节的数据包时，每个数据包 read() 会被调用6-12次；降低波特率到460800，调用次数增加到12-24次。频繁的上下文切换增加了CPU负载，尤其在资源有限的嵌入式系统中（例如i.MX6 ULL）。

目标是增加数据在内核中累积的时间，减少 read() 的调用次数，同时保证在数据停止发送时能够及时超时。

解决方案

以下几种方案可以减少 read() 的调用次数：

1. 调整 VTIME 值

增加 VTIME 的值可以延长超时时间，允许更多数据在返回前累积。但这需要在响应速度和 CPU 负载之间进行权衡。更大的 VTIME 值意味着更长的延迟，但在某些应用场景中，比如医疗设备的数据采集，一定的延迟是可以接受的。

示例代码（设置 VTIME 为 50，即 500 毫秒）：

struct termios tty;
tcgetattr(fd, &tty);
tty.c_cc[VTIME] = 50; 
tcsetattr(fd, TCSANOW, &tty);

2. 使用更大的缓冲区

使用更大的缓冲区可以一次性读取更多数据。可以通过修改驱动程序或应用层代码来实现。在应用层，可以通过在 read() 函数中指定更大的读取字节数来实现。

示例代码（一次读取 200 字节）：

char buffer[200];
int bytes_read = read(fd, buffer, 200);

如果驱动程序允许配置FIFO大小，则可以尝试增大硬件FIFO的大小。这需要修改设备树或驱动程序代码，具体方法取决于硬件平台。

3. 修改驱动程序（谨慎操作）

如果以上方法无法满足需求，可以考虑修改UART驱动程序。例如，可以在驱动程序中添加一个缓冲机制，将接收到的数据缓存到一定数量后再返回给用户空间。但这需要深入理解驱动程序的代码逻辑，并进行仔细的测试，确保不会引入新的问题。修改驱动需谨慎，务必进行充分测试并评估潜在风险。

4. 异步 I/O

异步 I/O (aio) 允许在数据到达时接收通知，而无需轮询。这可以显著降低 CPU 负载，但实现相对复杂。aio_read() 函数可以用于异步读取数据。

需要配置信号处理函数，在数据准备好时接收通知。异步I/O可以避免忙等待，从而减少CPU负载。

5. 选择性读取 (poll/select)

poll() 或 select() 可以用来监控文件符的可读状态，并在数据可读时进行读取操作。结合更大的 VTIME 值和更大的读取缓冲区，可以减少不必要的 read() 调用。

示例代码（使用 poll 监控文件描述符，超时时间 200ms）：

struct pollfd fds[1];
fds[0].fd = fd;
fds[0].events = POLLIN;
int ret = poll(fds, 1, 200); // 200ms timeout

if (ret > 0 && (fds[0].revents & POLLIN)) {
    char buffer[200];
    int bytes_read = read(fd, buffer, 200);
    // ... process data ...
}

总结

选择合适的方案取决于具体应用场景的需求和系统资源。调整 VTIME 值和使用更大的缓冲区是最简单的方案。如果需要更精细的控制，可以考虑异步 I/O 或修改驱动程序。无论选择哪种方案，都建议进行充分的测试，确保满足应用的需求，并避免引入新的问题。在修改内核或驱动代码时，务必进行全面测试，确保系统的稳定性和安全性。

选择合适的方案需要权衡响应速度、CPU 负载和实现复杂度。通过仔细评估和测试，可以找到最佳的解决方案。