面试题：C语言select、poll、epoll的内核实现剖析及应用场景选择

数据结构：select 使用 fd_set 数据结构来表示文件描述符集合。fd_set 本质上是一个位图，每个位对应一个文件描述符。例如在32位系统中，一个 fd_set 能表示32个文件描述符。
系统调用过程：应用程序调用 select 函数，将需要监视的文件描述符集合（读、写、异常）以及等待的超时时间传递给内核。内核遍历这些文件描述符集合，检查每个文件描述符的状态。如果有文件描述符就绪，select 函数返回，应用程序通过检查 fd_set 来确定哪些文件描述符就绪。
实际应用场景选择：适用于小规模并发场景，且文件描述符数量较少（通常小于1024）。例如简单的网络服务器，连接数不多且对性能要求不是极高的情况。判断依据是如果连接数少，select 的线性遍历开销相对较小，其实现简单，易于理解和维护。

数据结构：poll 使用 pollfd 结构体数组来表示需要监视的文件描述符及其事件。struct pollfd { int fd; short events; short revents; };，其中 fd 是文件描述符，events 是请求监视的事件，revents 是实际发生的事件。
系统调用过程：应用程序调用 poll 函数，传递 pollfd 结构体数组和数组长度。内核遍历这个数组，检查每个文件描述符的状态。与 select 不同，poll 没有最大文件描述符数量的限制（理论上）。当有文件描述符就绪时，poll 函数返回，应用程序通过检查 revents 字段确定哪些事件发生。
实际应用场景选择：适用于中等规模并发场景，文件描述符数量较多但不是特别巨大的情况。例如一些轻量级的中间件服务，连接数在几千以内。判断依据是 poll 没有文件描述符数量限制，相比 select 更适合连接数稍多的场景，同时性能不会像在大规模并发时那样急剧下降。

数据结构：epoll 使用红黑树来管理需要监视的文件描述符，使用链表来保存就绪的文件描述符。这样在添加、删除文件描述符时具有较好的性能（时间复杂度为 O(logn)），并且在获取就绪文件描述符时也很高效。
系统调用过程：首先通过 epoll_create 创建一个 epoll 实例，返回一个 epoll 句柄。然后使用 epoll_ctl 向这个实例中添加、修改或删除需要监视的文件描述符及其事件。最后通过 epoll_wait 等待文件描述符就绪，当有文件描述符就绪时，epoll_wait 返回就绪的文件描述符链表，应用程序直接处理这些就绪的文件描述符。
实际应用场景选择：适用于大规模并发场景，如高并发的网络服务器，连接数可能达到数万甚至更多。判断依据是 epoll 在大规模并发下性能卓越，其红黑树和链表的数据结构设计使得在管理大量文件描述符时开销很小，能够高效地处理大量并发连接。例如 Nginx 这样的高性能 Web 服务器就使用 epoll 来处理大量客户端连接。

知识考点