select 和 poll 为什么需要拷贝fd？

dalang · · 98 次点击 · · 开始浏览

在Linux中，`select`、`poll`和`epoll`都是I/O多路复用的机制，用于同时监控多个文件描述符（fd）的状态。它们在处理文件描述符集合时的数据拷贝行为有显著差异，直接影响性能。 --- ### **1. `select` 和 `poll` 为什么需要拷贝fd？** #### **(1) 设计原理** - **`select`**：每次调用时，用户需要将**所有待监控的fd集合（`fd_set`）从用户空间拷贝到内核空间**，内核遍历这些fd的状态后，再**将结果拷贝回用户空间**。 - **示例**： ```c fd_set read_fds; FD_ZERO(&read_fds); FD_SET(fd1, &read_fds); FD_SET(fd2, &read_fds); select(max_fd+1, &read_fds, NULL, NULL, NULL); // 拷贝到内核 ``` 内核处理后，`read_fds`会被修改为就绪的fd集合，需**再次拷贝回用户空间**。 - **`poll`**：类似`select`，但使用`struct pollfd`数组传递fd集合。每次调用时，需将整个数组从用户空间拷贝到内核，内核处理后返回结果。 ```c struct pollfd fds[2]; fds[0].fd = fd1; fds[0].events = POLLIN; fds[1].fd = fd2; fds[1].events = POLLIN; poll(fds, 2, -1); // 拷贝到内核 ``` #### **(2) 拷贝次数分析** - **每次调用`select/poll`**： 1. **用户态 → 内核态**：拷贝完整的fd集合（读/写/异常）。 2. **内核态 → 用户态**：拷贝修改后的就绪fd集合。 **总拷贝次数 = 2次/次调用**。 #### **(3) 性能瓶颈** - **时间复杂度**：内核需遍历所有fd，时间复杂度为O(n)。 - **频繁拷贝开销**：当监控大量fd时，频繁的用户态-内核态拷贝成为性能瓶颈。 --- ### **2. `epoll` 为什么不需要拷贝fd？** #### **(1) 设计原理** - **`epoll`通过三部分实现**： - **`epoll_create`**：创建一个`epoll`实例，返回文件描述符。 - **`epoll_ctl`**：向`epoll`实例中**注册/修改/删除**需要监控的fd（**仅需一次**）。 - **`epoll_wait`**：等待事件就绪，内核直接返回就绪的fd列表。 #### **(2) 数据管理机制** - **内核维护持久化数据结构**： `epoll_ctl`会将用户注册的fd及其关注的事件**保存到内核的红黑树中**，后续无需重复传递。 - **事件就绪列表**：当fd状态变化时，内核将就绪事件加入**就绪链表**，`epoll_wait`只需从链表中拷贝就绪事件到用户空间。 #### **(3) 拷贝次数分析** - **初始化阶段（`epoll_ctl`）**：注册fd时需拷贝到内核态（**仅一次**）。 - **监控阶段（`epoll_wait`）**：每次调用仅从内核态拷贝就绪事件到用户态，无需传递完整fd集合。 **总拷贝次数 ≈ 1次/次调用**（仅输出就绪事件）。 --- ### **3. 对比总结** | **机制** | 初始化拷贝 | 每次调用拷贝次数 | 时间复杂度 | 适用场景 | |----------|------------|--------------------------|------------|------------------------| | `select` | 无 | 2次（传入fd集+返回结果） | O(n) | 少量fd，兼容性要求高 | | `poll` | 无 | 2次（传入fd集+返回结果） | O(n) | 同`select`，支持更多fd | | `epoll` | 1次/注册 | 1次（仅返回结果） | O(1) | 高并发，大量fd | --- ### **4. 关键差异** #### **(1) 数据结构的持久化** - `select/poll`：**无状态**，每次调用需重新传递所有fd。 - `epoll`：**内核维护持久化数据结构**，仅需增量更新。 #### **(2) 事件通知方式** - `select/poll`：**轮询**所有fd，返回完整就绪集合。 - `epoll`：**事件驱动**，仅返回已就绪的fd（通过回调机制）。 --- ### **5. 性能影响示例** - **场景**：监控1000个fd，其中10个就绪。 - **`select/poll`**： - 每次拷贝1000个fd到内核。 - 内核遍历1000个fd，返回10个就绪的fd。 - **`epoll`**： - 初始化时注册1000个fd（一次拷贝）。 - 每次`epoll_wait`仅拷贝10个就绪事件。 --- ### **6. 为什么内核不优化`select/poll`的拷贝？** - **历史兼容性**：`select`是早期Unix标准接口，设计时未考虑高并发场景。 - **接口限制**：`select`的fd集合大小固定（如`FD_SETSIZE=1024`），无法动态扩展。 - **设计哲学**：`epoll`是Linux专为高性能场景设计的扩展机制，牺牲通用性换取效率。 --- ### **总结** - **`select/poll`**：每次调用需完整拷贝fd集合，适合少量fd或兼容性场景。 - **`epoll`**：通过持久化数据结构和事件驱动，避免重复拷贝，适合高并发场景。 - **选择依据**：根据fd数量、性能要求和平台兼容性权衡使用。

98 次点击

加入收藏微博

收入我的专栏

上一篇：TCP 滑动窗口拥塞窗口 RTT与发送报文的个数的关系

下一篇：MySQL与Direct I/O：绕过内核缓存的设计与性能优化

链表

linux

拷贝

标准接口

0 回复

添加一条新回复（您需要登录后才能回复没有账号？）

请尽量让自己的回复能够对别人有帮助
支持 Markdown 格式, **粗体**、~~删除线~~、`单行代码`
支持 @ 本站用户；支持表情（输入 : 提示），见 Emoji cheat sheet
图片支持拖拽、截图粘贴等方式上传

select 和 poll 为什么需要拷贝fd？

用户登录

今日阅读排行

一周阅读排行

select 和 poll 为什么需要拷贝fd？

用户登录

今日阅读排行

一周阅读排行

给该专栏投稿 写篇新文章

收入到我管理的专栏 新建专栏

给该专栏投稿写篇新文章

收入到我管理的专栏新建专栏