赞
踩
这段代码是 Linux 内核网络栈中与 InfiniBand 协议相关的一个部分,特别是与 IP over InfiniBand (IPoIB)相关。该函数负责去处理IPoIB的发送完成队列(发送CQ)上的工作请求(work completions)。以下是对这个函数的中文注释。
- // IPoIB的发送轮询函数
- // napi: 指向网络设备poll接口结构体的指针
- // budget: 处理这次轮询的最大工作量(即最大处理数量)
- int ipoib_tx_poll(struct napi_struct *napi, int budget)
- {
- // 从napi结构体获取ipoib_dev_priv结构
- struct ipoib_dev_priv *priv = container_of(napi, struct ipoib_dev_priv,
- send_napi);
- struct net_device *dev = priv->dev;
- int n, i;
- struct ib_wc *wc;
-
- poll_more:
- // 从发送完成队列中获取最多MAX_SEND_CQE个完成事件
- n = ib_poll_cq(priv->send_cq, MAX_SEND_CQE, priv->send_wc);
-
- for (i = 0; i < n; i++) { // 遍历所有取得的完成事件
- wc = priv->send_wc + i;
- // 根据完成事件的wr_id判断是CM(Conection Manager)事件还是普通IPoIB事件
- if (wc->wr_id & IPOIB_OP_CM)
- ipoib_cm_handle_tx_wc(dev, wc); // 处理CM相关的发送完成事件
- else
- ipoib_ib_handle_tx_wc(dev, wc); // 处理普通的IB发送完成事件
- }
-
- if (n < budget) { // 如果完成事件的数量少于预算
- napi_complete(napi); // 标记poll处理完成
- // 再次请求通知,以便在有新的发送完成事件时,napi_poll被再次调用
- if (unlikely(ib_req_notify_cq(priv->send_cq, IB_CQ_NEXT_COMP |
- IB_CQ_REPORT_MISSED_EVENTS)) &&
- napi_reschedule(napi))
- goto poll_more; // 如果有更多待处理的完成事件(通知失败),则继续轮询
- }
- return n < 0 ? 0 : n; // 如果轮询函数出错,返回0,否则返回处理的事件数量
- }
这个函数通过 napi_struct
接口与 Linux 内核的软中断和网络轮询机制集成,以实现高效的数据包处理。该机制能够处理大量的网络流量,同时避免过度消耗CPU资源。
注意:实际的Linux内核代码可能会因版本和你的系统配置而有所不同,上述代码及注释仅供参考。
这个函数`ipoib_tx_poll`是用于处理 IP over InfiniBand (IPoIB) 网卡的发送轮询。以下是详细的中文注释和解释:
- int ipoib_tx_poll(struct napi_struct *napi, int budget)
- {
- // 通过napi结构体指针得到ipoib_dev_priv结构体指针
- struct ipoib_dev_priv *priv = container_of(napi, struct ipoib_dev_priv, send_napi);
- // 通过私有结构体的dev字段得到代表网络设备的net_device结构体指针
- struct net_device *dev = priv->dev;
- int n, i;
- struct ib_wc *wc; // 定义一个指向ib_wc结构体的指针,用于存放完成工作的信息
-
- poll_more:
- // 调用ib_poll_cq来轮询Completion Queue (CQ)并获得完成的工作请求(Work Completion)
- n = ib_poll_cq(priv->send_cq, MAX_SEND_CQE, priv->send_wc);
-
- // 遍历所有已完成的工作请求
- for (i = 0; i < n; i++) {
- wc = priv->send_wc + i;
- // 如果wr_id与IPOIB_OP_CM相与结果不为0,意味着这是一个连接管理(CM)操作
- if (wc->wr_id & IPOIB_OP_CM)
- ipoib_cm_handle_tx_wc(dev, wc); // 处理连接管理相关的完成工作请求
- else
- ipoib_ib_handle_tx_wc(dev, wc); // 处理非连接管理的完成工作请求
- }
-
- // 如果轮询的完成事件数量少于budget
- if (n < budget) {
- napi_complete(napi); // 表明所有的数据包都已处理完成
- // 重新设置Completion Queue的事件通知,若返回非零且napi_reschedule返回真,则重新进行轮询
- if (unlikely(ib_req_notify_cq(priv->send_cq, IB_CQ_NEXT_COMP | IB_CQ_REPORT_MISSED_EVENTS)) &&
- napi_reschedule(napi))
- goto poll_more; // 回到poll_more标签处,再次开始轮询
- }
- // 返回处理的事件数量,如果调用ib_poll_cq出现了错误,返回值可能是负数,在这种情况下返回0
- return n < 0 ? 0 : n;
- }
该函数的主要作用是轮询网络设备的发送队列直到处理了`budget`数量的事件或者没有更多的事件处理。该函数可能调用不同的处理函数来处理发送的工作请求,这取决于是常规的IPoIB操作还是连接管理操作。通过使用NAPI(新的API),这个函数有助于减少在高速数据路径上的软中断处理时间,并提高网络性能。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。