MSI中断相关研究:
https://mp.weixin.qq.com/s/e5qaF75nw-NIaRQmfszvKA

中断系统一个非常核心的Linux内核主题,本文将梳理内核中断系统的架构,并阐述驱动软件如何应用这一机制。

一、核心目标与概述

中断系统的根本目标是:让CPU能够及时响应和处理硬件异步事件,而无需持续轮询。

当一个硬件设备(如网卡收到数据包、磁盘完成IO、键盘被按下)需要CPU处理时,它会通过电气信号触发一个中断。CPU会暂停当前执行的任务,转去执行一个预先定义好的函数(中断处理程序),处理完毕后再恢复原任务。

二、Linux中断系统架构图

Linux中断处理架构概览

图片
详细架构层次

  1. 硬件层

图片

  1. 内核中断处理层

图片

  1. 上半部/下半部处理机制

图片
中断下半部机制选择

图片

  1. 中断处理流程

设备产生中断请求 (IRQ)

        │

        ▼

中断控制器接收并路由到CPU核心

        │

        ▼

CPU中断当前执行,跳转到中断向量表入口

        │

        ▼

保存寄存器上下文,进入内核中断处理

        │

        ▼

    do_IRQ()

        │

        ▼

查找irq_desc,调用handle_irq()

        │

        ▼

调用设备驱动注册的中断处理函数 (上半部)

        │

        ▼

如果需要,激活下半部处理 (软中断/Tasklet标志)

        │

        ▼

中断返回,恢复上下文

        │

        ▼

      [中断结束]

        │

        ▼

当允许软中断时,执行软中断处理

        │

        ▼

执行Tasklet或工作队列中的延迟任务

  1. 中断线程化 (Threaded IRQs)

传统中断:

硬件中断 → 硬中断处理 → 软中断/Tasklet → 返回



线程化中断:

硬件中断 → 硬中断处理(仅唤醒线程) → 返回

                              ↓

                     中断线程(进程上下文)

                              ↓

                   执行实际的中断处理函数





6. 中断描述符管理



Linux 中断描述符管理(核心原理+工程实现)

 

Linux 中断描述符管理的核心是  irq_desc  结构体数组,通过它串联中断硬件控制、中断号映射、处理函数挂载等核心能力,是内核中断子系统的“中枢神经”。



关键数据结构关系图

图片
 

6-1. 核心数据结构: struct irq_desc (内核源码简化版)



struct irq_desc {
    struct irq_data     irq_data;        // 中断硬件相关数据(核心关联字段)
    struct irq_chip     *irq_chip;       // 硬件操作抽象(mask/ack/enable等)
    struct irq_domain   *irq_domain;     // 中断号映射管理(hwirq→virq)
    struct irqaction    *action;         // 中断处理函数链表(用户注册的handler)
    unsigned int        status;          // 中断状态(如IRQ_ACTIVE/IRQ_DISABLED)
    const char          *name;           // 中断名称(如"eth0")
    // 其他辅助字段:锁、统计信息、下半部触发机制等
};

- 核心定位:每个中断(对应一个  virq  虚拟中断号)对应数组中一个  irq_desc  实例,集中管理该中断的“硬件控制+软件处理”全生命周期。

 

6-2. 三层核心管理逻辑(从硬件到用户)

 

1. 硬件控制层: irq_chip  抽象

 

- 作用:屏蔽不同中断控制器(APIC/GIC/MSI-X)的硬件差异,提供统一操作接口。

- 核心接口(工程实现中必须实现的关键函数):

struct irq_chip {

    void (*mask)(struct irq_data *data);  // 屏蔽中断(禁止硬件触发)

    void (*unmask)(struct irq_data *data); // 使能中断

    void (*ack)(struct irq_data *data);   // 应答中断(清除硬件中断标志)

    // 扩展接口:设置触发方式、中断迁移等

};



- 工程实践:例如 x86 平台的  apic_chip 、ARM 平台的  gic_chip ,均通过该结构体适配底层硬件。

 

2. 中断号映射层: irq_domain  管理

 

- 核心问题:硬件中断号( hwirq ,由设备/控制器分配)与内核虚拟中断号( virq , irq_desc  数组索引)的映射。

- 映射流程(工程落地关键):

1. 设备驱动通过  irq_domain_alloc_irq()  申请  virq ;

2. 内核通过  irq_domain_map()  建立  hwirq → virq  映射;

3. 中断触发时,控制器驱动通过  irq_find_mapping(domain, hwirq)  找到对应的  virq ,进而定位  irq_desc 。

- 典型场景:PCIe 设备的 MSI-X 中断,每个 MSI-X 向量对应一个  hwirq ,需通过  irq_domain  映射为  virq  后才能被内核处理。

 

3. 处理函数管理层: irqaction  链表

 

- 作用:挂载用户(驱动开发者)注册的中断处理函数,支持多函数链式调用。

- 数据结构:



struct irqaction {

    irq_handler_t handler;  // 中断处理函数(如网卡接收中断处理)

    void *dev_id;           // 设备私有数据(区分同一中断的多个设备)

    const char *name;       // 处理函数名称(用于调试)

    struct irqaction *next; // 下一个处理函数(链表结构)

    unsigned int flags;     // 标志(如IRQF_SHARED共享中断)

};

- 注册流程(驱动开发常用)



request_irq(unsigned int virq,          // 虚拟中断号

            irq_handler_t handler,      // 处理函数

            unsigned long flags,        // 标志

            const char *name,           // 名称

            void *dev_id);              // 私有数据



→ 内核会创建  irqaction  实例,添加到对应  irq_desc->action  链表。

 

6-3. 核心工作流程(中断触发→处理全链路)





图片

这个架构图展示了Linux中断系统从硬件到软件、从上半部到下半部的完整处理流程。中断系统是Linux内核响应硬件事件的核心机制,其设计需要在响应速度、系统吞吐量和实时性之间取得平衡。



6-4. 工程实践关键要点

1. 中断共享机制:多个设备共享同一  virq  时, irqaction->flags  需设为  IRQF_SHARED ,且  dev_id  不能为 NULL(用于卸载时区分)。

2. 中断安全性: irq_desc  内置自旋锁( irq_desc->lock ),保证多CPU场景下的操作原子性,驱动开发中无需手动加锁。

3. 调试工具:

-  cat /proc/interrupts :查看各  virq  的触发次数、绑定CPU、处理函数名称;

-  irqbalance  工具:动态调整中断在多核CPU上的分布,优化负载均衡。

4. 性能优化:高频中断(如网卡/磁盘IO)需尽量缩短上半部处理时间,将耗时操作(如数据拷贝)放到下半部;通过  irq_set_affinity()  绑定中断到指定CPU,减少缓存抖动。



三、中断系统硬件架构基础

1. 中断源:
   · 外部中断: 来自CPU外部,通过引脚(如INTR, NMI)或总线(如MSI)传入。例如:键盘、鼠标、定时器、网卡。
   · 内部中断(异常): 由CPU自身在执行指令时触发,如除零错误、页错误、断点。
   · 软件中断: 由软件指令主动触发,如int 0x80(传统系统调用), 或syscall指令。
2. 中断控制器: 现代系统中的关键硬件组件,负责管理和仲裁多个中断源。
   · 经典: 8259A PIC, 有IRQ0-IRQ15共16个中断线。
   · 现代: APIC 及其衍生的xAPIC、MSI/MSI-X。 它分为两部分:
     · Local APIC: 每个CPU核心一个,处理本地中断和来自IO APIC的中断。
     · I/O APIC: 系统芯片组的一部分,收集外部设备的中断,并可根据配置路由到不同的Local APIC(核心),实现中断负载均衡。
   · MSI/MSI-X: 基于消息的中断。设备将中断请求直接写入指定的内存地址(一个“消息”),内存控制器将其作为中断信号发送给CPU。它彻底摆脱了对固定引脚/IRQ线的依赖,支持更多中断向量,并能精确携带数据。
3. 中断处理流程(硬件部分):
   1. 设备触发中断信号。
   2. 中断控制器接收信号,进行掩码、优先级仲裁。
   3. 中断控制器向CPU核心发送中断向量号。
   4. CPU保存当前执行上下文(寄存器等),根据向量号查找中断描述符表,跳转到对应的处理程序入口。

四、Linux内核中断子系统软件架构

Linux内核中断子系统是一个分层的软件抽象,它屏蔽了底层硬件的差异。

1. 核心抽象层

· struct irq_desc: 中断描述符。这是内核管理一个中断的核心数据结构。每个中断线(或向量)对应一个irq_desc。它包含了该中断的所有信息:中断处理函数、中断状态、所属的IRQ Chip、唤醒统计等。
· struct irqaction: 中断动作。描述一个具体的中断处理程序。一个irq_desc可以链接多个irqaction(共享中断)。
· struct irq_chip: IRQ芯片抽象层。封装了对特定中断控制器(如PIC, APIC)的底层操作函数集(ack, mask, unmask, set_affinity等)。
· struct irq_domain: 中断域。用于管理硬件中断号(HW IRQ)到Linux软件中断号(VIRQ)的映射。对于支持设备树(DT)或ACPI的系统尤为重要。

2. 中断处理流程(软件部分)

这是最经典的上半部/下半部机制:

a. 上半部 - 硬件中断处理程序

· 特点: 在中断上下文中执行,所有中断被屏蔽,不能休眠、不能阻塞、不能执行耗时操作。
· 职责:
  1. 对中断控制器进行应答(acknowledge)。
  2. 执行紧急的、对时间敏感的操作(例如:从硬件寄存器读取数据、清除中断位)。
  3. 根据情况,判断是否需要触发一个下半部来处理剩余工作。
  4. 快速返回。

b. 下半部 - 延迟处理机制
由于上半部的限制,大部分数据处理工作被推迟到下半部。内核提供了多种下半部机制:

· 软中断: 内核预定义的几个静态类型(如NET_RX_SOFTIRQ, TASKLET_SOFTIRQ),性能最高,但编程复杂且必须是可重入的。通常由网络和块设备子系统使用。
· Tasklet: 基于软中断实现,但接口更简单。一个Tasklet在同一时刻只能在一个CPU上运行,简化了并发问题。在驱动中非常常用。
· 工作队列: 在进程上下文中执行,因此可以休眠、可以调度。它是通过内核工作线程来执行的。当你的下半部需要执行可能阻塞的操作(如分配内存、访问文件系统)时,必须使用工作队列。
· 线程化中断: 这是现代驱动推荐的方式。将整个中断处理程序(包括上半部)都放到一个独立的内核线程中运行。它结合了工作队列的优点(可休眠),并简化了设计。通过request_threaded_irq函数申请。

3. 中断处理流程全图

硬件中断发生
|
v
CPU跳转到统一的中断入口(汇编代码)
|
v
保存完整上下文,切换到内核栈
|
v
调用 do_IRQ() (C语言入口)
|
v
查找 irq_desc,调用其 handle_irq()
|
v
调用该中断上注册的所有 irqaction->handler()(驱动提供的中断处理函数,上半部)
|
v
上半部完成,可能触发软中断/Tasklet
|
v
中断返回,恢复之前上下文
|
v
在某个合适的时机(如从中断返回后),内核处理软中断/Tasklet(下半部)
|
v
或者,工作队列/线程化中断在独立的线程中被调度执行




四、驱动软件中的应用

驱动开发者是中断子系统的使用者,主要工作是申请/释放中断,并提供中断处理函数。

1. 关键API

```c
/* 申请一个中断线(传统方式) */
int request_irq(unsigned int irq, irq_handler_t handler,
                unsigned long flags, const char *name, void *dev);

/* 申请一个线程化中断 */
int request_threaded_irq(unsigned int irq, irq_handler_t handler,
                         irq_handler_t thread_fn,
                         unsigned long flags, const char *name, void *dev);

/* 释放中断线 */
void free_irq(unsigned int irq, void *dev);

/* 在驱动中断处理函数(上半部)中,判断是否在中断上下文 */
in_interrupt();

/* 禁止/使能本地CPU中断 */
local_irq_disable();
local_irq_enable();
/* 保存和恢复中断状态 */
local_irq_save(flags);
local_irq_restore(flags);
  1. 中断处理函数(上半部)原型
irqreturn_t irq_handler(int irq, void *dev_id);

· irq: 中断号。
· dev_id: 传递给request_irq的唯一标识,通常为驱动设备结构体指针,用于共享中断时区分设备。
· 返回值: IRQ_NONE(不是我处理的中断), IRQ_HANDLED(已处理)。

  1. 典型驱动中断处理流程示例(以按键中断为例)
#include <linux/interrupt.h>
#include <linux/of.h> // 设备树支持

struct my_device {
    struct device *dev;
    int irq;
    struct work_struct work; // 用于工作队列
};

static irqreturn_t my_irq_handler(int irq, void *dev_id)
{
    struct my_device *my_dev = dev_id;

    /* 1. 紧急操作:读取硬件状态,清除中断标志 */
    // hw_clear_interrupt(my_dev->base_addr);

    /* 2. 触发下半部(这里使用工作队列) */
    schedule_work(&my_dev->work);

    return IRQ_HANDLED;
}

/* 工作队列处理函数(下半部) */
static void my_work_handler(struct work_struct *work)
{
    struct my_device *my_dev = container_of(work, struct my_device, work);
    /* 这里可以执行耗时操作,甚至休眠 */
    // process_data(...);
}

static int my_probe(struct platform_device *pdev)
{
    struct my_device *my_dev;
    int ret;

    /* 从设备树获取中断号(现代方式) */
    my_dev->irq = platform_get_irq(pdev, 0);
    if (my_dev->irq < 0) return my_dev->irq;

    /* 初始化工作队列 */
    INIT_WORK(&my_dev->work, my_work_handler);

    /* 申请中断(共享中断示例) */
    ret = request_irq(my_dev->irq, my_irq_handler,
                      IRQF_SHARED | IRQF_TRIGGER_RISING,
                      "my-driver", my_dev);
    if (ret) {
        dev_err(&pdev->dev, "Failed to request IRQ\n");
        return ret;
    }

    /* 设置中断亲和性(可选,用于绑定到特定CPU) */
    irq_set_affinity_hint(my_dev->irq, cpumask_of(0));

    return 0;
}

static int my_remove(struct platform_device *pdev)
{
    struct my_device *my_dev = platform_get_drvdata(pdev);

    /* 释放中断 */
    free_irq(my_dev->irq, my_dev);
    /* 取消工作队列 */
    cancel_work_sync(&my_dev->work);

    return 0;
}

五、重要概念与最佳实践

  1. 中断上下文: 中断处理程序(上半部)执行的环境。不能使用可能引起休眠的函数(如kmalloc(GFP_KERNEL)、mutex_lock),只能使用自旋锁进行同步。
  2. 共享中断: 多个设备共享一条物理中断线。申请时需指定IRQF_SHARED标志,并提供唯一的dev_id。中断处理程序必须能通过读取设备状态寄存器来判断是否是自己的中断。
  3. 中断亲和性: 可以将特定的中断绑定到特定的CPU核心上,有利于提高缓存命中率和负载均衡。
  4. 中断风暴防护: 如果硬件故障导致中断持续产生,系统会卡死。内核有机制(如proc/sys/kernel/panic_on_io_nmi)和驱动自身应有超时检测。
  5. 现代趋势: 优先使用线程化中断 (request_threaded_irq) 和 MSI/MSI-X 中断。它们提供了更好的可管理性、更低的延迟和更好的可扩展性。

总结

Linux内核中断子系统是一个精巧的多层抽象:

· 底层: 与千差万别的中断控制器交互。
· 中层: 提供统一的中断描述和管理框架,处理流控、亲和性。
· 上层: 为驱动开发者提供清晰的API和多种下半部机制。

驱动开发者需要理解“上半部紧急处理,下半部实际工作”的哲学,根据需求选择合适的下半部机制(对于简单任务,Tasklet;对于复杂或可能阻塞的任务,工作队列或线程化中断),并严格遵守中断上下文的编程约束,才能编写出高效、稳定的设备驱动程序。

谢谢关注,后续会持续分享关于AI,GPU,Linux开发,操作系统,图形学,高性能计算,芯片行业讯息。欢迎感兴趣的伙伴关注微信公众号参与讨论沟通:
###关注公众号获取全文


请关注微信公众号:颇锐克科技共享


Logo

开源鸿蒙跨平台开发社区汇聚开发者与厂商,共建“一次开发,多端部署”的开源生态,致力于降低跨端开发门槛,推动万物智联创新。

更多推荐