面试题：并发与同步之死锁深度剖析：死锁检测与恢复机制优化

资源分配图算法（Resource Allocation Graph Algorithm, RAGA）改进：
- 传统的 RAGA 用于检测死锁时，每个节点维护自身的资源分配图（RAG），图中节点表示进程和资源，边表示进程对资源的请求或分配关系。在分布式环境下，每个节点将自己的 RAG 信息通过网络定期发送给其他节点。
- 接收节点合并收到的 RAG 信息到本地的全局 RAG 中。例如，节点 A 有进程 P1 请求资源 R1，节点 B 有进程 P2 持有资源 R1 且请求资源 R2，通过信息交换，节点 A 和 B 都能构建更完整的全局 RAG。
- 基于合并后的全局 RAG，使用深度优先搜索（DFS）算法检测是否存在环。若存在环，则表示可能存在死锁。为减少误判，引入时间戳机制，每次更新 RAG 时记录时间戳，只有当环中的关系在一定时间内持续存在，才判定为死锁。
超时检测：
- 为每个资源请求设置一个超时时间。当一个进程发出资源请求后，若在超时时间内未得到响应，该进程所在节点将此请求标记为疑似死锁相关请求。节点间相互交换这些疑似死锁请求信息，综合判断是否真的发生死锁。例如，多个节点都有指向同一资源的超时未响应请求，就增加了死锁发生的可能性判断依据。

资源分配图（RAG）：
- 使用邻接表来表示 RAG。每个节点（进程或资源）有一个链表，链表中的元素表示与之相连的其他节点以及连接的类型（请求边或分配边）。例如，对于进程 P1 请求资源 R1，在 P1 的邻接表中有一个指向 R1 的元素，标记为请求边；在 R1 的邻接表中有一个指向 P1 的元素，标记为被请求边。
- 每个节点还记录自身的时间戳，用于上述死锁判断中的时间约束。
请求队列：
- 每个节点维护一个请求队列，记录本地进程发出的所有资源请求。队列元素包含请求的进程 ID、请求的资源 ID、请求时间等信息。用于超时检测和死锁恢复时确定需要撤销哪些请求。

互斥锁：
- 在更新 RAG 数据结构时，使用互斥锁保证数据一致性。例如，当一个节点接收到其他节点发送的 RAG 更新信息并进行合并时，先获取互斥锁，防止在合并过程中其他线程对 RAG 进行修改，合并完成后释放互斥锁。
信号量：
- 对于资源的分配和释放操作，使用信号量进行控制。当一个进程请求资源时，先获取对应资源的信号量，如果信号量值大于 0，则表示资源可用，进程获取资源并更新 RAG；否则，进程进入等待队列。当资源被释放时，信号量值增加，唤醒等待队列中的进程，同时更新 RAG。
死锁恢复与并发控制结合：
- 当检测到死锁后，选择死锁环中的一个进程进行回滚（撤销其所有资源请求并释放已分配资源）。在回滚过程中，同样使用互斥锁和信号量保证操作的原子性和数据一致性。例如，在释放资源时，通过信号量控制资源的正确释放，同时使用互斥锁保证 RAG 中资源分配关系的正确更新。

知识考点