面试题：Python多线程性能调优之GIL与多线程协作

GIL工作原理

本质：全局解释器锁（GIL）是Python解释器（CPython）中的一个互斥锁，它确保在任何时刻，只有一个线程能够执行Python字节码。
目的：主要是为了简化CPython的内存管理，因为CPython的内存管理不是线程安全的。通过GIL，避免了多个线程同时访问和修改Python对象的内存，从而防止内存错误和数据竞争。
执行机制：每个线程在执行Python字节码前，必须先获取GIL。线程会在以下几种情况下释放GIL：
- 执行I/O操作时，如文件读写、网络请求等，因为此时线程需要等待外部资源，释放GIL可以让其他线程有机会执行。
- 达到一定的字节码执行数量阈值（可配置），Python解释器会强制当前线程释放GIL，以便其他线程有机会获取GIL并执行。

既有CPU密集型又有I/O密集型任务场景下多线程程序设计

区分任务类型：将CPU密集型任务和I/O密集型任务分开处理。
I/O密集型任务：使用多线程来处理I/O密集型任务，因为在I/O操作时，线程会释放GIL，其他线程可以利用这段时间执行。例如，在进行网络请求或文件读写时，多线程可以有效利用等待I/O完成的时间，提高整体效率。
CPU密集型任务：对于CPU密集型任务，可以考虑使用多进程来替代多线程。因为每个进程有自己独立的Python解释器实例和GIL，不存在GIL带来的限制，能充分利用多核CPU的性能。但进程间通信和资源共享相对复杂，开销较大。

举例说明多线程协作规避GIL性能瓶颈

import threading
import time


# I/O密集型任务函数
def io_bound_task():
    time.sleep(2)  # 模拟I/O操作，如网络请求或文件读写
    print("IO task completed")


# CPU密集型任务函数
def cpu_bound_task():
    result = 0
    for i in range(100000000):
        result += i
    print("CPU task completed")


if __name__ == '__main__':
    io_thread = threading.Thread(target=io_bound_task)
    cpu_thread = threading.Thread(target=cpu_bound_task)

    start_time = time.time()

    io_thread.start()
    cpu_thread.start()

    io_thread.join()
    cpu_thread.join()

    end_time = time.time()
    print(f"Total time: {end_time - start_time} seconds")

在上述代码中，io_bound_task模拟I/O密集型任务，cpu_bound_task模拟CPU密集型任务。通过多线程并发执行这两个任务，I/O密集型任务在等待时会释放GIL，让CPU密集型任务有机会执行，虽然CPU密集型任务受GIL限制无法充分利用多核，但与顺序执行相比，整体性能仍有所提升。同时，若想进一步优化CPU密集型任务，可将其部分逻辑使用multiprocessing模块改写为多进程执行。

面试题：Python多线程性能调优之GIL与多线程协作

知识考点

面试题答案

GIL工作原理

既有CPU密集型又有I/O密集型任务场景下多线程程序设计

举例说明多线程协作规避GIL性能瓶颈