面试题：Python多线程共享内存的实现与优化

实现多线程共享内存

使用global关键字：在函数内部如果要修改全局变量，可使用global关键字声明。例如：

data = []
def add_to_data(x):
    global data
    data.append(x)

使用threading.Thread类的参数传递共享数据：通过将共享数据作为参数传递给线程函数。

import threading

shared_list = []
def worker(data, value):
    data.append(value)

t = threading.Thread(target=worker, args=(shared_list, 10))
t.start()
t.join()
print(shared_list)

使用multiprocessing.Value和multiprocessing.Array：虽然multiprocessing主要用于多进程，但其中的Value和Array也可在多线程中用于共享数据，它们提供了线程安全的方式。

from multiprocessing import Value, Array

shared_value = Value('i', 0)
shared_array = Array('i', [1, 2, 3])

共享内存引发的内存管理问题

竞态条件：多个线程同时访问和修改共享内存时，由于线程执行顺序的不确定性，导致最终结果依赖于线程执行顺序，产生不正确的结果。例如多个线程同时对一个共享计数器进行自增操作。
内存泄漏：如果在共享内存的使用过程中，没有正确释放资源，比如没有关闭文件描述符、没有释放分配的内存块等，可能会导致内存泄漏。特别是当共享内存涉及到复杂的数据结构或外部资源（如数据库连接）时，若线程异常退出而未清理相关资源，就容易出现内存泄漏。

优化策略和解决方案

锁机制：
- 互斥锁（threading.Lock）：在访问共享内存前获取锁，访问结束后释放锁。

import threading

lock = threading.Lock()
shared_counter = 0
def increment():
    global shared_counter
    lock.acquire()
    try:
        shared_counter += 1
    finally:
        lock.release()

- **信号量（`threading.Semaphore`）**：用于控制同时访问共享资源的线程数量。例如允许最多3个线程同时访问共享内存。

import threading

semaphore = threading.Semaphore(3)
def access_shared_memory():
    semaphore.acquire()
    try:
        # 访问共享内存操作
        pass
    finally:
        semaphore.release()

队列（queue.Queue）：使用队列在多线程间传递数据，而不是直接共享内存。队列本身是线程安全的，可避免竞态条件。

import threading
import queue

q = queue.Queue()
def producer(q):
    for i in range(5):
        q.put(i)

def consumer(q):
    while True:
        item = q.get()
        if item is None:
            break
        # 处理数据
        print(f"Consumed {item}")
        q.task_done()

t1 = threading.Thread(target=producer, args=(q,))
t2 = threading.Thread(target=consumer, args=(q,))
t1.start()
t2.start()
q.join()
q.put(None)  # 通知消费者结束
t2.join()

垃圾回收：确保Python的垃圾回收机制能正常工作，及时回收不再使用的共享内存对象。对于复杂的共享对象，可以通过实现__del__方法来手动清理资源，避免内存泄漏。
使用线程安全的数据结构：Python的collections.deque是线程安全的双端队列，在多线程环境下使用它比普通列表更安全。另外，concurrent.futures模块中的ThreadPoolExecutor和ProcessPoolExecutor在管理线程和进程时，对共享资源的处理相对安全，可根据需求选择使用。

面试题：Python多线程共享内存的实现与优化

知识考点

面试题答案

实现多线程共享内存

共享内存引发的内存管理问题

优化策略和解决方案