面试题：PostgreSQL执行计划缓存机制在并发场景下可能面临的问题及解决方案

参数化查询导致的计划不优：
- 当不同参数值传入SQL语句时，PostgreSQL可能会使用相同的缓存执行计划。但不同参数值可能使表数据访问模式差异很大，比如查询条件中的参数值会导致索引选择性变化。例如，一个查询SELECT * FROM users WHERE age > $1，当$1为10和$1为60时，符合条件的记录分布不同，若使用相同执行计划可能不是最优。
数据分布变化：
- 数据库中的数据分布会随着数据的插入、删除和更新而改变。缓存的执行计划是基于当时的数据统计信息生成的。如果数据分布发生显著变化，例如某个表原本大部分数据集中在某个范围，后来数据均匀分布了，原缓存计划可能不再适用，导致查询性能下降。
计划缓存内存管理：
- 随着并发用户增加，缓存的执行计划数量增多，可能导致内存消耗过大。如果内存不足，可能需要淘汰部分执行计划，这就涉及到淘汰策略的合理性问题。若淘汰了频繁使用的计划，会增加重新生成计划的开销；若保留无用计划，会浪费内存资源。

通用计划（Generic Plans）：
- PostgreSQL支持通用计划，它会根据不同参数值生成更通用的执行计划。在生成计划时，考虑不同参数值下的多种情况，使计划在一定程度上适应参数的变化。例如，对于范围查询，通用计划会综合考虑不同范围边界值下的索引使用和表扫描策略，尽量避免因参数变化导致的计划不优。
自动统计信息更新：
- PostgreSQL会自动收集和更新表与索引的统计信息。当数据发生一定量的变化（通过配置参数控制）时，数据库会重新收集统计信息，这些信息包括表的行数、列的不同值数量、数据分布等。执行计划生成器会依据最新的统计信息生成更合适的执行计划，从而适应数据分布的变化。
计划缓存淘汰策略：
- PostgreSQL采用了基于最近最少使用（LRU，Least Recently Used）的策略来管理计划缓存。LRU策略会淘汰长时间未使用的执行计划，这样可以在内存有限的情况下，尽量保留最近使用过的计划，因为这些计划更有可能再次被使用。同时，也会结合计划的使用频率等因素，对一些频繁使用的计划进行特殊处理，避免其被轻易淘汰，从而平衡内存使用和计划重用效率。

星途面试题库