面试题：Cassandra中Memtable与SSTable在分布式环境下的一致性保障

写入流程
- 当客户端向Cassandra集群写入数据时，数据首先被写入到Memtable中。Memtable是驻留在内存中的数据结构，采用类似哈希表的形式存储数据，这使得写入操作能够快速完成，因为内存的读写速度远高于磁盘。
- 一旦Memtable达到特定的阈值（通常由配置参数决定，如memtable_flush_memory_threshold_in_mb），它会被“刷新”到磁盘，转化为一个新的SSTable（Sorted String Table）。
读取流程
- 读取数据时，Cassandra会先检查Memtable，因为它包含最新写入的数据。如果在Memtable中未找到所需数据，再从SSTables中查找。SSTables存储在磁盘上，按照分区键（partition key）排序，这有助于高效的范围查询。
- Cassandra使用一种名为Bloom Filter的结构来快速判断数据是否可能存在于某个SSTable中，从而减少不必要的磁盘I/O操作。

Commit Log
- 为了防止在Memtable刷新到磁盘之前节点故障导致数据丢失，Cassandra使用Commit Log。每次写入Memtable的操作，同时也会记录到Commit Log中。Commit Log是顺序写入磁盘的，保证了即使节点崩溃，在重启时也能通过重放Commit Log来恢复Memtable中的数据。
Compaction
- 随着时间推移，会产生多个SSTables，为了优化存储和读取性能，Cassandra会执行Compaction操作。Compaction有两种类型：
  - Minor Compaction：它会合并少量（通常是最近生成的）SSTables，删除过期的数据和墓碑（tombstones，标记已删除的数据），以减少SSTable的数量。
  - Major Compaction：它会合并一个列族（column family）中的所有SSTables，进一步优化数据布局，确保数据的一致性和高效存储。

写入放大
- 由于Commit Log的存在，每次写入操作都需要进行两次I/O（一次写入Memtable，一次写入Commit Log），这可能导致写入放大，降低整体写入性能。
读取放大
- 随着SSTables数量的增加，读取数据时需要检查多个SSTables，即使使用Bloom Filter，也可能产生较多的磁盘I/O操作，导致读取放大，影响读取性能。
数据一致性延迟
- 当数据写入Memtable后，在未刷新到SSTable之前，其他节点可能无法立即看到该数据，这可能导致短时间的数据不一致。特别是在节点故障需要从Commit Log恢复时，可能会有短暂的数据不一致窗口。

写入放大解决方案
- 优化Commit Log配置：合理调整Commit Log的刷写策略，例如增加Commit Log的缓存大小，减少刷写频率，从而降低I/O次数。
- 使用固态硬盘（SSD）：SSD的随机读写性能远高于传统机械硬盘，能有效缓解写入放大带来的性能问题。
读取放大解决方案
- 适当的Compaction策略：通过调整Compaction策略，如设置合适的Minor Compaction和Major Compaction触发条件，减少SSTables的数量，从而降低读取时需要扫描的SSTable数量。
- 缓存机制：采用分布式缓存（如Memcached），缓存经常读取的数据，减少对Cassandra集群的读取压力。
数据一致性延迟解决方案
- 调整Memtable刷新策略：适当降低Memtable刷新阈值，使数据更快地从Memtable刷新到SSTable，减少数据不一致的时间窗口。
- 同步机制：在节点之间采用更高效的同步机制，例如基于 gossip协议的优化，确保节点间的数据同步更及时。

星途面试题库