面试题答案
一键面试数据分布
- 均匀性:基于位置的片键能使地理位置相近的数据分布在同一个分片上。例如,如果以经纬度作为片键,相近区域的数据会被分到一起,在一定程度上实现数据的局部聚集,并非完全均匀分布在各个分片。这种聚集对于需要按区域访问数据的应用场景很有优势,减少跨分片的数据获取。
- 数据倾斜:若数据在地理位置上分布不均匀(如人口密集区域数据多,偏远地区数据少),以位置为片键可能导致数据倾斜。某个分片会承载大量数据,而其他分片数据量较少,影响整体集群性能。
查询效率
- 范围查询:对于基于地理位置的范围查询(如查询某个城市内的数据),如果使用位置片键,查询可以直接定位到相关分片,无需在所有分片中扫描,大大提高查询效率。例如,查询某个特定区域内的商店信息,基于位置片键能快速筛选出存储该区域数据的分片,减少数据检索量。
- 全局查询:进行全局查询(如查询全国范围内符合某条件的数据)时,可能需要扫描多个分片,但由于位置片键使得数据按区域聚集,相比于无规律片键,仍能减少不必要的跨分片扫描,一定程度上优化全局查询性能。不过,如果数据倾斜严重,查询到数据倾斜的分片时,可能成为查询性能瓶颈。