面试题答案
一键面试HBase同步复制
- 优点:
- 数据一致性高,主集群的数据变更会立即同步到从集群,从集群的数据状态与主集群几乎实时保持一致。在电商场景下,这能确保所有副本数据的准确,避免因数据不一致导致的业务问题,如库存数量显示差异等。
- 缺点:
- 对主集群性能影响较大。由于主集群需要等待同步操作完成才能确认写操作成功,在读写请求频繁时,会增加写操作的延迟,降低系统整体的吞吐量。
HBase异步复制
- 优点:
- 对主集群性能影响较小。主集群写操作完成后无需等待同步操作,可立即返回,能有效提高系统的写入性能和吞吐量,适应频繁的读写请求场景。
- 缺点:
- 数据一致性相对较弱。从集群的数据同步存在一定延迟,可能在短时间内出现主从数据不一致的情况,在电商场景下,这可能导致用户看到的某些数据(如商品销量、评价数量等)存在短暂的偏差。
更适合的方式及原因
在该中等规模电商用户行为数据存储场景下,异步复制更适合。原因如下:
- 数据量为100GB且读写请求频繁,系统对读写性能和吞吐量要求较高。异步复制方式下主集群写操作不受同步过程的过多阻碍,能更好地满足高并发读写需求。
- 虽然异步复制存在一定的数据一致性问题,但对于电商用户行为数据,如浏览记录、点击行为等,短时间内的数据不一致对业务影响相对较小,可接受这种短暂的偏差。而同步复制带来的性能瓶颈会对系统整体运行效率产生较大影响。