MST
星途 面试题库

面试题:Hbase中Scan框架体系在Server端的核心组件有哪些

请阐述Hbase Server端Scan框架体系中的核心组件,并简要说明每个组件在数据扫描过程中所扮演的角色和作用。
18.6万 热度难度
数据库Hbase

知识考点

AI 面试

面试题答案

一键面试

核心组件及作用

  1. Region Server
    • 角色:负责管理分配给自己的Region,处理客户端的读写请求。
    • 作用:数据扫描时,它接收来自客户端的Scan请求,定位到相关的Region,并在这些Region上执行具体的数据扫描操作。
  2. Region
    • 角色:HBase中分布式存储和负载均衡的基本单位,包含多个Store。
    • 作用:存储实际数据,在扫描时,它作为数据的逻辑容器,Region Server根据Scan请求,从相应的Region中检索数据。
  3. Store
    • 角色:对应表中的一个列族,由MemStore和StoreFile组成。
    • 作用:扫描时,先从MemStore(内存中存储最近写入的数据)中查找数据,如果未找到,再从StoreFile(磁盘上存储的数据文件)中读取,负责具体的数据存储和读取操作。
  4. MemStore
    • 角色:内存中的数据存储结构,按KeyValue对形式存储数据。
    • 作用:数据写入时先存于MemStore,扫描时优先在其中查找最新的数据,当MemStore达到一定阈值会刷写到磁盘成为StoreFile。
  5. StoreFile
    • 角色:磁盘上的HFile文件,持久化存储数据。
    • 作用:存储大量历史数据,扫描时若MemStore中无数据则从此处读取,提供数据的持久化存储和检索。
  6. Scanner
    • 角色:用于遍历Region、Store等组件中数据的迭代器。
    • 作用:按顺序从MemStore和StoreFile中读取数据,并将符合Scan条件的数据返回给客户端,控制数据扫描的流程和数据返回逻辑。