HBase 是一个开源的、分布式的列族(column-family)NoSQL 数据库,运行在 Hadoop/HDFS 之上,适合存储海量稀疏数据,并提供接近实时的随机读写能力;其设计受 Google Bigtable 论文启发。(它也可用于时序、日志、用户画像等场景。)
/ˈeɪtʃbeɪs/
We store logs in HBase.
我们把日志存到 HBase 里。
To support fast lookups at scale, the team modeled user events as wide rows in HBase and scanned them with server-side filters.
为了在大规模数据下实现快速查询,团队把用户事件建模为 HBase 的宽行数据,并使用服务端过滤器进行扫描。
“HBase” 通常被理解为 “Hadoop 的数据库(Hadoop + database/base)”:它是 Hadoop 生态中的数据存储组件之一;名称中的 “H” 常被视为与 Hadoop 的关联。HBase 的核心思想与实现路径明显借鉴了 Google 的 Bigtable(如列族、稀疏表、按行键访问等)。