HBase多模式的机遇与挑战

  • 2019 年 11 月 23 日
  • 筆記

什么是Apache HBase

Hadoop Database,是一个基于Google BigTable论文设计的高可靠性、高性能、可伸缩的分布式存储系统。

  • 松散表结构(Schema free)
  • 原生海量数据分布式存储
  • 随机查询、范围查询
  • 高吞吐,低延迟
  • 在线分布式数据库
  • 多版本,增量导入,多维删除

ApsaraDB HBase Platform

  • 平台架构
  • 平台优势

Item

ApsaraDB ForHBase (Aliyun Product)

ApacheHBase(Software)

Basic

High availability

99.9%~ 99.99%

N/A

Data reliability

99.999999999%

N/A

Online Ability

Multi-master clustering

Multi-master clustering,Multi-AZ/Regon

NO

GC

FGCNO,YGC5ms

GC 20s~100s,YGC100ms+

Reduce Cost

Storage Cost

Cut by 50%+on share cloud disk,Total3 Copy

Maybe on Cloud Disk,Total9 Copy

SupportCold Storage

SupportOSS,Cut by 70% atless read

NO

Multi-model DB

Multi-model DB

KV,Tabular,SQL,Graph,Time Series,Geospatial Full Text index, Search

KV,Tabular

Enterprise Characteristics

Disaster recovery

Backup and Restore

NO,maybe3.0

Security

user/password,ACL

Kerberos,ACL

Analytics

SparkonHBase ,Moreoptimization

SparkonHBase

Version upgrade

Automatic upgrade

N/A

Self-driven

Databasecontrol system

15min Createa DB/MonitorOnline add storage and node/ElasticPowerinfuture

N/A

Diagnostic System

Big request ,Big Table merge,HotRegion……

NO

  • 使用场景

数据类型

存储对象

代表场景

组件

优势

KV/表格存储

稀疏表

简单kv信息风控 画像表等稀疏表

HBase API

动态列

SQL

带类型的

替换单机关系数据库

HBase-Phoenix

SQL语法具备Hbase所有的优势

文档数据

json/xml/html

新闻

HBaseAPI

存储空间大

对象数据

图片/视频等

小对象存储

HBase

性能与存储空间兼备

时序数据

传感器数据

监控数据

HBaseHBase-OpenTSDB

写性能高、存储量大

时空数据

轨迹

轨迹、时空数据

HBaseHBase-GeoMesa

写性能高、存储量大

图关系数据

关系

欺诈场景

Hbase-HGraphDB

分布式图

OLAP

cube

报表

Kylin或自己构建

计算前置实时查询

人才的成长

  • 成长历程
    • 2-3年夯实基础
    • 4-6年成为专家
    • 7-10年无中生有
    • 引领-带领
  • 成长建议
    • 关注社区,多写文章
    • 请教高手
    • 项目中成长
    • 保持敬畏
    • 坚持

附上HBase多模式的机遇与挑战PPT:

Sharding-Sphere由Sharding-JDBC、Sharding-Proxy和Sharding-Sidecar组成的开源生态圈,提供数据分片、读写分离、柔性事务和数据治理功能。Sharding-Sphere官方公众号定期发布Sharding-Sphere官方更新。