hbase生产环境都适合哪些应用场景?

已邀请:

libis - HBase爱好者

赞同来自: openinx

hbase目前有很多的应用场景可以使用,最常见的有消息存储类(facebook的messenger,网易的易信,米聊等),历史订单类(阿里等),推荐系统,实时流存储(阿里双11大屏等),监控数据存储,图数据库底层存储,kylin底层存储等等。目前在几乎所有互联网公司都有使用,比如阿里、小米、华为、腾讯、网易、京东等等。

qgxiaozhan

赞同来自:

比较不适合查询条件多的情况。

hmaster

赞同来自:

比如:
日志存储、存储图片(MOB)、消息(FB、小米)、风控(阿里等)、运营商的帐详单(移动)、监控信息(OPTSDB)、用户轨迹(滴滴)、物联网数据(各种物联网公司)、各种电商的历史记录、商品评论等等。
其实不光是互联网公司,运营商使用也很广泛,比如运营商帐详单、照片、日志、监控数据、DPI数据、信令数据等等
 
其实HBase 适用场景非常非常多,这里就不一一列举了,可能从不适合的角度看更好: 

目前比较不适合:
1)核心交易类:对事务特性要求特别高。
2)单个对象特别大的,比如KV超过50M.这种建议直接HDFS(HBase MOB 对100K~10M支持良好)
3)组合查询条件比较多的。虽然可通过Phoenix等使用二级索引支持,但直接用HBase的话性能或者存储占用比较大。通常推荐 Solr(ES)+HBase使用。
4)主要用来做 OLAP的存储数据 (通常扫描大部分数据的各种聚合、分组、统计类):通常ORC/Parquet 列存+Spark(Presto/Hive/Tez)表现比 HBase 好。
5)模糊查询:HBase 只支持rowkey以及rowkey范围查询,模糊查询需要全表扫描(二级索引还是通过索引表rowkey找到主表的rowkey)。

要回复问题请先登录注册