博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
技术分享:Hbase存储模式
阅读量:6091 次
发布时间:2019-06-20

本文共 1041 字,大约阅读时间需要 3 分钟。

  Hbase本身是数据库,本身就是为了存储数据,因此了解其存储原理对我们是很有必要的,这样我们才能更好的使用Hbase。

  首先才能存储模式开始,Hbase的存储模式与传统型的存储模式有什么区别。

  列式存储(Columnar or column-based)是相对于传统关系型数据库的行式存储(Row-basedstorage)来说的。简单来说两者的区别就是如何组织表

  ·行式存储以一系列的行来存储一个表,一行一行的进行存储

  ·列式存储以一系列的列来存储一个表, 一个列一个列的进行存储

  

  

  

  如果需要关系查询,那么行式存储很好

  行式存储最大的优点是关系之间的解决方案,表与表之间很大的关联关系并且数据量不大,那么行式存储就是很好的选择。记住因为它的线性扩展性不高,需要保证数据量不能特别大,控制在千万级与以下。

  如果数据量非常大,使用列式存储

  在大数据,利于压缩和扩展的肯定要选择列式存储,如果事务使用率不高,那么也最好使用列式存储,随机更新更些行的频率不高,也可以使用列式存储

  列族就是多个数据列的组合,列族式可以说是表的schema的一部分,而列不是。Hbase可以说是列簇数据库,在创建表的时候要指定列族,而不需要指定具体的列。

  Hbase Table组成:

  Table = rowkey + family + column + timestamp + value

  数据存储模式:

  (Table, rowkey , family , column , timestamp) - Value

  Hbase列数据默认可以保存3个版本,不过可以设置该属于保存几个版本。

  HBase是一个稀疏的、分布式、持久、多维、排序的映射,它以行键(row key),列键(column key)和时间戳(timestamp)为索引。

  Hbase在存储数据的时候,有两个SortedMap,首先按照rowkey进行字典排序,然后再对Column进行字典排序。

  

  这张图可以看到其存储排序是先由rowkey排序,然后按列的名称进行排序

  

  Hbase作为NoSQL数据库和传统型数据库有相似的地方,但也有很大的差别,Hbase更多的是为了扩展性和性能考虑,弱化了事务,一起带着全新的思维来学习Hbase吧

转载于:https://juejin.im/post/5c00f3c1e51d4550c76d9138

你可能感兴趣的文章
以太坊系列之六: p2p模块--以太坊源码学习
查看>>
使用scikit-learn解决文本多分类问题(附python演练)
查看>>
2018 年最值得关注的 JavaScript 趋势
查看>>
什么是区块链?超级账本 Brian Behlendorf 从五个方面教你认识
查看>>
Linux中的帮助功能
查看>>
针对Android的Pegasus恶意软件版本和针对iOS的有什么不同?
查看>>
全局探色器
查看>>
Hive Export和Import介绍及操作示例
查看>>
http://mongoexplorer.com/ 一个不错的 mongodb 客户端工具。。。
查看>>
上传jar包到nexus私服
查看>>
Why Namespace? - 每天5分钟玩转 OpenStack(102)
查看>>
Project:如何分析项目中的资源分配情况
查看>>
HDU 4803 Poor Warehouse Keeper (贪心+避开精度)
查看>>
小错误汇总
查看>>
Spring源码系列 — Envoriment组件
查看>>
java正则表达式去除html标签,Java中正则表达式去除html标签
查看>>
使用Cobbler批量部署Linux操作系统
查看>>
zabbix企业应用之服务端与客户端的安装
查看>>
实例讲解遗传算法——基于遗传算法的自动组卷系统【理论篇】
查看>>
无法在web服务器上启动调试。调试失败,因为没有启用集成windows身份验证
查看>>