Apache HBase

HBase是一个开源非关系型分布式数据库(NoSQL),它参考了谷歌BigTable建模,实现的编程语言为 Java。它是Apache软件基金会Hadoop项目的一部分,运行于HDFS文件系统之上,为 Hadoop 提供类似于BigTable 规模的服务。因此,它可以對稀疏文件提供極高的容錯率

Apache HBase
開發者Apache软件基金会
当前版本
  • 2.5.0(2022年8月31日;最终测试版本)
  • 2.4.14(2022年8月29日;穩定版本)
編輯維基數據鏈接
源代码库 編輯維基數據鏈接
编程语言Java
操作系统跨平台
类型非关系型数据库
许可协议Apache协议 2.0
网站hbase.apache.org

HBase在列上实现了BigTable论文提到的压缩算法、内存操作和布隆过滤器。HBase的表能够作为MapReduce任务的输入和输出,可以通过Java API页面存档备份,存于互联网档案馆)来存取数据,也可以通过REST、Avro或者Thrift的API来访问。

虽然最近性能有了显著的提升,HBase 还不能直接取代SQL数据库。如今,它已经应用于多个数据驱动型网站[1][2],包括 Facebook的消息平台[3][4]

在 Eric Brewer的CAP理论中,HBase属于CP类型的系统。

历史

Apache HBase最初是Powerset公司为了处理自然语言搜索产生的海量数据而开展的项目。不过现在它已经是Apache基金会的顶级项目,并且引起了广泛的关注[5]

Facebook在2010年11月选用了HBase来实现它新的消息平台[3]

参考资料

  1. ^ Powered By HBase. [2014-01-05]. (原始内容存档于2013-03-27). 
  2. ^ StumbleUpon HBase Presentation. [2014-01-05]. (原始内容存档于2013-10-21). 
  3. ^ 3.0 3.1 The Underlying Technology of Messages. [2014-01-05]. (原始内容存档于2014-12-06). 
  4. ^ Facebook: Why our 'next-gen' comms ditched MySQL页面存档备份,存于互联网档案馆) Retrieved: 17 December 2010
  5. ^ Powerset Blog 互联网档案馆存檔,存档日期2013-02-19.

参考书目

外部链接