[00288864]一种基于 HBase 的大数据存储与检索方法及系统
交易价格:
面议
所属行业:
网络
类型:
发明专利
技术成熟度:
正在研发
专利所属地:中国
专利号:201510376791.2
交易方式:
技术转让
技术转让
技术入股
联系人:
武汉大学
进入空间
所在地:湖北武汉市
- 服务承诺
- 产权明晰
-
资料保密
对所交付的所有资料进行保密
- 如实描述
技术详细介绍
本发明公开了一种基于 HBase 的大数据存储与检索方法及系统,本发明基于数据文件字段映射表, 利用 HBase?Thrift 客户端,通过定义好的 RowKey 表达式生成行键,将按行存储的数据导入到 HBase 数据库中。在保持一致性的前提下,将数据对象的多特征值按照多种组合方式加入形成行键,与普通列值数据组成 HBase 数据行,按不同行键组成方式存放在多张 HBase 数据表中,进行多特征值数据检索时根据行键中的几个特征值匹配可快速得到模糊结果集,对模糊结果集进一步采用 filter 过滤以得到最终精确结果集合。研究结果能够适用于不同类型的数据文件到目的 HBase 数据库的大数据转换存储过程, 具有较强的通用性,按照多特征值组合方式形成行键存储数据,能提供快速的数据检索接口,达到快速检索的目的。
本发明公开了一种基于 HBase 的大数据存储与检索方法及系统,本发明基于数据文件字段映射表, 利用 HBase?Thrift 客户端,通过定义好的 RowKey 表达式生成行键,将按行存储的数据导入到 HBase 数据库中。在保持一致性的前提下,将数据对象的多特征值按照多种组合方式加入形成行键,与普通列值数据组成 HBase 数据行,按不同行键组成方式存放在多张 HBase 数据表中,进行多特征值数据检索时根据行键中的几个特征值匹配可快速得到模糊结果集,对模糊结果集进一步采用 filter 过滤以得到最终精确结果集合。研究结果能够适用于不同类型的数据文件到目的 HBase 数据库的大数据转换存储过程, 具有较强的通用性,按照多特征值组合方式形成行键存储数据,能提供快速的数据检索接口,达到快速检索的目的。