李锋镝的博客

  • 首页
  • 时间轴
  • 留言
  • 插件
  • 左邻右舍
  • 关于我
    • 关于我
    • 另一个网站
  • 知识库
  • 赞助
Destiny
自是人生长恨水长东
  1. 首页
  2. 原创
  3. 正文

HBASE填坑日志

2019年6月13日 19580点热度 0人点赞 3条评论

总结:

1.查询时能用rowKey查询尽量使用rowKey查询,这样hbase能最快确定数据在集群中的哪台机器上。

 

2.Scan.setReversed(true)、Filter.setReversed(true)可以将查询结果反转,但是有些限制:

使用Scan.setStartRow() Scan.setStopRow()时,如果Scan.setReversed(true)会导致查询不到数据。

使用FilterList时,所有的filter的reversed必须相同,否则会报错(Filters in the list must have the same reversed flag, this.reversed=XXX)。

 

3.Scan.setBatch()指定最多返回的Cell的数量,防止OutofMemory。

 

4.分页可以使用PageFilter,但是不能获取所有数据的总数量。

 

5.Filter.setFilterIfMissing()设置该行是否跳过。

 

6.可以使用SubstringComparator进行模糊查询;对RowKey使用RowFilter&RegexStringComparator进行正则查询;使用RowFilter&BinaryPrefixComparator对RowKey进行前缀查询。

 

7.按照时间戳查询可以使用Scan.setTimeRange()。

 

8.对于查询,使用Filter的效率远远低于使用RowKey(数据量越大越明显),设置合理的RowKey很重要,如果可以,尽量充分利用RowKey。

 

9.Scan.setMaxResultSize()设置的是二进制字节的大小,不是返回的数据的条数。

 

10.单条查询使用Get速度永远最快。

 

11.列族名、RowKey越短越好;能用一个列族搞定的就不要用两个列族,浪费空间,而且不方便查询。

 

暂时这么多,其他后续补充。

除非注明,否则均为李锋镝的博客原创文章,转载必须以链接形式标明本文链接

本文链接:https://www.lifengdi.com/archives/article/91

相关文章

  • HBASE初探
  • SpringBoot常用注解
  • CompletableFuture使用详解
  • 金融级JVM深度调优实战的经验和技巧
  • SpringBoot 中内置的 49 个常用工具类
本作品采用 知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议 进行许可
标签: hbase
最后更新:2019年6月13日

李锋镝

既然选择了远方,便只顾风雨兼程。

打赏 点赞
< 上一篇
下一篇 >

文章评论

  • 陈康

    感谢博主、但有的业务需要scan.setReversed 和 withStartRow/withStopRow 一起使用查询不到值、请问这种有解决方法吗?谢谢~

    2020年9月9日
    回复
    • 李锋镝

      @陈康 呃……我这边没有什么好的办法

      2020年9月27日
      回复
  • 超新星

    沙发

    2019年6月13日
    回复
  • 1 2 3 4 5 6 7 8 9 11 12 13 14 15 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 46 47 48 49 50 51 52 53 54 55 57 58 60 61 62 63 64 65 66 67 69 72 74 76 77 78 79 80 81 82 85 86 87 90 92 93 94 95 96 97 98 99
    回复 陈康 取消回复

    问君能有几多愁,恰似一江春水向东流。

    最新 热点 随机
    最新 热点 随机
    SpringBoot框架自动配置之spring.factories和AutoConfiguration.imports 应用型负载均衡(ALB)和网络型负载均衡(NLB)区别 什么是Helm? TransmittableThreadLocal介绍与使用 ReentrantLock深度解析 RedisTemplate和Redisson的区别
    玩博客的人是不是越来越少了?准备入手个亚太的ECS,友友们有什么建议吗?什么是Helm?2024年11月1号 农历十月初一别再背线程池的七大参数了,现在面试官都这么问URL地址末尾加不加“/”有什么区别
    祝大家六一儿童节快乐~~~ SpringBoot定时任务 - 经典定时任务设计:时间轮(Timing Wheel)案例和原理 JAVA设计模式-抽象工厂模式 忽然发现,在校大学生可以免费领一年有道云笔记会员~ RocketMQ的push消费方式实现详解 网易云什么时候能有杰伦的歌……
    标签聚合
    IDEA docker ElasticSearch Redis 设计模式 MySQL 数据库 日常 多线程 面试 文学 K8s JAVA SQL Spring 教程 分布式 架构 SpringBoot JVM
    友情链接
    • i架构
    • 临窗旋墨
    • 博友圈
    • 博客录
    • 博客星球
    • 哥斯拉
    • 志文工作室
    • 搬砖日记
    • 旋律的博客
    • 旧时繁华
    • 林羽凡
    • 知向前端
    • 蜗牛工作室
    • 集博栈
    • 韩小韩博客
    • 風の声音

    COPYRIGHT © 2025 lifengdi.com. ALL RIGHTS RESERVED.

    Theme Kratos Made By Dylan

    津ICP备2024022503号-3