与标题一样,如果在这三种情况下: 1:我需要匹配行的开头,如"abc*“、"abc\d”等等,那么HBase RegexStringComparator在RowFilter中的效率是什么?因为它不需要扫描整个表,所以它有很好的效率。
2:在行的中间位置匹配,如"\d{3,4}abc\w+“等,我认为它需要扫描所有行,效率很差。
3:排尾匹配,和第二种情况一样,也有不好的效率。
我有正确的理解吗?
发布于 2017-02-13 03:23:52
只有使用STARTROW和ENDROW进行范围扫描才能提高查询效率,任何过滤器都会在扫描之后运行,因此您所描述的所有3种条件都具有相同的效率。
https://stackoverflow.com/questions/37106575
复制相似问题