1.添加二级索引配置
为使用Phoenix二级索引,需要开启HBase regionServer相关参数配置
- <property>
- <name>hbase.regionserver.wal.codec</name>
- <value>org.apache.hadoop.hbase.regionserver.wal.IndexedWALEditCodec</value>
- </property>
用户可直接在CM中的HBase配置页,搜索hbase-site.xml配置相关参数(保存并重启服务即可)
2.全局索引
全局索引适用于读多写少的场景,它会建立一张独立的HBase索引表,对原始数据侵入性小。所有对数据表的写操作都会引起索引表的更新(DELETE、UPSERT VALUES和UPSERT SELECT))。索引表分布在不同的数据节点上的,跨节点的数据传输带来了较大的性能消耗。如果查询列不在索引表中,默认索引表将不会被使用,除非使用hint(SELECT /*+ INDEX(table_name,index_name) */ …)。
- #建立全局索引
- CREATE INDEX IDX_PARENTID ON TMP_STAFF(parentid);
- #使全局地索引
- SELECT hrid FROM TMP_STAFF WHERE parentid = 1927;
- #强制使用全局索引
- SELECT /*+ INDEX(TMP_STAFF, IDX_PARENTID) */ hrid,departmentid
- FROM TMP_STAFF WHERE parentid = 1927;
Phoenix中创建索引并查看索引表数据
hbase shell中查看索引表数据
3.本地索引
本地索引适用于写多、读少、空间有限的场景。与全局索引一样,Phoenix将自动选择是否在查询时使用本地索引。索引数据和原表数据存放在相同的服务器中,防止写入期间出现任何网络开销。即使查询的字段不是索引字段,本地索引也会被使用。与全局索引不同,4.8.0之前版本,表的所有本地索引都存储在单独共享表中;从4.8.0开始,本地索引数据存储在同一个数据表中单独的影子列族中。在使用本地索引进行读取时,因为不能预先确定索引数据确切的region位置,因此必须检查每个region的数据。这会给读取时带来一些额外开销。
- #建立本地索引
- CREATE LOCAL INDEX IDX_LOCAL_PARENTID ON TMP_STAFF(parentid);
- #使用本地索引
- SELECT * FROM TMP_STAFF WHERE parentid = 1927;
Phoenix中创建索引并查看索引表数据
hbase shell中查看索引表数据
4.覆盖索引
覆盖索引的特点是我们可以把关心的列打包存储在索引表中,一旦在索引表中能够找到索引条目就不需要返回主表,直接拿到查询结果。
- #建立覆盖索引
- CREATE INDEX IDX_COVER_PARENTID on TMP_STAFF(parentid) include(departmentid);
- #使用覆盖索引
- SELECT departmentid FROM TMP_STAFF WHERE parentid = 1782 ;
5.函数索引
函数索引的特点是能根据表达式创建索引,适用于对查询表过滤条件是表达式的表创建索引。
- #创建函数索引
- CREATE INDEX IDX_FUNC_DEPARTMENTID ON TMP_STAFF (UPPER(departmentid));
- #使用函数索引
- SELECT * FROM TEST WHERE UPPER(departmentid)='HOTEL';
6.执行计划与性能
1> 创建索引并查看执行计划,发现进行了索引局部扫描RANG SCAN OVER IDX_DEPARTMENTID
- #创建全局索引
- CREATE INDEX IDX_DEPARTMENTID ON TMP_STAFF(departmentid);
- #查看执行计划
- explain select count(*) from TMP_STAFF where departmentid='hotel';
有索引情况下用时0.023S
2> 删除索引并查看执行计划,发现进行了全局扫描FULL SCAN OVER TMP_STAFF
- #删除全局索引
- DROP INDEX IDX_DEPARTMENTID ON TMP_STAFF;
- #查看执行计划
- explain select count(*) from TMP_STAFF where departmentid='hotel';
无索引情况下用时0.046