赞
踩
好处: 范围查询过滤比较快
弊端: 不适合点对点查询 索引必须依赖物理存储顺序
排序字段a,b,c 索引字段 a, ab ,abc
索引字段必须是排序字段的前缀
由于一条数据 不适合高qps的高频短查询,更适合低频的大数据复杂查询 优点:
ClickHouse将数据划分为多个partition,每个partition再进一步划分为多个index
granularity(颗粒),然后通过多个CPU核心分别处理其中的一部分来实现并行数据处理。
在这种设计下,单条Query就能利用整机所有CPU。极致的并行处理能力,极大的降低了查询延时。
弊端:
clickhouse即使对于大量数据的查询也能够化整为零平行处理。但是有一个弊端就是对于单条查询使用多cpu,就不利于同时并发多条查询。所以对于高qps的查询业务,clickhouse并不是强项。
用法:
create table t_order_mt2(
uid UInt32,
sku_id String,
total_amount Decimal(16,2),
create_time Datetime,
INDEX a total_amount TYPE minmax GRANULARITY 3 //跳数索引
) engine =MergeTree
partition by toYYYYMMDD(create_time)
primary key (uid)
order by (uid,sku_id)
字段说明:
1,GRANULARITY N 是设定跳数索引对于一级索引粒度的个数
2,minmax GRANULARITY 3 的含义就是为 每3*8192行数据计算一对该列的最大最小值,
3,当扫描行扫描到该区间时,会对比最大最小值,如果不在该范围,就可以直接跳过该区域的扫描。
4,PRIMARYKEY不同,跳数索引可以在建表后,即使已经存储数据后,即时添加,如下:
ALTER TABLE t_order_mt
ADD INDEX skipIdxAmount total_amount TYPE minmax GRANULARITY 3
查看一个表是否为二级索引表
1,sql语句:show CREATE TABLE t_order_index2;
2,进入/var/lib/clickhouse/data/default/t_order_index2/20200602_2_2_0查看文件
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。