赞
踩
列示存储
存储编码方式
文件格式
多副本存储,自动数据迁移、副本均衡
自动写入的智能索引
用户自主选择的二级索引
基于MPP的火山模型
利用多节点间并行数据处理
节点内并行执行,充分利用多CPU资源
自适应的两阶段聚合算子,避免阻塞等待。
大量优化Join算子,以Runtime Filter为例
向量化:一次对一组值进行运算的过程
充分提升CPU执行效率
进一步利用CPU SIMD指令加速计算效率
规则优化RBO
常量折叠:
子查询改写:
谓词下推:
代价优化CBO
Join Reorder
Colocation Join
Bucket Join
智能判断关联条件和数据分布关系,减少Shuffle数据量。
建表
模型
Broker Load
HDFS或所有支持S3协议的对象存储。
Stream Load
通过 HTTP 协议导入本地文件或数据流中的数据。
Routine Load
生成例行作业,直接订阅Kafka消息队列中的数据。
Binlog Load *
增量同步用户在Mysql数据库的对数据更新操作的CDC。
Flink Connector
在Flink中注册数据源,实现对Doris数据的读写。
Spark Load
通过外部的 Spark 资源实现对导入数据的预处理。
Insert Into
库内数据ETL转换或ODBC外表数据导入。
多版本机制解决读写冲突,写入带版本、查询带版本
两阶段导入保证多表原子生效
通过分区分桶裁剪,减少查询对系统资源消耗
支持SQL/PartitionCache,降低重复查询对资源的消耗
同时支持节点和查询级别的资源划分
一套集群同时支持在线离线查询,解决资源抢占问题
多用户对集群资源更合理的划分
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。