赞
踩
类似spark计算过程中算子数据落盘,支持算子数据落盘到本地磁盘节省内存使用,提升计算吞吐
因为使用向量化处理,比他们快,但是数据量不能太大,几十TB支持不了,10TB以内比较适合。
可以进行多种场景查询,比如高并发查询 和 低频大数据量分析查询同时查询集群,不相互影响。不同用户的查询实现资源隔离,查询和写入都可以指定资源组,也可以单独控制某个用户的查询资源使用量。
本地:可以做到冷热数据分离,不同热度的数据放在不同的磁盘上
云:实现存算分离,读取对象存储暂时没有查询缓存的能力,Doris内部是有结果缓存能力的
FE 16c 64g ssd
BE 32c 128g ssd
cpu 与内存的比例最好是:1:4
FE 分为observer,follower,leader角色
主从竞选只需要3个follower参与就可以了,如果要提升集群性能可以添加observer数量,如果为了提升极致的高可用,可以让这3个参加竞选的FE不提供数据服务
是使catlog方式获取元数据,不是使用映射表方式,Catalog 可以排除一些表,但权限不能同步过来。
Hive Catalog 支持动态刷新功能,其他的动态同步能力已开发好,正式版本还没发布。
可以,通过Flink推送的方式写入,能够查询到未刷写到磁盘的数据
不能
Doris 支持联邦查询,查询多种Catalog,能缓存元数据信息,从而支持查询多种数据源,可以通过Doris作为统一查询网关去查询。
查询外部数据经过测试性能比Presto 更优,有3倍的性能提升;可以Doris可以查询Presto但是存在Presto 语法暂时还不兼容。
Starocks 运营比较早,融资情况比较差,社区活跃度不高。
Doris支持的场景更多,目标是能实现All in one,集成多个组件优点。
支持
查询时物化视图对用户透明的,建议用户按需手动创建物化视图,不推荐一张明细表创建多个物化视图,不能根据业务查询自动创建或推荐cube
Mysql具有的权限能力Doris都有。查询Hive表时,某个用户Hive有的权限查询的表,Doris这边没有,需要重新赋权。
实现方式有两种:
1、配置一个Hive Catalog 配置时,可以配置Hive超管用户,在Doris这边再对每个用户重新赋权,在Doris侧做权限管控,查询Hive时使用超管去查询hive数据
2、配置每个业务自己创建自己的Catalog,每个Catalog配置不同的用户权限,但是这样容易形成非常多的Catalog,不利于管理。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。