当前位置:   article > 正文

三.数据库基础-国产数据库-华为GaussDB高斯学习这一篇就够了(详细)_华为高斯数据库

华为高斯数据库

简介

高斯数据库(GaussDB),是华为发布的国产自主研发数据库。核心可以算是在PostgreSQL9.2基础上的魔改,但自研比例已经相当高。现在基于分布式的关系型数据库GaussDB 200/300已在金融企业较多使用。
因版权要求这里对于其细节没有过多描述,建议学习高斯前先学习MySQl与Oracle,其内容都差不多。

Oracle迁移高斯注意点

  • 与Oracle不同,GaUS5DB 数据库对象命名默认以小写形式保存在数据库中,使用
    时默认不区分大小写。如果需要区分大小马,需要在加双引号引用对象 名,不建议
    使用大小写敏感的命名。
  • 没有 DUAL 表,替代表 SYS_DUMMY,或直接 SELECT,不使用 FROM 关键字,如
    "SELECT 1’
  • 序列查询使用方式 select nextval(‘序列名’)
  • 没有伪列 rownum,分页查询 使用 Limit 关键字
  • 对象命名长度问题 GaussDB 绝大部分对象命名长度上限为 63 字节,Oracle 为 128
    字节(需注意对象迁移因命名长度导致失败)
  • ORACLE 会默认进行数据类型转换,GaussDB 当数字类型和字符类型进行数字运算
    会报错、两个字符类型运算会隐式转换,总之避免隐式的数据类型转换问题
    如 SELECT 1 + '1.25’在 Gaus5DB 会执行错误
  • 高斯的语法上多像Mysql。

高斯学习笔记

1概述

1.1整体流程描述

客户端CNGTMDN
1监听服务
2请求链接服务
3权限验证
4发送执行脚本请求
5分配服务线程
6请求分配全局事物
7返回全局事物
8脚本解析优化
9发送执行计划给DN
10启动线程执行脚本
11返回执行结果
12返回执行结果12销毁线程
13关闭连接
14销毁线程

2数据库相关

2.1事务控制

支持事务的启动、设置、提交、回滚。支持读已提交、读未提交两种隔离级别。采用MVCC两阶段锁方式,实现读写不堵塞。

2.2连接方式

可以采用客户端工具gspl、应用程序接口(JDBC、ODBC)、psql连接。

2.2创建数据库

初始包含两个模板数据库template0、template1,和一个默认用户数据库postgres。使用命令创建数据库实际上是通过拷贝template0来实现。创建后可以查看、修改、删除数据库。注意:不支持跨库查询。
数据库字典表pg_database。

2.3数据存储方式

支持行存储或列存储。

存储方式描述优点缺点适用场景
行存将表按行存储在磁盘数据保存在一起,DML方便查询时几列时所有数据都会涉及1返回记录少,基于索引的点查询2DML操作多
列存将表按列存储在磁盘1查询时只有涉及的列会被读取2高效投影3任何列都可以为索引1DML麻烦2选择后需重新组装1关联、分组操作较多的统计分析查询2DML少3一次批量插入后查询4列较多5查询时涉及少数列

2.4表空间

默认两个表空间pg_default、pg_global。也可以用户自定义表空间。

pg_default默认表空间,存储非共享系统表、用户表、用户索引、临时表、临时索引、内部临时表
pg_global共享表空间,存储共享系统表

表空间字典表:pg_tablespace
查询表空间使用率:select PG_TABLESPACE_SIZE(‘表空间名’)

2.5表

  • 注意服务端与客户端字符集不一致问题,会导致输出结果与预期不一致。
  • 批量更新删除后,会在数据文件中产生大量的删除标记,查询工程中标记删除的数据也会扫描。所以批量更新删除反复的场景,定期执行VACUUM FULL 可以保持查询性能。
  • 表数据字典:pg_tables
  • 系统表:pg_user数据库中用户表、视图PG_STAT_ACTIVITY可以查看正在运行的查询语句、函数PG_TERMINATE_BACKEND可以根据线程ID结束会话。

2.6模式schema

schema又叫模式,用于管理权限。高斯同样存在用户与角色,与模式类似但管理权限角度不同。
每个库中都有一个pg_catalog_schema,包含系统表和所有内置数据类型、函数、操作符。

2.7表分区

支持范围分区:将数据基于范围映射到每一个分区。

2.8索引

按索引方式分支持:唯一索引、多字段索引、部分索引(建立在一个表的子集上,这种索引方式只包含满足条件表达式的元组)、表达式索引。
可以在分区表上建立分区索引。

2.9视图

2.10序列

通过序列使某字段成为唯一标识符有两种方法:
1声明字段类型为序列整型,由数据库在后台自动创建一个对应的Sequence
2使用CREATE SEQUENCE创建一个序列,然后将nextval(‘序列名’)函数值作为字段值。

2.11定时任务

兼容Oracle定时任务功能。
1.先建存储过程 create or replace procedure xxx;
2.建定时任务 call dbe_task_submit(‘call 存储过程名’,sysdate,‘interval “1 minute”’,a);
1分钟调用一次存储过程。

视图my_jobs可以查看当前用户创建的任务信息。
停止任务 call dbe_task.finish(1,true);
启动任务 call dbe_task.finish(1,false);
修改任务 call dbe_task_next_time(1,sysdate+1.0/24);改成1小时后执行
pg_job表存储了任务的权限信息。
参数job_queue_processes为0时表示关闭定时任务功能,大于0时表示其并发数。

2.12存储过程、函数、触发器、约束

与Mysql类似

2.14数据类型

  • 字符串:
    • 定长:CHAR(n)、CHARCTRE(n)、NCHAR(n)、BPCHAR(n)
    • 变长:VARCHAR(n)、CHARACTER VARYING(n)、VARCHAR2(n)、NVARCHAR2(n)、TEXT
  • 数值类型
    • 整数类型:TINYINT、SMALLINT、INTEGER、BINARY_IN
      TEGER、BIGINT
    • 任意精度型:NUMERIC[(p[,s])],DECIMAL[(p[,s])] 、NUMBER[(p[,s])]
    • 序列整型:SMALLSERIAL、SERIAL、BIGSERIAL
    • 浮点类型:REAL,FLOAT4、DOUBLE PRECISION,FLOAT8、FLOAT[§]、BINARY_DOUBLE、DEC[(p[,s])]、INTEGER[(p[,s])]
  • 货币类型:money
  • 布尔类型:BOOLEAN
  • 二进制类型:BLOB、RAW、BYTEA
  • 日期/时间类型:DATE、TIME、TIMESTAMP
  • 几何类型
  • 网络地址类型
  • 位串类型
  • 文本搜索类型
  • UUID 类型
  • JSON/JSONB 类型
  • HLL 数据类型
  • 范围类型
  • 对象标识符类型
  • 伪类型

3分布式设计

3.1表分布式方式

方式描述适用
Hash通过Hash方式散列到集群中多有DN上数据量大
Replication每个DN全量复制数据量小
Range对指定列进行范围映射到不同DN,范围分布根据范围部分
List对指定列进行值规则映射,值规则分布根据值类型分布

分布键的选择非常重要,选择不当会导致数据倾斜。

  • 分布键应该比较离散
  • 尽量不选在查询中存在常量过滤的字段
  • 尽量选择查询中关联条件字段

3.2表分布式与分区

表分区为物理数据分散,表分布为逻辑分布。互不影响。

4性能调优

4.1查询执行时间长sql

1.查询系统中长时间运行语句
SELECT current_timestamp - query_start AS runtime,datname,usename,query FROM pg_stat_activity WHERE state !=‘idle’ ORDER BY 1 DESC;
2.设置参数track_activities为on。
3.查看正在运行查询,查看视图pg_stat_activity
4.查询阻塞语句。
SELECT datname,usename,state,query FROM pg_stat_activity WHERE waiting = true;
5.查看阻塞信息。

SELECT w.query as waiting_query,
w.pid as w_pid,
w.usename as w_user,
l.query as locking_query,
l.pid as l_pid,
l.usename as l_user,
t.schemaname ||'.'|| t.relname as tablename
from pg_stat_activity w 
join pg_locks l1 on w.pid = l1.pid 
and not l1.granted join pg_locks l2 on l1.relation = l2.relation
and l2.granted join pg_stat_activity l on l2.pid = l.pid
join pg_stat_user_tables t on l1.relation = t.relid
where w.waiting;
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13

6.结束会话
SELECT PG_TERMINATE_BACKEND(线程ID);

4.2执行计划调优

其他大神总结

DM8(达梦8)数据库安装和使用

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/煮酒与君饮/article/detail/747157
推荐阅读
相关标签
  

闽ICP备14008679号