当前位置:   article > 正文

Flink-CDC实时读Postgresql数据

Flink-CDC实时读Postgresql数据

前言

        CDC,Change Data Capture,变更数据获取的简称,使用CDC我们可以从数据库中获取已提交的更改并将这些更改发送到下游,供下游使用。这些变更可以包括INSERT,DELETE,UPDATE等。

用户可以在如下的场景使用cdc:

  • 实时数据同步:比如将Postgresql库中的数据同步到我们的数仓中。
  • 数据库的实时物化视图。

Postgresql数据库配置

Postgresql参数修改

  1. # 更改wal日志方式为logical
  2. wal_level = logical # minimal, replica, or logical
  3. # 更改solts最大数量(默认值为10),flink-cdc默认一张表占用一个slots
  4. max_replication_slots = 20 # max number of replication slots
  5. # 更改wal发送最大进程数(默认值为10),这个值和上面的solts设置一样
  6. max_wal_senders = 20 # max number of walsender processes
  7. # 中断那些停止活动超过指定毫秒数的复制连接,可以适当设置大一点(默认60s)
  8. wal_sender_timeout = 180s # in milliseconds; 0 disable  

新建用户并且给用户赋流权限

  1. -- 创建用户 cdc_user
  2. CREATE USER cdc_user PASSWORD 'cdc';
  3. -- 授权连接
  4. GRANT CONNECT ON DATABASE postgres TO cdc_user;
  5. -- 给用户复制流权限
  6. ALTER ROLE cdc_user replication;
  7. -- 授权public的使用
  8. GRANT USAGE ON SCHEMA PUBLIC TO cdc_user;

创建复制槽

  1. ---- 创建复制槽
  2. -- wal2json decoder_raw test_decoding pgoutput
  3. select pg_create_logical_replication_slot('cdc_1','wal2json');<
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/笔触狂放9/article/detail/65666
推荐阅读
相关标签
  

闽ICP备14008679号