当前位置:   article > 正文

实时同步:使用 Canal 和 Kafka 解决 MySQL 与缓存的数据一致性问题_kafka如何同步canal数据

kafka如何同步canal数据

目录

1. 准备工作

2. 将需要缓存的数据存储 Redis

3. 监听 canal 存储在 Kafka Topic 中数据


1. 准备工作

1. 开启并配置MySQL的 BinLog(MySQL 8.0 默认开启)

修改配置:C:\ProgramData\MySQL\MySQL Server 8.0\my.ini

  1. log-bin="HELONG-bin"
  2. binlog_format=ROW # 只能配置行模式, 因为 Cannal 不具备将SQL转化成数据的能力
  3. binlog-do-db=aicloud # 监控 AI Cloud 项目

如果要同步多个项目:

  1. binlog-do-db=aicloud
  2. binlog-do-db=aicloud2
  3. binlog-do-db=aicloud3

2. 重启MySQL服务

3. 赋值数据同步权限

  1. CREATE USER canal IDENTIFIED BY 'canal';
  2. GRANT SELECT, REPLICATION SLAVE, REPLICATION CLIENT ON *.* TO 'canal'@'%';
  3. FLUSH PRIVILEGES;

4. 安装并配置 Canal

下载地址:https://github.com/alibaba/canal/releases

① 修改canal.properties

  1. canal.serverMode=kafka
  2. canal.mq.servers=127.0.0.1:9092

canal 监控 binlog 日志,binlog 日志的传输默认使用 MySQL 的复制协议(基于 TCP/IP),

可以使用写代码的方式直接从 MySQL 服务器读取数据,此处使用本地 kafka 进行存储。

② 修改instance.properties

  1. canal.instance.mysql.slaveId=100 # 大于 1 即可
  2. canal.instance.master.address=127.0.0.1:3306
  3. canal.mq.topic=ai-cloud-canal-to-kafka

slaveId 表示从节点 id,canal 的执行原理就是伪装成一个从库去主库同步数据

(主节点的 slaveId = 1)

address 配置连接本地的 MySQL

topic 配置数据发送到 Kafka 的某个主题下

5. 拷贝 Jar 包到 lib

将 canal 下 plugin 下的所有 jar 包拷贝到 lib 目录下。

6. 删除 bin 目录下 startup.bat 里的参数

如果启动时报错:

Unrecognized VM option 'PermSize=128m'

Error: Could not create the Java Virtual Machine.

Error: A fatal exception has occurred. Program will exit.

删除 -XX:PermSize=128m 参数即可。

7. 启动 canal

打开 cmd ,cd 到 bin 目录下,输入 startup.bat 回车

2. 将需要缓存的数据存储 Redis

此时我将这个查询列表接口的数据,存储在 Redis 中:

  1. /**
  2. * 获取历史聊天记录(对话/绘图)
  3. *
  4. * @param type
  5. * @return {@link ResponseEntity }
  6. */
  7. @RequestMapping("/list")
  8. public ResponseEntity getHistoryList(Integer type, Integer model) {
  9. String listCacheKey = RedisUtil.getListCacheKey(SecurityUtil.getCurrentUser().getUid(), model, type);
  10. Object list = redisTemplate.opsForValue().get(listCacheKey);
  11. if (ObjectUtil.isNull(list)) {
  12. LambdaQueryWrapper<Answer> queryWrapper = new LambdaQueryWrapper<>();
  13. queryWrapper.eq(Answer::getUid, SecurityUtil.getCurrentUser().getUid());
  14. queryWrapper.eq(Answer::getType, type);
  15. queryWrapper.eq(Answer::getModel, model);
  16. queryWrapper.orderByDesc(Answer::getAid);
  17. List<Answer> answerList = answerService.list(queryWrapper);
  18. List<Long> userIds = answerList.stream().map(Answer::getUid).collect(Collectors.toList());
  19. Map<Long, User> userIdMap = userService.selectByIds(userIds).stream().collect(Collectors.toMap(User::getUid, Function.identity()));
  20. List<AnswerVo> answerVoList = answerList.stream().map(answer -> AnswerVoUtil.getListAnswerVo(answer, userIdMap)).collect(Collectors.toList());
  21. // 缓存 1 天
  22. redisTemplate.opsForValue().set(listCacheKey, answerVoList, 1, TimeUnit.DAYS);
  23. return ResponseEntity.success(answerVoList);
  24. } else {
  25. return ResponseEntity.success(list);
  26. }
  27. }
  1. /**
  2. * 查询列表存储 Redis 缓存
  3. *
  4. * @param uid
  5. * @param model
  6. * @param type
  7. * @return {@link String }
  8. */
  9. public static String getListCacheKey(Long uid, Integer model, Integer type) {
  10. return "LIST_CACHE_KEY_" + uid + "_" + model + "_" + type;
  11. }

3. 监听 Kafka Topic 中数据并删除 Redis 缓存

首先对数据库中需要缓存的数据进行一些修改操作:

此时,使用 kafka ui(下载地址划到最底下),刷新 kafka 对应 topic 下的 message,就可以看到当前所作出的修改:

执行修改操作:将 “如何学习Spring???”修改成 “如何学习Spring??”

执行删除操作:

由此可见,对数据库的每一个修改操作,都是对应固定格式的一个数据,所以可以监听对应的  topic 并针对 data 中的数据进行一个提取,得到一个  cacheKey,然后删除对应的缓存,使得下一次的查询去访问数据库,并同步缓存。

【代码示例】

  1. /**
  2. * canal 监控 binlog 日志,将修改的数据存储 kafka topic 中
  3. * 监听 kafka topic 中的数据
  4. *
  5. * @param data
  6. * @param ack
  7. * @throws JsonProcessingException
  8. */
  9. @KafkaListener(topics = {KafkaConstant.CANAL_TOPIC})
  10. public void canalListen(String data, Acknowledgment ack) throws JsonProcessingException {
  11. HashMap<String, Object> map = objectMapper.readValue(data, HashMap.class);
  12. if (map.isEmpty()) {
  13. ack.acknowledge();
  14. return;
  15. }
  16. // 匹配上对应的数据库和数据表
  17. if (KafkaConstant.TARGET_DATABASE.equals(map.get(KafkaConstant.DATABASE_KEY).toString()) &&
  18. KafkaConstant.TARGET_TABLE.equals(map.get(KafkaConstant.TABLE_KEY).toString())) {
  19. // 更新缓存
  20. List<Map<String, Object>> list = (List<Map<String, Object>>) map.get(KafkaConstant.DATA_KEY);
  21. if (!CollectionUtils.isEmpty(list)) {
  22. for (Map<String, Object> answerMap : list) {
  23. String answerListCacheKey = RedisUtil.getListCacheKey(
  24. Long.valueOf(answerMap.get("uid").toString()),
  25. Integer.parseInt(answerMap.get("model").toString()),
  26. Integer.parseInt(answerMap.get("type").toString()));
  27. // 删除缓存,让下一次查询走数据库,并同步缓存
  28. redisTemplate.delete(answerListCacheKey);
  29. }
  30. }
  31. }
  32. // 手动确认应答
  33. ack.acknowledge();
  34. }
  1. /**
  2. * canal 同步数据到 kafka
  3. */
  4. public static final String CANAL_TOPIC = "ai-cloud-canal-to-kafka";
  5. /**
  6. * 数据库,缓存数据一致性的
  7. */
  8. public static final String DATABASE_KEY = "database";
  9. public static final String TABLE_KEY = "table";
  10. public static final String DATA_KEY = "data";
  11. public static final String TARGET_DATABASE = "aicloud";
  12. public static final String TARGET_TABLE = "answer";

【补充】

kafka ui 下载地址:​​​​​​https://github.com/provectus/kafka-ui/tags

修改配置

  1. kafka:
  2. clusters:
  3. - name: kafka3_cluster
  4. bootstrapServers: 127.0.0.1:9092

 

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/人工智能uu/article/detail/937910
推荐阅读
相关标签
  

闽ICP备14008679号