当前位置:   article > 正文

DataX使用之MongoDB2HDFS

datax mongodbreader 注意事项

序:

本文首先介绍DataX使用(编写配置文件的方式)之MongoDB中的数据导出到HDFS上的一些注意事项,datax安装没有什么坑,所以本文不对此进行详细介绍,详细安装过程请自行查看官网。

一、datax的基本使用

1、datax的目录结构

目录说明:

backup:本人自己创建的备份目录

,因为后续使用过程中涉及到更改源码,将原生的jar包备份到此文件夹中

bin:datax的命令

conf:datax的配置文件

job:任务编写的json配置文件存放的位置,官方的demo也在这个目录下

log:运行日志爱

plugin:reader/writer的源码包,后续可以自己更改源码上传替换

script:没啥用

tmp:临时目录

2、查看任务模板

 python ./datax.py -r mongodbreader -w hdfswriter 

  1. {
  2. "job": {
  3. "content": [
  4. {
  5. "reader": {
  6. "name": "mongodbreader",
  7. "parameter": {
  8. "address": [],
  9. "collectionName": "",
  10. "column": [],
  11. "dbName": "",
  12. "userName": "",
  13. "userPassword": ""
  14. }
  15. },
  16. "writer": {
  17. "name": "hdfswriter",
  18. "parameter": {
  19. "column": [],
  20. "compress": "",
  21. "defaultFS": "",
  22. "fieldDelimiter": "",
  23. "fileName": "",
  24. "fileType": "",
  25. "path": "",
  26. "writeMode": ""
  27. }
  28. }
  29. }
  30. ],
  31. "setting": {
  32. "speed": {
  33. "channel": ""
  34. }
  35. }
  36. }
  37. }

按照模板填写对应的服务器地址,库,表名,文件名,地址,并行度等即可使用

-----------------------写不动了,困了,想起来再接着写---------------------------

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/2023面试高手/article/detail/141199
推荐阅读
相关标签
  

闽ICP备14008679号