前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >datax_web环境搭建

datax_web环境搭建

原创
作者头像
ruochen
修改2021-11-22 09:25:31
9960
修改2021-11-22 09:25:31
举报

一 官方文档

datax

https://github.com/alibaba/DataX/blob/master/introduction.mdgithub.com

datax-web [https://github.com/WeiYe-Jing/datax-

web/blob/master/userGuid.md](https://links.jianshu.com/go?to=https%3A%2F%2Fgithub.com%2FWeiYe-

Jing%2Fdatax-web%2Fblob%2Fmaster%2FuserGuid.md)

【得物技术】MySQL多表关联同步到ES的实践

[使用DataX同步MaxCompute数据到TableStore(原OTS)优化指南-

InfoQ](https://links.jianshu.com/go?to=https%3A%2F%2Fwww.infoq.cn%2Farticle%2FrlQy_c79DH3B7HXFcrbF)

二 环境准备

windows python环境 datax项目 datax_web项目


我个人电脑环境

win10

python3.8.5 (或可python2环境)

datax项目

链接:https://pan.baidu.com/s/1KfRU5SJas0C94x84W6s5IQ

提取码:9aok (里面有一些使用说明)

datax_web项目

链接:https://pan.baidu.com/s/1cNcMqdQwdRJxABBBUNE2qA

提取码:xpaj

三 项目相关配置

1 datax项目

1.1 先配置 D:\datax\job 目录下的job中的reader、writer。就理解成用navicat新建mysql连接

1.2 在D:\datax\bin 目录下cmd 运行 datax.py 脚本,即可运行成功。

输入命令如:python D:\datax\bin>python D:\datax\bin\datax.py D:\datax\job\job.json

运行如图:

运行成功后如下图:

注意:python2环境python3环境运行适配的脚本版本有所不同,可在官网下载。 官网python3脚本下载路径 [datax-

web/doc/datax-web/datax-python3 at master · WeiYe-Jing/datax-web ·

GitHub](https://links.jianshu.com/go?to=https%3A%2F%2Fgithub.com%2FWeiYe-

Jing%2Fdatax-web%2Ftree%2Fmaster%2Fdoc%2Fdatax-web%2Fdatax-python3)

2 datax_web项目

2.1 修改配置

D:\IdeaProjects\datax-web\datax-admin\src\main\resources\application.yml

修改数据源配置

修改邮箱配置(可选)

修改打印日志配置

D:\IdeaProjects\datax-web\datax-executor\src\main\resources\application.yml

修改端口、日志路径等相关配置

D:\IdeaProjects\datax-web\datax-admin\src\main\resources\bootstrap.properties

2.2 需要启动两个Application

DataXAdminApplication DataXExecutorApplication

2.3 打开网址

打开

http://10.1.28.108:8080/index.html

即可访问。

成功运行如图:

四 任务从开始到运行

1 项目管理中创建项目
2 执行器管理中新建执行器(建议采用手动录入的方式)
3 数据源管理中新建数据源
4 任务管理中Datax任务模板创建
5 任务构建

构建成功后会自动在任务管理中添加一个任务。 这时候可以打开进行编辑,内容如下

没啥问题就点击操作按钮

点击执行一次,之后点击查询日志即可看job的运行情况。

注意:如果重复执行会报存在脏数据,主键唯一。执行到一半停止再次执行的情况,正在测试。

6 任务批量构建

点击下一步就会批量创建完成。之后也可在任务管理中进行job的调整等。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
作者已关闭评论
0 条评论
热度
最新
推荐阅读
目录
  • 一 官方文档
    • 二 环境准备
    • 三 项目相关配置
      • 1 datax项目
        • 2 datax_web项目
          • 2.1 修改配置
        • 2.2 需要启动两个Application
          • 2.3 打开网址
          • 四 任务从开始到运行
      相关产品与服务
      云数据库 MySQL
      腾讯云数据库 MySQL(TencentDB for MySQL)为用户提供安全可靠,性能卓越、易于维护的企业级云数据库服务。其具备6大企业级特性,包括企业级定制内核、企业级高可用、企业级高可靠、企业级安全、企业级扩展以及企业级智能运维。通过使用腾讯云数据库 MySQL,可实现分钟级别的数据库部署、弹性扩展以及全自动化的运维管理,不仅经济实惠,而且稳定可靠,易于运维。
      领券
      问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
      http://www.vxiaotou.com