当前位置：主页 > 查看内容

[JDBC] Kettle on MaxCompute 使用指南

发布时间：2021-04-29 00:00| 有位朋友查看

简介：Kettle版本 8.2.0.0-342 MaxCompute JDBC driver版本 3.2.8 Setup下载并安装Kettle下载MaxCompute JDBC driver将MaxCompute JDBC driver置于Kettle安装目录下的lib子目录 data-integration/lib 下载并编译MaxCompute Kettle plugin https://github.com/aliyu……

Kettle版本 8.2.0.0-342

MaxCompute JDBC driver版本 3.2.8

Setup下载并安装Kettle下载MaxCompute JDBC driver将MaxCompute JDBC driver置于Kettle安装目录下的lib子目录 data-integration/lib 下载并编译MaxCompute Kettle plugin https://github.com/aliyun/aliyun-maxcompute-data-collectors将编译后的MaxCompute Kettle plugin置于Kettle安装目录下的lib子目录 data-integration/lib 启动spoon

Job

我们可以通过Kettle MaxCompute JDBC driver来实现对MaxCompute中任务的组织和执行。

首先需要执行以下操作

新建Job新建Database Connection
JDBC连接串格式为 jdbc:odps: maxcompute_endpoint ?project maxcompute_project_name
JDBC driver class为 com.aliyun.odps.jdbc.OdpsDriver
Username为阿里云AccessKey Id
Password为阿里云AccessKey Secret
JDBC更多配置见 https://help.aliyun.com/document_detail/161246.html

之后可以根据业务需要通过SQL节点访问MaxCompute。下面我们以一个简单的ETL过程为例

Create table节点的配置如下

需要注意

这里Connection需要选择我们配置好的不要勾选Send SQL as single statement

Load from OSS节点配置如下

需要注意的点同Create table节点。有关更多Load的用法见 https://help.aliyun.com/document_detail/157418.html

Processing节点配置如下

需要注意的点同Create table节点。

Transformation

我们可以通过MaxCompute Kettle plugin实现数据流出或流入MaxCompute。

首先新建Transformation 之后新建Aliyun MaxCompute Input节点配置如下

在MaxCompute中新建一张空表 schema与test_partition_table一致。

新建Aliyun MaxCompute Output节点配置如下

执行Transformation 数据便从test_partition_table被下载后被上传至test_partition_table_2。

其他设置MaxCompute flags

如图在执行DDL/DML/SQL之前可以通过set key value;的方式配置flags。

Script模式

暂时无法支持

本文转自网络，原文链接：https://developer.aliyun.com/article/783874
本站部分内容转载于网络，版权归原作者所有，转载之目的在于传播更多优秀技术内容，如有侵权请联系QQ/微信：153890879删除，谢谢！

上一篇：浅谈网络安全等级保护2.0下的云计算安全风险 下一篇：新零售行业优质解决方案分享【美家全域潜客运营解决方案】

随机推荐

Go 语言中的一等公民：看似普通的函数，

本文转载自微信公众号「脑子进煎鱼了」，作者陈煎鱼。转载本文请联系脑子进煎鱼...
只有域名能备案吗

只有域名能备案吗？不能的，备案是需要国内空间的，虚拟主机或者服务器的都...
云原生新边界——阿里云边缘计算云原生落

作者 | 黄玉奇来源 | 阿里巴巴云原生公众号日前，在由全球分布式云联盟主办的...
备忘清单：FFmpeg命令行工具的有用命令

FFmpeg备忘清单 ffmpeg命令行工具的有用命令列表。下载FFmpeg：https://www.ffm...
深入浅出AbstractQueuedSynchronizer

深入浅出AbstractQueuedSynchronizer 在Java多线程编程中，重入锁(ReentrantLock...
人人都不看好的云计算，为什么翻盘了？因

2020年，AWS的年收入规模已经超过450亿美元，营收增速和运营利润率超过30%。IDC...
hk域名哪里注册

hk 域名哪里注册？ .hk域名在国内是可以注册的，只要提供了.hk 域名注册服务...
大数据技术在网络安全分析之中的作用！

随着云计算、物联网、移动互联网等互联网技术的快速发展，人们对于网络技术的依...
怎么升级虚拟主机

怎么升级虚拟主机？当网站运营到一定阶段，虚拟主机配置跟不上网站发展，这时...
Apache Flink Meetup 北京站，1.13 新版

对于广大的 Flink 开发者同学来说，什么内容是最期待的？什么信息又是最有用的...

[JDBC] Kettle on MaxCompute 使用指南

推荐图文

哪家企业邮箱最便宜

弹性公网IP Ping不通？_云耀云服务器 HECS_常见问题

教育行业优质解决方案分享【智慧校园解决方案】

超融合“由硬至软” 为混合云设计的Azure Stack HCI

使用脚本初始化Linux数据盘_弹性云服务器 ECS_快速

H5页面适配及微信默认字号问题的最佳实践

随机推荐

Go 语言中的一等公民：看似普通的函数，

只有域名能备案吗

云原生新边界——阿里云边缘计算云原生落

备忘清单：FFmpeg命令行工具的有用命令

深入浅出AbstractQueuedSynchronizer

人人都不看好的云计算，为什么翻盘了？因

hk域名哪里注册

大数据技术在网络安全分析之中的作用！

怎么升级虚拟主机

Apache Flink Meetup 北京站，1.13 新版

关于我们