主题 Hadoop/Spark 访问 OSS 加速
内容框架
JindoFS SDK 介绍直播回放链接 5/6讲
https://developer.aliyun.com/live/246811
为什么使用 JindoFS SDK
安装 jar 包
下载最新的jar包 jindofs-sdk-x.x.x.jar 将sdk包安装到hadoop的classpath下。配置 JindoFSOSS 实现类
将 JindoFS OSS 实现类配置到Hadoop的core-site.xml中。配置 OSSAccess Key
将OSS的AccessKey、Access Key Secret、Endpoint等预先配置在Hadoop的core-site.xml中。使用 JindoFSSDK 访问 OSS
用HadoopShell访问OSS 下面列举了几个常用的命令。
put操作 hadoop fs -put path oss:// bucket /??在 Spark CLASSPATH 中添加 JindoFS SDK
下载最新的jar包 jindofs-sdk-x.x.x.jar 将sdk包安装到 Spark的classpath下。配置 JindoFS SDK
全局配置 参考 Hadoop 配置
任务级别配置 spark-submit --conf spark.hadoop.fs.AbstractFileSystem.oss.impl com.aliyun.emr.fs.oss.OSS --conf spark.hadoop.fs.oss.impl com.aliyun.emr.fs.oss.JindoOssFileSystem --conf spark.hadoop.fs.jfs.cache.oss.accessKeyId xxx --conf spark.hadoop.fs.jfs.cache.oss.accessKeySecret xxx --conf spark.hadoop.fs.jfs.cache.oss.endpoint oss-cn-xxx.aliyuncs.com
访问 OSS
完成配置之后,启动的 Spark 任务访问 OSS 默认就使用 JindoSDK 访问直接观看第三课 5/6讲 视频回放 获取实例讲解~
https://developer.aliyun.com/live/246811
相关资源
1.下载JindoFS SDK
https://github.com/aliyun/alibabacloud-jindofs/blob/master/docs/jindofs_sdk_download.md
2.Hadoop 使用 JindoSDK
https://github.com/aliyun/alibabacloud-jindofs/blob/master/docs/jindofs_sdk_how_to_hadoop.md
3.Spark 使用 JindoSDK
https://github.com/aliyun/alibabacloud-jindofs/blob/master/docs/spark/jindosdk_on_spark.md
?Github链接
https://github.com/aliyun/alibabacloud-jindofs
不错过每次直播信息、探讨更多数据湖 JindoFS OSS 相关技术问题 欢迎扫码加入钉钉交流群
公司介绍 深圳赛盒科技有限公司(IrobotBox)是一家以高科技创意为核心的技术服...
前言 自从react 官方发布react hooks以来 项目开发组件时几乎都是使用函数式组件...
1. 接口描述 接口请求域名: cvm.tencentcloudapi.com 。 本接口 (InquiryPriceR...
近日,恒大集团旗下“恒大智慧科技有限公司”以18万元的价格收购了一个单拼 域名...
云空间能 虚拟主机 吗?可以的。云空间也就是我们说的 云服务器 ,它的功能其实非...
服务器的流量是什么?服务器的流量其实就是站点被访问时,所进行传输消耗的数据...
如今,越来越多的企业开始全面采用DevOps,借此加快产品上市速度并巩固收入目标...
回望2020,这绝对是个让所有人都难以忘怀的年份。 突如其来的疫情黑天鹅事件短时...
查看精彩回放 https://developer.aliyun.com/live/245530 大纲 本文主要围绕实践...
本文转载自微信公众号「前端思维框架」,作者水墨寒。转载本文请联系前端思维框...