当前位置:主页 > 查看内容

数据湖实操讲解【JindoFS 缓存加速】第十三讲:Presto 访问 OSS

发布时间:2021-06-25 00:00| 位朋友查看

简介:本期导读 【JindoFS 缓存加速】第十三讲 主题 Presto 访问 OSS 透明缓存加速 讲师 辰山 阿里巴巴计算平台事业部 EMR 技术专家 内容框架 JIndoFS 缓存模式简介Presto 访问 OSS 的缓存加速实操演示 直播回放链接 13讲 https://developer.aliyun.com/live/24692……
本期导读 【JindoFS 缓存加速】第十三讲


主题 Presto 访问 OSS 透明缓存加速


讲师 辰山 阿里巴巴计算平台事业部 EMR 技术专家


内容框架

JIndoFS 缓存模式简介Presto 访问 OSS 的缓存加速实操演示


直播回放链接 13讲

https://developer.aliyun.com/live/246923



一、JindoFS 缓存模式简介JindoFS缓存模式架构

image.png

架构介绍

Jindo Namespace Service JindoFS 元数据管理以及 Storage 服务管理Jindo Storage Service 用户数据的管理包含本地数据的管理和OSS上数据的管理Jindo SDK 客户端 所有上层计算引擎通过JindoFS SDK提供的客户端访问JindoFS文件系统 从而实现对后端存储实现缓存加速二、Presto 访问 OSS 的缓存加速部署缓存服务
下载最新 Release包 b2smartdata-x.x.x.tar.gz 解压并部署到集群所有节点上修改配置文件conf/bigboot.cfg

? ? ? image.png

修改 sbin/nodes 配置所有storage service的节点列表启动所有服务 ./sbin/start-service.sh


参考网址

https://github.com/aliyun/alibabacloud-jindofs/blob/master/docs/jindofs_cache_mode_deploy.md

部署Jindo SDK
安装 jar包 下载最新的jar包 jindofs-sdk-x.x.x.jar 在所有 Presto 节点安装。

? ? ?cpjindofs-sdk-${version}.jar $PRESTO_HOME/plugin/hive-hadoop2/

配置 JindoFS 实现类 将JindoFS 实现类配置到Hadoop的core-site.xml中

image.png

? ? ?

配置OSS Access Key将OSS的Access Key、Access Key Secret、Endpoint等预先配置在Hadoop的core-site.xml中。

? ? image.png?

配置客户端连接缓存服务

客户端通过环境变量 B2SDK_CONF_DIR 定位并加载配置文件 bigboot.cfg

设置环境变量指定配置目录

? ? ? ? export B2SDK_CONF_DIR /path/to/sdk/conf

在配置目录下添加bigboot.cfg配置文件
??client.storage.rpc.port 6101

? ? ?client.namespace.rpc.address NAMESPACE_ADDRESS :8101

? ? ? ??jfs.cache.data-cache.enable true

image.png

完成以上配置之后 重启 Presto所有服务

hive catalog 即可访问OSS

Presto SQL读取 OSS 上的数据后 会自动缓存到JindoFS缓存系统中 后续访问相同的数据就能够命中缓存


三、实操演示


?点击回放链接 直接观看第13讲视频回放 获取讲师实例讲解

https://developer.aliyun.com/live/246923


本文转自网络,原文链接:https://developer.aliyun.com/article/784879
本站部分内容转载于网络,版权归原作者所有,转载之目的在于传播更多优秀技术内容,如有侵权请联系QQ/微信:153890879删除,谢谢!

推荐图文

  • 周排行
  • 月排行
  • 总排行

随机推荐