主题 FFluid JindoFS 对 OSS 上数据进行训练加速luid JindoFS 对 OSS 上数据进行训练加速
讲师 扬礼 阿里巴巴计算平台事业部 开源大数据平台 开发工程师
内容框架
Fluid 介绍Fluid JindoRuntime使用Fluid JindoRuntime 加速 OSS训练演示直播回放链接 16讲
https://developer.aliyun.com/live/247018
一、Fluid 介绍CNCF Fluid是一个开源的Kubernetes原生的分布式数据集编排和加速引擎 主要服务于云原生场景下的数据密集型应用 例如大数据应用、AI应用等。
参考网址
https://github.com/fluid-cloudnative/fluid
Fluid核心理念 Fluid不是全存储加速和管理 而是应用使用的数据集加速和管理
背景 云原生环境中使用JindoFS 缓存加速引擎并进行缓存数据集编排和应用编排
痛点
数据集和加速引擎生命周期管理数据集智能部署和使用数据集可观测和水平扩展优势
开箱即用 加速 OSS/HDFS/S3 上数据支持元数据数据预热、原子性cache小文件缓存优化 大大提高小文件?训练场景性能Fuse/ Posix 接口支持 JindoRuntime提供对OSS对?象存储服务和 HDFS 的访问和缓存加速能力 并且利用 FUSE的 POSIX 文件系统接口实现可以像本地磁盘一样轻松使用OSS 上的海量文件三、使用 Fluid JindoRuntime 加速 OSS 训练ImageNet 数据集加速测试使用?ImageNet?数据集基于Kubernetes 集群并使用?Arena?在此数据集上训练ResNet-50 模型 基于JindoFS 的JindoRuntime 在开启本地缓存的情况下性能大幅度优于开源OSSFS 训练耗时缩短了76%。
使用?InsightFace?数据集基于Kubernetes 集群进行小文件场景的训练测试 包含约380万个小文件 每个文件大小约为23KB 基于元数据缓存和数据缓存策略 在相同集群和带宽的OSSbucket下 基于JindoRuntime 训练时间大大缩短。
四、演示环境要求
Kubernetes version 1.14, 支持CSIGolang 1.12 Helm 3Fluid 0.6.0参考文档 https://github.com/aliyun/alibabacloud-jindofs/blob/master/docs/jindo_fluid/jindo_fluid_overview.md
ISSUE https://github.com/aliyun/alibabacloud-jindofs/issues
演示 对 OSS上数据进行加速访问?点击回放链接 直接观看第15讲视频回放 获取讲师实例讲解
https://developer.aliyun.com/live/247018
?Github链接
https://github.com/aliyun/alibabacloud-jindofs
不错过每次直播信息、探讨更多数据湖 JindoFS OSS 相关技术问题 欢迎扫码加入钉钉交流群
本文转载自微信公众号「Java大数据与数据仓库」,作者老董。转载本文请联系Java...
背景介绍 监控告警系统作为最为常用的服务 能够让开发运维人员时刻了解服务的当...
网络配置 设置“网络”:在下拉列表中选择可用的虚拟私有云、子网,并设置私有IP...
真正的数据价值取决于对业务的洞察力。 数据分析是企业拥有的最强大的资源之一。...
腾讯 云虚拟主机 叫什么?腾讯云现在基本搜不到 虚拟主机 了,像阿里云也不怎么...
1. 接口描述 接口请求域名: cvm.tencentcloudapi.com 。 本接口 (AssociateInst...
在使用裸金属服务器前,您需要完成本文中的准备工作。 注册华为云并实名认证 为...
今天,国际权威AI基准测试MLPerf公布了2021年最新推理测试榜单。 图像分类性能测...
云服务器 内存最大多少?内存是决定 云服务器 性能的非常重要的一个参数,内存最...
作者:小傅哥 博客: https://bugstack.cn 沉淀、分享、成长,让自己和他人都能...