当前位置：主页 > 查看内容

PAI-EasyTransfer应用实践

发布时间：2021-04-22 00:00| 有位朋友查看

简介：查看精彩回放 https://developer.aliyun.com/live/245530 大纲本文主要围绕实践做四部分的介绍由浅入深层层递进这四部分是 AppZoo实践ModelZoo实践分布式训练实践多模态Fashionbert实践 ? 一、AppZoo实践 AppZoo像苹果的应用商店一样简单易用里面的应用……

查看精彩回放 https://developer.aliyun.com/live/245530

大纲

本文主要围绕实践做四部分的介绍由浅入深层层递进这四部分是

AppZoo实践ModelZoo实践分布式训练实践多模态Fashionbert实践

一、AppZoo实践

AppZoo像苹果的应用商店一样简单易用里面的应用丰富多样有分类匹配、阅读理解、序列标注和文本生成。

文本分类实践

在操作文本分类前首先可以先熟悉下Easy-Transfor文档了解下文本分类的流程基本可以在云端完成操作AppZoo的文本分类的组件。

如下图所示文本分类由几部分组成

原始文本文本预处理处理成Bert需要的表征格式然后送入Bert分类器产生标签。

如何在云端基于AppZoo操作文本分类整个过程只需在本地起一个Job然后发送到云端通过一些简单的配置就可以完成文本分类的应用了。

演示实践

基于本地的开发环境首先上传所需的业务数据如下图所示。

这是最简单的一句话的分类。左边是一句话右边是这句话对应的label 比如第一句话“上课时老师手机响的不停”对应的是108。把这些实际的分类的标签映射成离散的值。

然后运行一下脚本把业务数据的训练集和验证集上传到阿里云的ODPS的数据存储空间里。

然后在本地启动脚本自动地运行文本分类。首先需要指定pi命令这里叫做easy_transfer_app 然后指定训练模式和刚刚上传的训练集和验证机的名字。然后再告诉EasyTransfer AppZoo什么是标签及标签的类型。

当所有的都配置好后只需要在本地运行app.run_sh 就能把任务提交到阿里云上的服务器集群上由这个集群负责文本分类的应用。

一些常用的自然语言处理所需要的功能高度抽象地封装成了一个个组件供大家调用又简单又便捷这就是AppZoo的好处。

任务启动后如果想要检查日志状况可以通过Cloud View查看。

当初始化脚本完成后 Easy-Transfer AppZoo提供了强大的日志功能用来记录化器以及warm up step等等甚至是Bert里面用到的参数量等信息都会被详细的记录下来。

如下图所示在云端PAI平台上已经成功启动了单机四卡一个分布式的任务来做文本分类。

当操作完成后系统会把Model Dir记录在阿里云上一个OSS对象存储空间里。

二、ModelZoo实践

自然语言处理的套路方法趋向于统一化分为以下这么四个步骤通用领域的预训练、垂直领域的预训练、垂直领域的Finetune和通用知识蒸馏。

现在启动云端的run tf summary 看一下选的这个预训练模型是否收敛了。

通过tensor board看一下是否真的收敛了。我们在EasyTransfer里面放了很多实践这里面average loss就是最佳实践它植入了一个滑动窗口上面积累了loss 从而能从宏观上看到loss走向。

EasyTransfer设计了前后端分离的模式用户仅仅需要聚焦在他修改的那一部分的前端代码他可以很轻松地像搭积木的方式去尝试各种各样的chick。

下面演示一下如何调试。要做一个文本分类我只需要做几个关键的步骤第一是数据准备第二是定义配置文件第三个是定义分类应用第四是启动训练第五是启动预测。

接下来看下载的数据到底是什么样子。在这里数据是农业的分类内容就是一句话训练集样本数有1万多条训练样本1万多条。接下来为了完成一个训练任务需要去简单配置一下包括分类的label数。接下来看一些代码了解我们前端的API是什么样子的把APP Zoo的黑盒变白盒。

现在运行这个cell 运行后这个构图的loss就完成了然后启动训练。这里的日志训练样本有5万多条我们在浏览器中就能完成经典的文本分类任务。

接下来开始进行在线预测。在finetune环节当PAI代码已经固化了之后完全可以仅去调配置文件。基于PAI DSW 进一步调参前端代码。

三、分布式训练实践

在做大量业务数据的垂直领域的预训练模型时需要我们具备全栈思维它需要具备以下要素。

首先要了解集群的分布机柜里每一片都是主机。显卡是4块一组它们通过某种桥接的方式在主机内部进行高速的通信。其次是RDMA 它可以把机器内存直接连起来让他们直接进行数据通信它通信的是梯度。然后是数据并行它可以通过增加机器来把不同的数据放到不同的GPU上增加训练速度。

在PAI上进行多机多卡分布式预训练时使用参数也非常简单。EasyTransfer已经将复杂的预训练过程抽象成了几个公共组件在数据准备、特征生成和训练过程中都可以直接用。

实践演示

开始还是简单的配置然后开启编译优化打开RDMA 选择mlm loss等等配置完之后输入命令run pretrain 启动一个8机8卡共64张卡的任务。

然后点击logview 可以看到8机8卡。并且在云端做高性能、分布式、超大规模的训练非常简单因为EasyTransfer已经将常规组件封装在了script里。

多模态Fashionbert实践

多模态本质上是将文本的模态和图像、视频、声音等各个模态的信息混合起来学习出他们交互的表征用到下游的视频分类、跨模态检索、VQA等等它的目的是通过增加模态来提升下游任务的指标。那么如何通过EasyTransfer来从头开始构建变种版bert呢我们研发了一种叫Fashionbert的概念。

二次开发实践

作为一个平台开发人员当要增加新的功能的时候需要run Fashionbert 比如run train。看一下左上角这里唯一需要做的就是在ModelZoo里面定义一个多模态的bert 而里面各种各样的组件都封装好了让搭建非常简单。

最后附上EasyTransfer的开源信息大家可以通过这些渠道有进一步了解。

本次分享就到这里了欢迎大家在GitHub上共建EasyTransfer社区。

本文转自网络，原文链接：https://developer.aliyun.com/article/783719
本站部分内容转载于网络，版权归原作者所有，转载之目的在于传播更多优秀技术内容，如有侵权请联系QQ/微信：153890879删除，谢谢！

上一篇：教育行业优质解决方案分享【三个课堂解决方案】 下一篇：没有了

随机推荐

【玩转腾讯云】使用轻量应用服务器和cali

1.背景目标经过多年的积累，电脑里保存了很多电子书，保存在硬盘上非常不利于管...
从JS中学习函数式编程的五项支柱

一、什么是函数式编程从FP函数式编程的眼中看来，世界的万事万物就是处理数据流...
数据分析师们，每天到底在忙些什么？

这个问题总能见到一些朋友问。新人问，因为数据分析这个事儿听起来挺抽象又很高...
5G 和云原生时代的技术下半场，视频化是

作者 | 毕玄来源 | 阿里巴巴云原生公众号导读：随着?5G/ 芯片 / 区块链等等新...
自动获取vlookup函数的第三参数，再也不

对于vlookup函数，很多人都有会这样的想法：vlookup函数的第三参数为什么就不能...
云+社区【玩转腾讯云】征文活动，2021再

为活跃腾讯云+社区的技术氛围，同时鼓励广大程序员们更好的学习和分享腾讯云技术...
鸿蒙内核源码分析(原子操作篇) | 是谁在

想了解更多内容，请访问： 51CTO和华为官方战略合作共建的鸿蒙技术社区 https://...
很贱的QQ说说：世上有两种东西会趴玻璃，

1．A：你有《时间简史》吗？B：神经病，我有时间也不捡屎！ 2．夏天，我洗澡的时...
大数据“守护”，为城市织起安全网

就地过年，谁在助力大城小村的有序运行，谁来慰藉远方游子的一抹乡愁?除了各行各...
IoT Analytics：三分之一的制造商计划将

3月8日消息，据外媒报道，物联网研究机构IoTAnalytics称，三分之一的制造商正计...

PAI-EasyTransfer应用实践

推荐图文

RRT算法的基本程序模块（2）

kafka-go 读取kafka消息丢失数据的问题定位和解决

阿里云上新了：搭载最新至强处理器Ice Lake，算力提

阿里巴巴开源容器镜像加速技术DADI 上手指南

企业数据应用的成熟度评估

2021年企业云计算战略7种趋势

随机推荐

【玩转腾讯云】使用轻量应用服务器和cali

从JS中学习函数式编程的五项支柱

数据分析师们，每天到底在忙些什么？

5G 和云原生时代的技术下半场，视频化是

自动获取vlookup函数的第三参数，再也不

云+社区【玩转腾讯云】征文活动，2021再

鸿蒙内核源码分析(原子操作篇) | 是谁在

很贱的QQ说说：世上有两种东西会趴玻璃，

大数据“守护”，为城市织起安全网

IoT Analytics：三分之一的制造商计划将

关于我们