今天,国际权威AI基准测试MLPerf公布了2021年最新推理测试榜单。
图像分类性能测试中,阿里云震旦异构计算加速平台在通用GPU开放规则和离线场景下以每秒处理107.8万张图片的成绩,打破了此前谷歌保持的世界纪录。
这将进一步提升图像识别、自动驾驶等场景下的计算效率,也是通用GPU计算平台上首次跑出超百万级的性能测试纪录。
震旦是阿里云自研的异构计算加速平台,可实现AI框架及算法的无缝迁移适配,支持云变端多场景快速部署,大幅提升AI应用开发效率。
在MLPerf最新版的图像分类测试中,震旦平台针对图像分类神经网络架构进行自动优化,在保证基准测试精度目标的同时,远超标准ResNet50 v1.5的计算效率。
阿里云异构计算首席科学家、震旦加速平台负责人张伟丰博士透露,震旦对底层软件框架做了大量编译优化,可在同等硬件配置下发挥更高性能。
MLPerf推理性能的单卡测试结果显示,使用震旦加速平台的自动优化技术,在英伟达AI专用GPU A100上跑出了比同级硬件高出80%的推理性能成绩;在其它AI加速芯片上,更可帮助提升超过300%的性能。
震旦异构计算加速平台之所以在此次评测中取得如此优异成绩,得益于其出色的软硬件全栈优化能力:
· 在顶层算法模型上,使用基于自动机器学习(AutoML)的模型设计方式,这种方式可以获得比人工设计更高效的模型。
· 震旦基于MIT的先进的神经网络架构搜索算法Once-For-All,使用了基于强化学习的自研搜索算法获得了高性能子网络。
· 通过INT8量化获得硬件加速继续提高性能,并在量化前进行深度重训练,以保证量化后的精度能够达到测试的精度要求。
上图为高性能子网络示意图,IRB即反转残差块(Inverted Residual Block),是用于网络架构搜索的基本模块。每个反转残差块包括三层卷积算子,图上反转残差块的长度代表了该块的输出channel数量。
而基于震旦异构计算加速平台的机器学习模型自动优化技术,可应用在包括视觉处理在内的多个场景。
场景一:自动驾驶
以自动驾驶为例,车载计算机通过实时协同处理摄像头或雷达信息,正确感知行驶环境并据此做出反应。
目前先进的自动驾驶解决方案需要配备10路甚至更多的视觉和雷达装置,不断增加的外部传感数据处理对车机系统计算能力提出了挑战。
而采用震旦平台的软硬协同自动优化技术后,车载计算机的处理速度至少提升一倍,从而对行驶环境做出更加迅速的感知,并大幅提高自动驾驶的安全性。
场景二:电商
基于相同GPU硬件采用编译自动优化技术后,自动分类标记产品图像或者搜索图像效率大幅提升——服务器数量减少75%,通过图片关联的产品推荐速度提升5倍,用户购物体验更加流畅。
场景三:交通
目前,震旦异构计算加速平台已大规模应用于路口检测、以图搜图等场景。
应用了震旦加速平台的新一代路侧智能控制终端,交通参数检测准确率可达99%,帮助路口通行效率优化提升20%以上。
此外,该平台已通过阿里云弹性计算加速实例EAIS对外提供服务,具备配置灵活、弹性伸缩等特点,为用户提供高性价比的深度学习解决方案。
MLPerf
MLPerf是业内首套衡量机器学习软硬件性能的通用基准,由图灵奖得主David Patterson联合科技公司和全球顶级高校于2018年发起,已成为业界评测AI性能的最主流标准之一。
MLPerf基准联盟现有50多家成员,包括谷歌、阿里巴巴、微软、Facebook等及斯坦福、哈佛、多伦多大学等名校。
虚拟主机 是通过技术处理把一台服务器分割成多个磁盘空间,每个空间都有单独的FT...
标签用于标记云资源,如实例、镜像和磁盘等。如果您的帐户下有多种云资源,并且...
近些年来,运营大数据在企业发展中越来越受关注,大数据方面也越来越规范合法化...
Knative 是基于 Kubernetes 的开源 Serverless 应用编排框架。阿里云 Knative 在...
一、如何标注 以外部机器人4天标注为例 1、下载源文件 进入数据看板----会话历史...
自2014年大数据首次进入政府工作报告,中国市场就开始了一场大数据的淘数热。201...
如今,Apache Flink 行业应用几何?在降本增效的需求驱动下,企业如何实现数据与...
堆排序基本介绍 堆排序是利用堆这种数据结构而设计的一种排序算法,堆排序是一种...
操作场景 当 弹性云服务器 绑定了 弹性公网IP 时,通过带宽提供公网和 弹性云服...
云计算和互联网 Internet构造出了一个虚拟的网络世界 将全世界的人们都连接在了...