首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

《异构融合计算技术白皮书》重磅发布

全球边缘计算大会金牌讲师,矩向科技黄朝波率先提出“异构融合计算”概念,并得到与会专家的一致赞同:“异构计算融合”是一个现象,是一个过程;而“异构融合计算”则是一种创新的理念,也是一种全新的计算架构和计算技术,同时还是落地的解决方案。在提出“异构融合计算”概念的基础上,逐步细化和完善其定义和内涵:首先,异构融合计算,通过融合CPU和多种不同类型不同架构的加速处理器,以实现更大规模、更高性能、更加高效的计算;其次,异构融合计算继承自异构计算,并向前继续发展,成为一种新的计算架构;最后,异构融合需要不同层次不同类型的软硬件技术的深度协作,才能最终实现异构融合的广泛落地。

白皮书目录:

白皮书节选:

?异构融合计算的定义

Intel于2019年提出“超异构计算”的概念,强调了超异构计算涉及的三个方面:系统架构、工艺和封装,以及统一的异构计算软件。但在最核心的系统架构层次, Intel仅仅只强调了“多”,并没有进一步对超异构计算进行阐述,以及设计实现的进一步细节说明。

“异构融合计算”是一个全新的概念,目前行业还没有形成统一的定义。从概念上讲,“异构融合计算”属于异构计算的范畴,可以定义为异构计算的一种高阶形态。

图 Intel超异构计算三大要素

本白皮书认为,狭义的“异构融合计算”,是一种新的计算架构和方法,通过融合CPU和多种不同类型、不同架构的加速处理器,以实现更大规模、更高性能、更加高效的计算。而 广义的“异构融合计算”,则通过不同层次、不同类型的技术整合,来实现异构融合计算资源的高效利用。

广义的异构融合计算,主要包含以下几方面内容:

超异构:系统中异构处理器的数量为三个或三个以上。“一个称为同构,两个称为异构,三个或三个以上称为超异构”。超异构是异构融合计算的前提。

硬件融合 :强调不同处理器之间的深度协同(指单个工作任务由两个或两个以上处理器协作处理)和深度融合(指某个具体工作任务可以跨 CPU、 GPU和 DSA等不同类型处理器运行,也可以跨同类型中的不同架构处理器运行)。各处理器之间可 以通过高速总线或高性能网络进行通信和数据传输,通过更高层次的系统划分和任务调度实现协同计算。

软件融合:面向异构(硬件)计算环境,将操作系统、应用软件、编程模型、编程语言、通信协议、数据等技术资源进行融合和优化,提供统一的软件运行环境和编译开发工具,旨在降低异构融合计算系统的复杂度,实现计算任务的跨平台运行。

系统融合:通过合理的任务分配和资源调度,异构融合计算系统可以实现更高的计算性能和更好的计算效率。

传统异构计算,特指CPU+xPU的计算架构。异构融合计算与传统异构计算的差异点在于:传统异构计算仅有一 种加速处理器类型,并且仅关注 CPU和加速处理器的协同;而异构融合计算则具有两种或两种以上的加速处理器类型,并且需要重点关注所有处理器之间的协同和融合,以及硬件与软件之间的融合、系统内部及系统之间的融合问题。

异构融合计算案例:通用超异构处理器

矩向科技定义了一款新的处理器芯片类型:通用超异构处理器(GP-HPU, General Purpose Hyper-heterogeneous Processing Unit)。

图 通用超异构处理器GP-HPU架构示意图

通用超异构处理器GP-HPU,通过NOC总线,把众多的计算节点连接成一个芯片系统。从功能视角看,GP-HPU和SOC类似;在架构上GP-HPU和SOC的主要区别在于每个加速处理器需要“图灵完备”,成为一个可独立工作的小系统,可直接和其他小系统进行交互且不需要主CPU的参与。每一个处理器作为一个小规模的类SOC的小系统,再通过分布式架构,可构建规模数量级提升的大系统,也非常有利于芯片系统的平行扩展。

图 通用超异构处理器GP-HPU功能框图

系统任务主要分为三类:(1)不经常变化的任务,归属基础设施层,由DPU覆盖;(2)业务应用加速部分,归属到弹性应用加速层,由GPU等业务加速芯片覆盖;(3)业务应用不可加速部分,以及其他没有加速支持的任务,归属到业务应用层,由CPU覆盖。从功能视角,GP-HPU,可以看作是CPU、GPU和DPU功能的集合。但GP-HPU不是这三个芯片功能的简单集成,通过不同类型处理器的深度合作,才能实现“团队协作,整体最优”,实现性能和灵活性的兼顾。最后,是系统层次。通用能力的构建是大算力芯片成功的关键。如何实现异构融合计算的通用能力,是异构融合计算能否落地的关键。

图 通用超异构处理器GP-HPU在边缘计算场景的应用

CPU、GPU和DPU三颗芯片,通常来自于不同的公司,实现三者间的深度协同比较难。在单芯片内部实现异构融合计算,是相对可行的路径。此外,受限于单芯片所能容纳的计算规模上限,目前的单芯片异构融合计算,比较适合边缘等相对轻量的计算场景,不太适合云计算等相对重量的计算场景。

GP-HPU,经过“通用性”能力的强化设计,可以广泛使用在边缘服务器、AI推理服务器、存储服务器、企业云服务器等轻量级场景,还可以使用在智能座舱、MEC接入设备、低速无人车等场景。

上海矩向科技有限公司,由来自互联网和IC界的资深专家发起成立。核心团队成员均为博士后、博士、硕士,来自于硅谷知名芯片公司、国内TOP芯片公司以及知名互联网公司。公司目标市场为数据中心服务器和自动驾驶等超级终端。采用基于软硬件融合的超异构计算架构,实现传统多个芯片功能和系统的深度融合,打造超高集成度的工业级和车规级通用超大算力芯片,用于云和边缘计算服务器及智能网联汽车,打造云边端融合的核心底座。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OYEprsa9_-qKj1Eu7gobxM9g0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券
http://www.vxiaotou.com