《异构融合计算技术白皮书》重磅发布

文章来源：企鹅号 - 边缘计算之家

全球边缘计算大会金牌讲师，矩向科技黄朝波率先提出“异构融合计算”概念，并得到与会专家的一致赞同：“异构计算融合”是一个现象，是一个过程；而“异构融合计算”则是一种创新的理念，也是一种全新的计算架构和计算技术，同时还是落地的解决方案。在提出“异构融合计算”概念的基础上，逐步细化和完善其定义和内涵：首先，异构融合计算，通过融合CPU和多种不同类型不同架构的加速处理器，以实现更大规模、更高性能、更加高效的计算；其次，异构融合计算继承自异构计算，并向前继续发展，成为一种新的计算架构；最后，异构融合需要不同层次不同类型的软硬件技术的深度协作，才能最终实现异构融合的广泛落地。

白皮书目录：

白皮书节选：

?异构融合计算的定义

Intel于2019年提出“超异构计算”的概念，强调了超异构计算涉及的三个方面：系统架构、工艺和封装，以及统一的异构计算软件。但在最核心的系统架构层次， Intel仅仅只强调了“多”，并没有进一步对超异构计算进行阐述，以及设计实现的进一步细节说明。

“异构融合计算”是一个全新的概念，目前行业还没有形成统一的定义。从概念上讲，“异构融合计算”属于异构计算的范畴，可以定义为异构计算的一种高阶形态。

图 Intel超异构计算三大要素

本白皮书认为，狭义的“异构融合计算”，是一种新的计算架构和方法，通过融合CPU和多种不同类型、不同架构的加速处理器，以实现更大规模、更高性能、更加高效的计算。而广义的“异构融合计算”，则通过不同层次、不同类型的技术整合，来实现异构融合计算资源的高效利用。

广义的异构融合计算，主要包含以下几方面内容：

超异构：系统中异构处理器的数量为三个或三个以上。“一个称为同构，两个称为异构，三个或三个以上称为超异构”。超异构是异构融合计算的前提。

硬件融合：强调不同处理器之间的深度协同（指单个工作任务由两个或两个以上处理器协作处理）和深度融合（指某个具体工作任务可以跨 CPU、 GPU和 DSA等不同类型处理器运行，也可以跨同类型中的不同架构处理器运行）。各处理器之间可以通过高速总线或高性能网络进行通信和数据传输，通过更高层次的系统划分和任务调度实现协同计算。

软件融合：面向异构（硬件）计算环境，将操作系统、应用软件、编程模型、编程语言、通信协议、数据等技术资源进行融合和优化，提供统一的软件运行环境和编译开发工具，旨在降低异构融合计算系统的复杂度，实现计算任务的跨平台运行。

系统融合：通过合理的任务分配和资源调度，异构融合计算系统可以实现更高的计算性能和更好的计算效率。

传统异构计算，特指CPU+xPU的计算架构。异构融合计算与传统异构计算的差异点在于：传统异构计算仅有一种加速处理器类型，并且仅关注 CPU和加速处理器的协同；而异构融合计算则具有两种或两种以上的加速处理器类型，并且需要重点关注所有处理器之间的协同和融合，以及硬件与软件之间的融合、系统内部及系统之间的融合问题。

异构融合计算案例：通用超异构处理器

矩向科技定义了一款新的处理器芯片类型：通用超异构处理器（GP-HPU, General Purpose Hyper-heterogeneous Processing Unit）。

图通用超异构处理器GP-HPU架构示意图

通用超异构处理器GP-HPU，通过NOC总线，把众多的计算节点连接成一个芯片系统。从功能视角看，GP-HPU和SOC类似；在架构上GP-HPU和SOC的主要区别在于每个加速处理器需要“图灵完备”，成为一个可独立工作的小系统，可直接和其他小系统进行交互且不需要主CPU的参与。每一个处理器作为一个小规模的类SOC的小系统，再通过分布式架构，可构建规模数量级提升的大系统，也非常有利于芯片系统的平行扩展。

图通用超异构处理器GP-HPU功能框图

系统任务主要分为三类：（1）不经常变化的任务，归属基础设施层，由DPU覆盖；（2）业务应用加速部分，归属到弹性应用加速层，由GPU等业务加速芯片覆盖；（3）业务应用不可加速部分，以及其他没有加速支持的任务，归属到业务应用层，由CPU覆盖。从功能视角，GP-HPU，可以看作是CPU、GPU和DPU功能的集合。但GP-HPU不是这三个芯片功能的简单集成，通过不同类型处理器的深度合作，才能实现“团队协作，整体最优”，实现性能和灵活性的兼顾。最后，是系统层次。通用能力的构建是大算力芯片成功的关键。如何实现异构融合计算的通用能力，是异构融合计算能否落地的关键。

图通用超异构处理器GP-HPU在边缘计算场景的应用

CPU、GPU和DPU三颗芯片，通常来自于不同的公司，实现三者间的深度协同比较难。在单芯片内部实现异构融合计算，是相对可行的路径。此外，受限于单芯片所能容纳的计算规模上限，目前的单芯片异构融合计算，比较适合边缘等相对轻量的计算场景，不太适合云计算等相对重量的计算场景。

GP-HPU，经过“通用性”能力的强化设计，可以广泛使用在边缘服务器、AI推理服务器、存储服务器、企业云服务器等轻量级场景，还可以使用在智能座舱、MEC接入设备、低速无人车等场景。

上海矩向科技有限公司，由来自互联网和IC界的资深专家发起成立。核心团队成员均为博士后、博士、硕士，来自于硅谷知名芯片公司、国内TOP芯片公司以及知名互联网公司。公司目标市场为数据中心服务器和自动驾驶等超级终端。采用基于软硬件融合的超异构计算架构，实现传统多个芯片功能和系统的深度融合，打造超高集成度的工业级和车规级通用超大算力芯片，用于云和边缘计算服务器及智能网联汽车，打造云边端融合的核心底座。

发表于: 2023-09-202023-09-20 20:23:00
原文链接：https://page.om.qq.com/page/OYEprsa9_-qKj1Eu7gobxM9g0
腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。
如有侵权，请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长进交流群

领取专属 10元无门槛券

私享最新 技术干货

《异构融合计算技术白皮书》重磅发布

相关快讯

扫码

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐