当前位置:主页 > 查看内容

Graphcore发布第二代IPU:7nm工艺制程,性能翻8倍

发布时间:2021-04-20 00:00| 位朋友查看

简介:【51CTO.com原创稿件】AI在各种场景的应用落地,对算力提出了更高的要求,这就需要具备更高性能的计算芯片来满足AI面临的挑战。在芯片领域,除了CPU、GPU、FPGA等之外,专为AI应用设计的IPU也倍受关注。2020年7月15日,Graphcore(中文名称:拟未)在全球同步……

【51CTO.com原创稿件】AI在各种场景的应用落地,对算力提出了更高的要求,这就需要具备更高性能的计算芯片来满足AI面临的挑战。在芯片领域,除了CPU、GPU、FPGA等之外,专为AI应用设计的IPU也倍受关注。2020年7月15日,Graphcore(中文名称:拟未)在全球同步推出了第二代IPU:第二代 IPU(智能处理器)——Colossus MK2 GC200 和基于前者、可用于大规模集群系统的 IPU-Machine: M2000 (IPU-M2000),以及全新模块化机架规模解决方案IPU-POD64。同时,Graphcore宣布正式与金山云达成战略合作,并已推出面向开发者的IPU云服务

Graphcore高级副总裁兼中国区总经理卢涛

Graphcore高级副总裁兼中国区总经理卢涛在接受记者采访时表示,Graphcore目前所做的事情主要有三部分:一是专门为AI应用,从零开始设计IPU处理器;二是基于IPU处理器以及面向AI应用的Poplar软件栈和相关开发工具;三是围绕硬件和软件打造的IPU平台

IPU:专为人工智能计算而生

Graphcore推出的IPU产品是专门为人工智能计算所设计的,他们认为相对于GPU等芯片产品,IPU在人工智能计算上具备天然的优势。

据卢涛介绍,本次发布的产品在计算、数据和通信上有了颠覆性的技术突破。据了解,此次发布的Colossus MK2 GC200处理器,仍然延续了第一代的“同构众核”架构,不过制造工艺却从16nm提升为7nm,处理器内存储从 300MB 提升到了 900MB,晶体管数量更是达到了惊人的 594 亿(裸片823平方毫米),较 NVIDIA 今年5月发布最新旗舰 A100 的 540 亿还要多。

此外,GC200的处理器核心(IPU-Tiles)从上一代的1217个提升到了1472个,能够执行8832个单独的并行线程。相较第一代产品,系统性能提升了8倍以上。

在数据处理方面,GC200延续了第一代产品的高带宽高容量表现,这对于应对一些复杂的 AI 模型及算法很有帮助,官方声明它足以支持具有数千亿个参数的最大模型。另外在通信方面,Graphcore推出了自创的AI专属的IPU-Fabric横向扩展结构。官方数据显示,该结构的延迟为2.8Tbps,最多支持64000个IPU之间的横向扩展。

除了发布了GC200处理器之外,Graphcore还推出了IPU-Machine:M2000 (IPU-M2000)。M2000在1U的机箱中集成4个GC200处理器,拥有1PFlops的计算能力和450GB的Exchange Memory;此外,其还具备IPU-Fabric的2.8Tbps超低延迟的通信能力。

据介绍,IPU-M2000产品有多种配置形态,例如1个M2000的配置、4个M2000的配置、8个M2000的配置,并提供IPU-POD64的整机交付能力。卢涛表示,M2000是在构建超大规模、弹性AI计算集群中间的一个基本单元,IPU-POD64中集成了多达16个IPU-M2000。

在此次媒体沟通会上,Graphcore还详细解读了最新发布Poplar SDK版本:Poplar SDK 1.2。Graphcore中国区技术应用总负责人罗旭表示,Poplar SDK 1.2主要有三大特性:一是与先进的机器学习框架进行了很好的集成;二是进一步开放低级别的API,让用户能够灵活的针对网络性能进行特定调优;三是增加了框架支持,包括对PyTorch和Keras的支持;四是优化了卷积库和稀疏库。

罗旭表示,Graphcore开放了可以扩展的Poplar库,并支持TensorFlow 1、TensorFlow 2、ONNX和PyTorch。通过Poplar SDK、工具以及框架和容器化的支持,帮助用户能够更加容易地大规模部署IPU产品到实际生产环境之中。

扎根中国市场,加强生态建设

虽然Graphcore在产品上已经准备就绪,但由于市场竞争比较激烈,尤其是在市场已经大量部署了AI计算产品的情况下,如何使得用户转而使用IPU就成了一大挑战。

据卢涛介绍,虽然在一个用户用一个新的计算平台替换老的计算平台时,确实是有一定的工作量,但Graphcore已经看到,有一些与Graphcore合作进展比较快的用户使用IPU替换原有产品的速度,要比大家想象得更加快一点。

卢涛告诉记者,想要让用户下定快速替代原有产品的决定,必须要有三个重要的方面。一是是否能够为用户提供很大的价值;二是用户迁移的成本足够低、使用成本足够好;三是要构建中国的IPU开发者云、构建中国的创新社区,培育自己的生态。

在谈到Graphcore未来商业化成功的突破点时,他强调,目前AI创新方面主要是三部分共同“出力”:CPU、GPU和IPU。而Graphcore是采取“两条路并行”的方式:一条路聚焦那些IPU比CPU、GPU表现得更好的业务场景,另一条路聚焦IPU本身激发的AI创新,这也是IPU从诞生开始就希望做到的。而这两条路,Graphcore都走得非常坚定。

数据显示,这家成立仅 4 年的英国年轻公司已经累计获得了 4.5 亿美元融资,其投资人中既有红杉这样的金融投资者,也有戴尔、三星、微软这类战略投资者。与此同时,其团队规模也从几十人,发展到全球 450 人,其中工程技术人员占比 80% 以上。

作为资本的宠儿,Graphcore 显然并不满足于英国本地的发展,根据其官网显示,除英国本土,Graphcore 已经在中国、美国、挪威等地设立了办公室。

据介绍,Graphcore在市场策略方面将采取三个维度:云合作伙伴、OEM合作伙伴及渠道合作伙伴,在中国也是如此。

“中国目前 AI 产业的体量可能是全球几个最大的国家之一,论落地速度也是全球最快的几个国家之一。未来我们将一方面加强国内团队、开发者社区的建设,一方面同国内各大云服务公司、AI产业公司加强沟通、展开合作,助力中国AI创新。” 卢涛如是说。

【51CTO原创稿件,合作站点转载请注明原文作者和出处为51CTO.com】

【责任编辑:张诚 TEL:(010)68476606】
本文转载自网络,原文链接:
本站部分内容转载于网络,版权归原作者所有,转载之目的在于传播更多优秀技术内容,如有侵权请联系QQ/微信:153890879删除,谢谢!

推荐图文

  • 周排行
  • 月排行
  • 总排行

随机推荐