首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

#gpu

又一款国产GPU量产上市:性能媲美10年前AMD嵌入式显卡!

芯智讯

5月7日,据“中国光谷”消息,武汉凌久微电子有限公司(简称“凌久微”)宣布,其自主设计的第二代图形处理器(GPU)GP201已成功量产上市。

500

AI时代CIO如何应对GPU匮乏

云云众生s

通过采用模型优先的心态、优化利用率和战略性地运用负载平衡,首席信息官可以缓解芯片短缺。

1100

突破摩尔定律极限!前谷歌量子计算团队首创「热力学计算机」,英伟达GPU「退役」?

新智元

比起当前的CPU、GPU、TPU、FPGA等数字处理器,这种全新的AI加速器快了数个数量级,而且更加节能。

5510

使用 DPDK 和 GPUdev 在 GPUs上增强内联数据包处理

ssbandjl

对于 NVIDIA 特定的 GPU,GPUdev 库功能是通过CUDA 驱动程序 DPDK 库在 DPDK 驱动程序级别实现的。要启用NVIDIA GPU 上所...

11610

突破摩尔定律极限!前谷歌量子计算团队首创「热力学计算机」,英伟达GPU「退役」?

公众号-arXiv每日学术速递

比起当前的CPU、GPU、TPU、FPGA等数字处理器,这种全新的AI加速器快了数个数量级,而且更加节能。

8610

为什么大模型训练需要GPU,以及适合训练大模型的GPU介绍

JOYCE_Leo16

今天偶然看到一篇关于介绍GPU的推文,我们在复现代码以及模型训练过程中,GPU的使用是必不可少的,那么大模型训练需要的是GPU,而不是CPU呢。现在市面上又有哪...

20310

什么是 GPU集群网络、集群规模和集群算力?

ICT百科

在生成式AI(GenAI)和大模型时代,不仅需要关注单个GPU卡的算力,更要关注GPU集群的总有效算力。单个GPU卡的有效算力可以通过该卡的峰值算力来测算,例如...

16510

大模型与AI底层技术揭秘(31)令狐冲化身酒剑仙

用户8289326

在Kubernetes的Master节点上,也增加一个组件,叫做gpu-admission,其作用是接管Kubernetes Scheduler的predica...

8110

onnxruntime-gpu 预热速度优化

为为为什么

在 Python 下 onnxruntime-gpu 加载 onnx 模型后,创建 seddion 进行数据推断,在第一次执行时会比之后执行耗时更久,需要资源更...

13510

GPU可以加速芯片设计的Implementaion吗?

猫叔Rex

在数字设计的Implementation过程中,从RTL到GDSII的每一步都是高度计算密集型的。在SoC层面,为了最小化互连的延迟,我们需要评估数百个par...

13710

MindSpore运行报错RuntimeError: Unsupported device target GPU解决方案

DechinPhy

在运行MindSpore程序时,设置device_target为GPU,结果运行时报错:

17310

美团外卖基于GPU的向量检索系统实践

美团技术团队

随着大数据和人工智能时代的到来,向量检索的应用场景越来越广泛。在信息检索领域,向量检索可以用于检索系统、推荐系统、问答系统等,通过计算文档和查询向量之间的相似度...

9110

英伟达开卷价格!最新Blackwell GPU架构/成本揭秘,彰显老黄的「仁慈」

新智元

下面就让我们从规格参数、工艺节点、封装设计等方面来深入分析一下新一代Blackwell GPU的系统、定价、利润,以及Jensen's Benevolence(...

11110

谷歌狂喜:JAX性能超越Pytorch、TensorFlow!或成GPU推理训练最快选择

新智元

谷歌力推的JAX在最近的基准测试中性能已经超过Pytorch和TensorFlow,7项指标排名第一。

9110

台积电董事长预测:未来15年每瓦GPU性能提升1000倍,GPU晶体管数破万亿!

新智元

GTC 2024大会上,老黄祭出世界最强GPU——Blackwell B200 ,整整封装了超2080亿个晶体管。

7910

攻陷短视频后,Sora将需要72万块H100 GPU

机器之心

OpenAI 推出的 Sora 模型能够在各种场景下生成极其逼真的视频,吸引了全世界的目光。

12710

大模型与AI底层技术揭秘(30)剑宗与气宗

用户8289326

在上一期,我们讲了一个令狐冲通过使用NVidia GRID vGPU方案,把虚拟化的GPU通给多个虚拟机的方案。但是,这个方案仍然没有解决一个关键的问题——不同...

8410

大模型与AI底层技术揭秘(28)思过崖上踢实况

用户8289326

在上期,我们讨论了AMD主导的基于SRIOV的GPU虚拟化方案。我们也发现了,由于GPU本质上不是CPU的一个外设,而是一个高度并行,具备成千上万个核的计算机,...

9810

美团视觉GPU推理服务部署架构优化实战

猫头虎

1.视觉模型服务部署面临的问题与挑战 2.GPU服务性能优化实践案例 3.通用高效的推理服务部署架构

12510

pytorch安装GPU版本 (Cuda12.1)教程: Windows、Mac和Linux系统下GPU版PyTorch(CUDA 12.1)快速安装

猫头虎

在本教程中,我们将为您提供在Windows、Mac和Linux系统上安装和配置GPU版本的PyTorch(CUDA 12.1)的详细步骤。我们将使用清华大学开源...

3.8K40
领券
http://www.vxiaotou.com