当前位置：主页 > 查看内容

为什么exec进入容器后执行GPU相关的操作报错？_云容器实例 CCI_

发布时间：2021-09-25 00:00| 有位朋友查看

简介：问题现象： exec进入容器后执行GPU相关的操作（例如nvidia-smi、使用tensorflow运行GPU训练任务等）报错“cannot open shared object file: No such file or directory”。问题原因：安全容器内的cuda库位置为/usr/local/nvidia/lib64，您需要添加/usr/loc……

问题现象：

exec进入容器后执行GPU相关的操作（例如nvidia-smi、使用tensorflow运行GPU训练任务等）报错“cannot open shared object file: No such file or directory”。

点击放大

问题原因：

安全容器内的cuda库位置为/usr/local/nvidia/lib64，您需要添加/usr/local/nvidia/lib64到LD_LIBRARY_PATH，才能正确地找到cuda库。

解决方法：

使用kubectl exec或者前端console登录进入带GPU的容器时，先执行命令export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/nvidia/lib64，然后再执行其他GPU相关的操作命令。

父主题： 容器工作负载类

本站部分内容转载于网络，版权归原作者所有，转载之目的在于传播更多优秀技术内容，如有侵权请联系QQ/微信：153890879删除，谢谢！

上一篇：私有网络查看安全组 - 操作指南 下一篇：没有了

随机推荐

美国服务器租用需注意的

服务器可以说是整个网络的核心，如何选择与业务规模相适应的服务器，是有关决策...
如何计算函数的执行时间？

关于时间的文章，大家可以参考我之前的一篇文章《C语言操作时间函数，实现定时执...
构建容器的七大优秀实践

虽然容器与Kubernetes正在快速普及，但首先我们需要明确一点它们并不适合构建所...
毕业生求职必会算法手把手教你二分法查找

1、二分法查找的背景当数组或者集合中存放的元素数量非常多的时候，想要跟踪具...
部署Web集群 - 云服务器 ECS

部署一个网站或者API应用时，需要部署一系列的节点，并根据访问数量或者资源使用...
产品优势_存储容灾服务 SDRS_产品介绍

存储容灾服务具有以下优势：便捷的业务恢复方案存储容灾服务提供集中的控制台...
「Spring认证」Spring认证框架教程

Spring 可能是您所有企业应用程序的一站式商店。但是，Spring 是模块化的，允许...
电子邮件服务器的架设方法

很多企业局域网内都架设了电子邮件服务器；用于进行公文发送和工作交流。但使用...
阿里云云原生团队招聘来啦

? 招聘对象 ** 校招：招聘应届和实习的本硕博同学社招：招聘有一定工作经验的本...
数字化首个安全生产标准，阿里云联合信通

阿里云混合云是建管用一体化的混合云平台是政企数智创新的同行者助力企业级客...

为什么exec进入容器后执行GPU相关的操作报错？_云容器实例 CCI_

推荐图文

UNIX服务器操作系统介绍

阿里巴巴DevOps实践指南（十四）| 测试环境与路由

轻量应用服务器签名方法 v3 - API 文档

阿里云李松林：全球实时传输网络GRTN在互动直播中技

中山大学医学院：上云加快新冠致重症因素研究进程

TOP云电信主机租用促销服务器B型9999/年值的入手吗

随机推荐

美国服务器租用需注意的

如何计算函数的执行时间？

构建容器的七大优秀实践

毕业生求职必会算法手把手教你二分法查找

部署Web集群 - 云服务器 ECS

产品优势_存储容灾服务 SDRS_产品介绍

「Spring认证」Spring认证框架教程

电子邮件服务器的架设方法

阿里云云原生团队招聘来啦

数字化首个安全生产标准，阿里云联合信通

关于我们