首页 > Python资料 博客日记

Pytorch报错解决——(亲测有效)RuntimeError: Distributed package doesn‘t have NCCL built in

2024-08-08 17:00:07Python资料围观115

Python资料网推荐Pytorch报错解决——(亲测有效)RuntimeError: Distributed package doesn‘t have NCCL built in这篇文章给大家,欢迎收藏Python资料网享受知识的乐趣

在我跑SLADD模型的时候,出现了如下报错:

上网搜寻一番后,发现了解决方法
第一步:在本文件的开头机上这样两行代码:

import os
os.environ["PL_TORCH_DISTRIBUTED_BACKEND"] = "gloo"

第二步:在本文件代码中找到这样一部分代码:

dist.init_process_group(backend='nccl', init_method='env://', world_size=args.world_size, rank=rank)这一行中的nccl换成gloo
若要解释原因就是windows系统不支持NCCL,只能换用GLOO

亲测这个报错就没了,然而接下来还有好多别的报错…我继续去解决了,解决完再分享别的~


版权声明:本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:jacktools123@163.com进行投诉反馈,一经查实,立即删除!

标签:

相关文章

本站推荐