• Glenn Jocher's avatar
    Update DDP for `torch.distributed.run` with `gloo` backend (#3680) · fad27c00
    Glenn Jocher 提交于
    * Update DDP for `torch.distributed.run`
    
    * Add LOCAL_RANK
    
    * remove opt.local_rank
    
    * backend="gloo|nccl"
    
    * print
    
    * print
    
    * debug
    
    * debug
    
    * os.getenv
    
    * gloo
    
    * gloo
    
    * gloo
    
    * cleanup
    
    * fix getenv
    
    * cleanup
    
    * cleanup destroy
    
    * try nccl
    
    * return opt
    
    * add --local_rank
    
    * add timeout
    
    * add init_method
    
    * gloo
    
    * move destroy
    
    * move destroy
    
    * move print(opt) under if RANK
    
    * destroy only RANK 0
    
    * move destroy inside train()
    
    * restore destroy outside train()
    
    * update print(opt)
    
    * cleanup
    
    * nccl
    
    * gloo with 60 second timeout
    
    * update namespace printing
    fad27c00
名称
最后提交
最后更新
.github 正在载入提交数据...
data 正在载入提交数据...
models 正在载入提交数据...
utils 正在载入提交数据...
.dockerignore 正在载入提交数据...
.gitattributes 正在载入提交数据...
.gitignore 正在载入提交数据...
CONTRIBUTING.md 正在载入提交数据...
Dockerfile 正在载入提交数据...
LICENSE 正在载入提交数据...
README.md 正在载入提交数据...
detect.py 正在载入提交数据...
hubconf.py 正在载入提交数据...
requirements.txt 正在载入提交数据...
test.py 正在载入提交数据...
train.py 正在载入提交数据...
tutorial.ipynb 正在载入提交数据...