• Glenn Jocher's avatar
    Update DDP for `torch.distributed.run` with `gloo` backend (#3680) · fad27c00
    Glenn Jocher 提交于
    * Update DDP for `torch.distributed.run`
    
    * Add LOCAL_RANK
    
    * remove opt.local_rank
    
    * backend="gloo|nccl"
    
    * print
    
    * print
    
    * debug
    
    * debug
    
    * os.getenv
    
    * gloo
    
    * gloo
    
    * gloo
    
    * cleanup
    
    * fix getenv
    
    * cleanup
    
    * cleanup destroy
    
    * try nccl
    
    * return opt
    
    * add --local_rank
    
    * add timeout
    
    * add init_method
    
    * gloo
    
    * move destroy
    
    * move destroy
    
    * move print(opt) under if RANK
    
    * destroy only RANK 0
    
    * move destroy inside train()
    
    * restore destroy outside train()
    
    * update print(opt)
    
    * cleanup
    
    * nccl
    
    * gloo with 60 second timeout
    
    * update namespace printing
    fad27c00
名称
最后提交
最后更新
..
aws 正在载入提交数据...
flask_rest_api 正在载入提交数据...
google_app_engine 正在载入提交数据...
wandb_logging 正在载入提交数据...
__init__.py 正在载入提交数据...
activations.py 正在载入提交数据...
autoanchor.py 正在载入提交数据...
datasets.py 正在载入提交数据...
general.py 正在载入提交数据...
google_utils.py 正在载入提交数据...
loss.py 正在载入提交数据...
metrics.py 正在载入提交数据...
plots.py 正在载入提交数据...
torch_utils.py 正在载入提交数据...