模型开发接口
推理部署接口
API 相关说明
在单机多卡环境下启动多个进程进行训练的装饰器。
func – 你想要在分布式模式下启动的函数。
n_gpus – 每个节点多少个设备。
world_size – 总共多少个设备。
rank_start – 机器上 rank 开始的数字。
master_ip – 主节点的IP地址(即 rank 0 所在的机器)。
port – 分布式客户端的端口。
backend – 设置默认的集群通信后端。
上一页
megengine.distributed.get_world_size
下一页
megengine.distributed.bcast_list_