eggroll 分布式fate训练更慢了：相同数据、相同分区、相同并行度、相同训练参数

分布式fate训练更慢了：相同数据、相同分区、相同并行度、相同训练参数

Open henshy opened this issue 3 years ago • 4 comments

数据维度：双边40w+450维模型：secureboost 机器与环境：多台（32核、64G）、内网分布式：k8s集群2台：2台任务参数： "common": { "job_type": "train", "task_cores": 32, "task_parallelism": 1, "computing_partitions": 32 } 算法参数： "common": { "hetero_secure_boost_0": { "task_type": "classification", "objective_param": { "objective": "cross_entropy" }, "validation_freqs": 1, "encrypt_param": { "method": "Paillier", "key_length": 2048 }, "learning_rate": 0.1, "num_trees": 10, "tree_param": { "max_depth": 5 } }, "evaluation_0": { "eval_type": "binary" }, "data_transform_0": { "input_format": "sparse" }, "data_transform_1": { "input_format": "sparse" } } 训练耗时（host为例）：分布式计算：单机计算：分布式通讯：单机通讯：耗时总结：分布式的mapReducePartitions花了8000多秒，单机反而是4000多秒；网络通讯也一样，分布式get下的encrypted_grad_and_hess花费4343秒，单机2511秒。