Paddle
Paddle copied to clipboard
PArallel Distributed Deep LEarning: Machine Learning Framework from Industrial Practice (『飞桨』核心框架,深度学习&机器学习高性能单机、分布式训练和跨平台部署)
### 请提出你的问题 Please ask your question paddlepaddle2.3.1训练wide&deep速度K40 比 V100慢了10倍 具体的速度对比 K40  V100  可能是哪些问题导致的
### 请提出你的问题 Please ask your question 我们使用 paddle.static.nn.while_loop() 构造循环体时,如果在训练program取循环结果的OP,能正常输出;当我们通过paddle.static.save_inference_model() 将program 导出成推断模型时,取循环结果的 OP 会报错,而且都是GPU方面的错。 后来我们参照 paddlenlp 中 GPT-3 [循环解码部分](https://github.com/PaddlePaddle/PaddleNLP/blob/develop/examples/language_model/gpt-3/static/modeling.py#L1230),将paddle.static.nn.while_loop() 改为 paddle.fluid.layers.While() ,发现同样的现象,在训练中取循环结果都是正常的,但是导出成推断模型,取循环结果总是报GPU方面的错误。 后面初步定位,在不开启paddle.inference.Config().collect_shape_range_info()的情况下不会报错,在开启的情况下会报错。 如下是相关的信息: 1. 测试模型训练中正常取循环体结果,即类似GPT解码多步预测结果: ```python 2022-08-05 10:21:53,426 - INFO...
### bug描述 Describe the Bug 按照官网步骤,在windows develop分支下: 执行到 cmake .. -GNinja -DWITH_GPU=ON 报错。 release/2.3 cmake 正常。  ### 其他补充信息 Additional Supplementary Information _No response_
### 请提出你的问题 Please ask your question 如果输入数组和value都是int,是否有put_along_axis 的替代函数,目前文档上写着put_along_axis只支持float32和float64
### bug描述 Describe the Bug import paddle import math x = paddle.to_tensor([160.22123718, 7*math.pi]) out = paddle.cos(x) print(out) 输出out 第一项为 -1 ### 其他补充信息 Additional Supplementary Information _No response_
### 请提出你的问题 Please ask your question 在 Paddle inference 中,如果配置 paddle.inference.Config.enable_use_gpu() 能够启动 GPU 推理,但是我们在启动 config.enable_profile() 的时候发现 CPU 和 GPU 之前存在不少通信,有一些变量也会放在 CPU 上,所以有没有一种方法强制在 paddle inference 将所有计算节点与参数都放在 GPU 上? 部分性能 profile: ```python...
### bug描述 Describe the Bug develop版本下,paddle.autograd.grad()报错:SystemError: (Fatal) Null autograd_meta gotten from unsafe_autograd_meta() 2.3版本下可正常运行 代码见:https://github.com/PaddlePaddle/PaddleScience/pull/142 [报错位置](https://github.com/PaddlePaddle/PaddleScience/blob/d98f626e22351f08fee8f411f860f176da627455/paddlescience/network/grad_norm.py#L84): ```python for i in range(losses.shape[0]): grad = paddle.autograd.grad(losses[i], W, retain_graph=True) norms.append(paddle.norm(self.loss_weights[i] * grad[0], p=2)) ```...
三机八卡的训练出现了频繁hang住的问题,基本上每训半天就会hang住,log中没有任何报错信息,每次hang在不同的step上,麻烦帮忙看一下。
### PR types Bug fixes ### PR changes OPs ### Describe Fix reorder bug in conv MKLDNN
### PR types Bug fixes ### PR changes Others ### Describe When the interpolate OP only specifies the output dim but does not specify the scale, the value of the...