MegEngine icon indicating copy to clipboard operation
MegEngine copied to clipboard

MegEngine 是一个快速、可拓展、易于使用且支持自动求导的深度学习框架

Results 144 MegEngine issues
Sort by recently updated
recently updated
newest added

Gather输入tensor维度过大返回结果有误,同时会报错: extra message: bad index value for index 0 at output xxxxx ## 环境 1.系统环境:manjaro 2.MegEngine版本:1.10 3.python版本:3.7 ## 请提供关键的代码片段便于追查问题 测试代码: ```python import torch import megengine as mge import numpy as...

针对目前有部分同学提出的 “MegEngine各类报错信息提示不够明确”的问题,MegEngine 技术团队正在逐步优化中。 在此也希望大家能在此反馈更多具体的待优化报错提示信息,帮助我们做定向优化。 **为了更好的复现报提示并进行修复,建议回复时参考以下模板** 【版本、环境信息】 + MegEngine 版本:(请提供当前问题发生所使用的 MegEngine 版本) + CPU 型号:(如为 CPU,请提供 CPU 型号) + GPU 型号:(如为 GPU,请提供 GPU 型号) + 系统环境:(请提供系统环境,linux / windows / Android、手机型号等,包括是 32...

i need to use megengine module with pytorch module

## 背景 MegEngine Lite 尝试 OpenCL Inference 报错。 ## 任务描述 1.7 版本之后似乎不支持将 LiteDeviceType 设置为 LITE_OPENCL。 ## 目标 希望能够实现采用 OpenCL 推理。

The old behavior of the flops count in module_stats is buggy when ConvTranspose2d is used with stride > 1.

## 环境 1.系统环境:ubantu 2.MegEngine版本: 1.9.0 3.python版本: 3.7 ## 复现步骤 简化case: ``` import megengine import megengine.functional as F from megengine.autodiff import GradManager import megengine.module as M import megengine.optimizer as optim import...

## 环境 1.系统环境:Ubuntu 18.04 2.MegEngine版本:1.8.2 3.python版本:3.6.9 ## 复现步骤 import megengine ## 请提供完整的日志及报错信息 >>> import megengine err: failed to load cuda func: cuMemcpy2D_v2_ptds [1] 491 segmentation fault python

## 环境 1.系统环境:Win10 2.MegEngine版本:1.9.0 3.python版本:3.7 ## 请提供关键的代码片段便于追查问题 ```python from megengine.utils.module_stats import module_stats import megengine.functional as F import megengine.module as M import megengine as mge class Conv2d(M.Module): def __init__(self, in_ch, out_ch,...

## 环境 1.系统环境:win10+cuda10.2 2.MegEngine版本:1.9.0 3.python版本:3.8 代码地址: https://gitee.com/miemie2013/ppgan2 进入test_grad文件夹。首先运行test2_53_SynthesisNetwork_grad.py,跑pytorch的8次训练,保存输入、输出、梯度等为文件53.npz; 接着,跑test2_53_SynthesisNetwork_grad_2mge.py,将pytoch的权重移植为MegEngine的权重,保存为文件53.pkl。最后,跑test2_53_SynthesisNetwork_grad_mge.py,读取53.npz中保存的输入作为输入,跑MegEngine的8次训练。即此时MegEngine版与pytorch版有相同的输入和权重,我们期望MegEngine与pytorch有相同的输出、相同的梯度。但是跑第1次训练时发现,model.b32.torgb.weight.grad和model.b32.conv1.weight.grad与pytorch差异巨大。因为要实现梯度惩罚损失,所以一阶梯度dy_dws参与损失的计算。 SynthesisNetwork中的SynthesisLayer和ToRGBLayer的梯度应该是没问题的。可以做以下实验验证: 先跑test2_51_ToRGBLayer_grad.py,再跑test2_51_ToRGBLayer_grad_2mge.py,最后跑test2_51_ToRGBLayer_grad_mge.py,差异ddd会很小,说明ToRGBLayer的梯度没有问题(有多种配置供测试,我本人试过所有配置,差异ddd都不大); 先跑test2_52_SynthesisLayer_grad.py,再跑test2_52_SynthesisLayer_grad_2mge.py,最后跑test2_52_SynthesisLayer_grad_mge.py,差异ddd会很小,说明SynthesisLayer的梯度没有问题(有多种配置供测试,我本人试过所有配置,差异ddd都不大)。

## 请简要描述您的需求 #442 #441 这两个的ci fail掉了,能帮忙查看一下失败原因吗