MegEngine issues

[BUG Issue] Gather输入tensor维度过大返回结果有误

3

Gather输入tensor维度过大返回结果有误，同时会报错： extra message: bad index value for index 0 at output xxxxx ## 环境 1.系统环境：manjaro 2.MegEngine版本：1.10 3.python版本：3.7 ## 请提供关键的代码片段便于追查问题测试代码： ```python import torch import megengine as mge import numpy as...

Asthestarsfalll

【需求收集】MegEngine 报错提示信息优化

1

针对目前有部分同学提出的 “MegEngine各类报错信息提示不够明确”的问题，MegEngine 技术团队正在逐步优化中。在此也希望大家能在此反馈更多具体的待优化报错提示信息，帮助我们做定向优化。 **为了更好的复现报提示并进行修复，建议回复时参考以下模板** 【版本、环境信息】 + MegEngine 版本：（请提供当前问题发生所使用的 MegEngine 版本） + CPU 型号：（如为 CPU，请提供 CPU 型号） + GPU 型号：（如为 GPU，请提供 GPU 型号） + 系统环境：（请提供系统环境，linux / windows / Android、手机型号等，包括是 32...

HuaHua404

Help-wanted Issue

3

i need to use megengine module with pytorch module

mohamed19871988

error: no member named 'LITE_OPENCL' in 'LiteDeviceType'

1

## 背景 MegEngine Lite 尝试 OpenCL Inference 报错。 ## 任务描述 1.7 版本之后似乎不支持将 LiteDeviceType 设置为 LITE_OPENCL。 ## 目标希望能够实现采用 OpenCL 推理。

colorjam

fix flops count bug for ConvTranspose2d

1

The old behavior of the flops count in module_stats is buggy when ConvTranspose2d is used with stride > 1.

fanhqme2

BUG Issue ( segmentation fault during backward)

3

## 环境 1.系统环境：ubantu 2.MegEngine版本： 1.9.0 3.python版本： 3.7 ## 复现步骤简化case: ``` import megengine import megengine.functional as F from megengine.autodiff import GradManager import megengine.module as M import megengine.optimizer as optim import...

Feynman1999

MegEngine 导入模块出错 err: failed to load cuda func: cuMemcpy2D_v2_ptds

3

## 环境 1.系统环境：Ubuntu 18.04 2.MegEngine版本：1.8.2 3.python版本：3.6.9 ## 复现步骤 import megengine ## 请提供完整的日志及报错信息 >>> import megengine err: failed to load cuda func: cuMemcpy2D_v2_ptds [1] 491 segmentation fault python

wangxl0385

model_stats对模型参数进行统计会出现负值

## 环境 1.系统环境：Win10 2.MegEngine版本：1.9.0 3.python版本：3.7 ## 请提供关键的代码片段便于追查问题 ```python from megengine.utils.module_stats import module_stats import megengine.functional as F import megengine.module as M import megengine as mge class Conv2d(M.Module): def __init__(self, in_ch, out_ch,...

Qsingle

MegEngine复现stylegan2-ada，梯度不能对齐

5

## 环境 1.系统环境：win10+cuda10.2 2.MegEngine版本：1.9.0 3.python版本：3.8 代码地址： https://gitee.com/miemie2013/ppgan2 进入test_grad文件夹。首先运行test2_53_SynthesisNetwork_grad.py，跑pytorch的8次训练，保存输入、输出、梯度等为文件53.npz；接着，跑test2_53_SynthesisNetwork_grad_2mge.py，将pytoch的权重移植为MegEngine的权重，保存为文件53.pkl。最后，跑test2_53_SynthesisNetwork_grad_mge.py，读取53.npz中保存的输入作为输入，跑MegEngine的8次训练。即此时MegEngine版与pytorch版有相同的输入和权重，我们期望MegEngine与pytorch有相同的输出、相同的梯度。但是跑第1次训练时发现，model.b32.torgb.weight.grad和model.b32.conv1.weight.grad与pytorch差异巨大。因为要实现梯度惩罚损失，所以一阶梯度dy_dws参与损失的计算。 SynthesisNetwork中的SynthesisLayer和ToRGBLayer的梯度应该是没问题的。可以做以下实验验证：先跑test2_51_ToRGBLayer_grad.py，再跑test2_51_ToRGBLayer_grad_2mge.py，最后跑test2_51_ToRGBLayer_grad_mge.py，差异ddd会很小，说明ToRGBLayer的梯度没有问题（有多种配置供测试，我本人试过所有配置，差异ddd都不大）；先跑test2_52_SynthesisLayer_grad.py，再跑test2_52_SynthesisLayer_grad_2mge.py，最后跑test2_52_SynthesisLayer_grad_mge.py，差异ddd会很小，说明SynthesisLayer的梯度没有问题（有多种配置供测试，我本人试过所有配置，差异ddd都不大）。

miemie2013

avgpool/maxpool文档补全时ci挂掉

8

## 请简要描述您的需求 #442 #441 这两个的ci fail掉了，能帮忙查看一下失败原因吗

Seeker98

MegEngine
MegEngine copied to clipboard

Metadata

[BUG Issue] Gather输入tensor维度过大返回结果有误

【需求收集】MegEngine 报错提示信息优化

Help-wanted Issue

error: no member named 'LITE_OPENCL' in 'LiteDeviceType'

fix flops count bug for ConvTranspose2d

BUG Issue ( segmentation fault during backward)

MegEngine 导入模块出错 err: failed to load cuda func: cuMemcpy2D_v2_ptds

model_stats对模型参数进行统计会出现负值

MegEngine复现stylegan2-ada，梯度不能对齐

avgpool/maxpool文档补全时ci挂掉

← Metadata

Owner

Metadata

MegEngine MegEngine copied to clipboard

Metadata

← Metadata

Owner

Metadata

MegEngine
MegEngine copied to clipboard