oneflow issues

[For Test]Dev wkv reduce graph compile time

wkv 和缩减 graph 编译时间的合并分支。

Add tensor.exponential api

1

背景：https://github.com/Oneflow-Inc/OneCloud/issues/136#issuecomment-1185260240 概述：缺少指数分布的随机数生成算子文档截图： ![image](https://user-images.githubusercontent.com/53533850/188176549-802a0eef-2bf9-441a-87eb-793abf8ee4f9.png)

marigoold

enhancement

documentation

api

python

RuntimeError: Check failed: (nd_sbp.has_value()) == (this->has_nd_sbp_symbol_id()) (0 vs 1)

1

## Summary ``` RuntimeError: Check failed: (nd_sbp.has_value()) == (this->has_nd_sbp_symbol_id()) (0 vs 1) File "/home/xuxiaoyu/dev/oneflow/oneflow/core/functional/impl/global_cast.cpp", line 526, in operator() MetaInfoConsistencyCheck(parallel_desc, sbp_parallels, grad_sbp_parallels, 1, check_meta) File "/home/xuxiaoyu/dev/oneflow/oneflow/core/framework/consistency_check.cpp", line 253, in MetaInfoConsistencyCheck MetaInfoConsistencyCheck(placement,...

strint

community

MakeParallelConf部分代码优化

MakeParallelConf函数中[处理hierarchy](https://github.com/Oneflow-Inc/oneflow/blob/release/v0.8.0/oneflow/core/framework/parallel_conf_util.cpp#L57-L61)的这部分，似乎可以挪到[for循环](https://github.com/Oneflow-Inc/oneflow/blob/release/v0.8.0/oneflow/core/framework/parallel_conf_util.cpp#L39)外面？

fpzh2011

community

idea_to_discuss

add attr first_iter_when_persistent_workers

5

- [x] 修复https://github.com/Oneflow-Inc/OneTeam/issues/1674 中提到的问题

Flowingsun007

enhancement

eager

api

Refactor sync access blob by callback

1

优化cuda_tensor.numpy()，内部不再调用cuda_tensor.cpu().to_numpy()，而是直接在main线程的cuda stream上SyncAutoMemCpy。

lixinqi

matmul矩阵乘法在dim=0时失效

oneflow 在执行矩阵乘法时，如存在dim=0的维度，则会报错 ``` >>> import torch >>> import oneflow as flow loaded library: /lib/x86_64-linux-gnu/libibverbs.so.1 >>> torch.__version__ '1.10.2' >>> flow.__version__ '0.8.1.dev20220903+cu112' >>> a = torch.randn(0, 5) >>> b = torch.randn(5, 6)...

ofhwei

api

strint

help wanted

community

oneflow
oneflow copied to clipboard

Metadata

[For Test]Dev wkv reduce graph compile time

Add tensor.exponential api

RuntimeError: Check failed: (nd_sbp.has_value()) == (this->has_nd_sbp_symbol_id()) (0 vs 1)

MakeParallelConf部分代码优化

add attr first_iter_when_persistent_workers

Refactor sync access blob by callback

matmul矩阵乘法在dim=0时失效

【建议】FP16/BF16 的 restrict 模式：只将 matmul 在 FP16/BF16 执行，其它算子仍然在 FP32 执行

数据类型严格模式

OneFlow FAQ

← Metadata

Owner

Metadata

oneflow oneflow copied to clipboard

Metadata

← Metadata

Owner

Metadata

oneflow
oneflow copied to clipboard