oneflow icon indicating copy to clipboard operation
oneflow copied to clipboard

OneFlow is a deep learning framework designed to be user-friendly, scalable and efficient.

Results 591 oneflow issues
Sort by recently updated
recently updated
newest added

https://github.com/Oneflow-Inc/oneflow/issues/8898

enhancement
feature
op
api

为framework完善报错信息 修改文件如下: - arg_tuple.cpp - attr_map.cpp - consistency_check.cpp - device.cpp - infer_util.cpp - instruction_builder.cpp - local_tensor_infer_cache.cpp - multi_client_session_context.cpp - nd_sbp.cpp - nn_graph.cpp - sync_symbol_parallel_desc.cpp 修复functional中expand functor的一个类型错误 由于framework的检查不好对应到python代码中,单元测试仅写了分布式下placement不一致的情况

feature
eager
graph

- 修复 loss scale 的不恰当精度转换 - 添加 amp_black_identity 以便在恰当时刻控制 gray node 的精度

bug
graph

![image](https://user-images.githubusercontent.com/3351623/191715240-3634db12-4ebc-403c-81ac-0850ebb0553a.png)

支持table_ids 在batch维broadcast,即支持ids为(batch_size, n), table_ids为(n) 的case

enhancement
op

- [x] 并行启动线程组 - [x] 每个线程读大 plan(并行读,安全),写各自的小 plan(写线程局部变量,安全) - [x] 小 plan 只包括特定 rank 需要的信息 - [x] 并行发送

概述:实现了 oneflow.nansum 算子 实现: - 和 reduce_sum 思路类似,但是增加了一个 binary_func: nansum - backward 和 reduce_sum 相同,都是 ones_like - 原来的 reduce 系列算子中,当某个需要 reduce 的 dim 上的 size 为 1 时,会自动进行 memcpy 操作。这里和...

op
documentation
api
python

- fix https://github.com/Oneflow-Inc/oneflow/issues/9074

当检测到任意一个节点没有活跃的IB端口时,禁用IB,以免报错 需要测试 - [ ] 任意节点无活跃端口,如果用户调用init_rdma,提示用户并忽略init_rdma - [ ] 否则,执行init_rdma

enhancement
system