bolt icon indicating copy to clipboard operation
bolt copied to clipboard

Bolt is a deep learning library with high performance and heterogeneous flexibility.

Results 44 bolt issues
Sort by recently updated
recently updated
newest added

bolt在华为内部的定位是咋样的呢,未来对hi芯片有没有可能支持?

Is bolt support batch inference , could I inference 2 or more sentence at the same time ?

$ ./install.sh --target=android-aarch64 --gpu [ERROR] please install llvm-ranlib tools and set shell environment PATH to find it 新版本中编译过程用到的llvm-ranlib在ndkr20版本中,不存在,应当为llvm-ar,可以复制粘贴重命名一下,建议修改一下install.sh脚本

是否有FP16, INT8, Binary相同结构下的功耗对比分析数据?

GPU的算法文件包含algorithmMap和kernelThreadMap,当模型仅包含一些简单OP(eltwise, power等)时,不需要对tiling等参数做搜索,这时algorithmMap就是空的,kernelThreadMap中仍然包含着这些OP的local搜索结果。 因此存在一种corner case:algorithmMap.size() == 0 && kernelThreadMap.size() > 0 这时`void saveMapToFile()` 就会出现bug,导致这种模型的local搜索结果不会被保存到算法文件中。从而,模型下次初始化时虽然链接了这个算法文件,仍然需要重新搜索local。这时模型的第一次执行就会非常慢。具体表现是-w 0和-w 1的执行时间差异非常明显。

目前有模型可视化工具吗?

是否支持BILSTM等RNN等转换成C++

Hi, Thanks for this great work. Is there any performance compared to oneDNN and CoreML?