XNNPACK
XNNPACK copied to clipboard

Published 20 hours ago •

→

Metadata

High-efficiency floating-point neural network inference operators for mobile, server, and Web

Reame
Issues

Results 342 XNNPACK issues

Sort by recently updated

Fix a crash on internal benchmark with relaxedsimd

Fix a crash on internal benchmark with relaxedsimd

copybara-service[bot]

QS8 AVX2 broadcast reorder input and weight loads before conversions

QS8 AVX2 broadcast reorder input and weight loads before conversions

copybara-service[bot]

QS8 AVX2 broadcast unroll loads before doing cvt

QS8 AVX2 broadcast unroll loads before doing cvt

copybara-service[bot]

Call xnnpack transpose from TfLite transpose and remove old optimized implementation

Call xnnpack transpose from TfLite transpose and remove old optimized implementation

copybara-service[bot]

Average pool subgraph supports QU8

Average pool subgraph supports QU8

copybara-service[bot]

Delegate QU8 average pooling to XNNPACK

Delegate QU8 average pooling to XNNPACK

copybara-service[bot]

Generate neondot qc4w benchmarks.

Generate neondot qc4w benchmarks. kr is in bytes.

copybara-service[bot]

Rename xnn_qd8_f32_qc4w_gemm_minmax_ukernel_fn and xnn_qd8_f32_qc8w_gemm_minmax_ukernel_fn

Rename xnn_qd8_f32_qc4w_gemm_minmax_ukernel_fn and xnn_qd8_f32_qc8w_gemm_minmax_ukernel_fn

copybara-service[bot]

Rename X8 scalar gemm microkernels with u1 suffix

Rename X8 scalar gemm microkernels with u1 suffix

copybara-service[bot]

QS8 scalar GEMM template support unrolled microkernels

QS8 scalar GEMM template support unrolled microkernels - Unroll WASM by 4

copybara-service[bot]

‹
1
2
...
10
11
12
13
14
15
16
...
34
35
›

← Metadata

1.7k

Stars

326

Forks

Watchers

Owner

Metadata

High-efficiency floating-point neural network inference operators for mobile, server, and Web