GPLer

Results 3 issues of GPLer

### Feature request / 功能建议 仓库地址:https://github.com/mlc-ai/mlc-llm 类似 ONNXRuntime,但是对国产化模型的支持更好,可以通过 [web-llm](https://github.com/mlc-ai/web-llm) 在支持 WebGPU 的浏览器上直接跑大模型。

feature

### Feature request / 功能建议 仓库地址:https://github.com/microsoft/onnxruntime 官网:https://onnxruntime.ai/ 这个格式我了解的也不是很深,但是从描述上来看微软想在机器学习领域搞一个类似 3D 界的 GLTF 格式,让大模型平台无关化,最直接的好处我能想到的大概就是能在客户端用浏览器直接跑大模型。

feature

### Feature request / 功能建议 仓库地址: https://github.com/ztxz16/fastllm 类似 llama.cpp,对国产化模型的支持程度更好,且运行速度更快。 >fastllm分别实现了llm中常见的算子,并尽可能将一个算子合为一个CUDA kernel,只有一轮GPU核心到显存的输入输出,提高了计算访存比。

feature