OneClickLLAMA
OneClickLLAMA copied to clipboard
一键运行 Qwen2.5 SakuraLLM 等本地 LLM 模型
OneClickLLAMA
- 一键运行 Qwen2.5 SakuraLLM 等本地 LLM 模型
- 可与众多支持 OpenAI 格式的翻译器、分析器应用搭配使用,包括但是不限于:
- LinguaGacha
使用 AI 能力一键翻译小说、游戏、字幕的次世代翻译器推荐👈👈 - KeywordGacha
使用 AI 能力一键生成术语表的次世代翻译辅助工具推荐👈👈 - AiNiee
- GalTransl
- 绿站(轻小说翻译机器人)
- LinguaGacha
- 配合本页中的各应用的设置指南,可以得到最优化的性能,相较于默认设置可提升 3-5 倍
要求
- 至少 8G 显存的独立显卡,NVIDIA 显卡最佳,其他显卡很慢
- 确保安装了
最新版本的显卡驱动程序
步骤
-
从 发布页 下载最新版本的
OneClickLLAMA并解压缩OneClickLLAMA_NV是 NVIDIA 专用的版本OneClickLLAMA_VULKAN是 所有显卡 通用的版本
-
根据用途和显存大小下载适合的模型并放入
OneClickLLAMA文件夹 -
日文翻译到中文
| 显存大小 | 模型规模 | 启动脚本 | 下载链接 |
|---|---|---|---|
| 8G/10G | 7B | 01_1280_NP16.bat | sakura-7b-qwen2.5-v1.0-iq4xs.gguf |
| 11G | 14B | 01_1280_NP4.bat | sakura-14b-qwen2.5-v1.0-iq4xs.gguf |
| 12G | 14B | 01_1280_NP6.bat | sakura-14b-qwen2.5-v1.0-iq4xs.gguf |
| 16G | 14B | 01_1280_NP16.bat | sakura-14b-qwen2.5-v1.0-iq4xs.gguf |
| 24G | 14B | 01_1280_NP16.bat | sakura-14b-qwen2.5-v1.0-q6k.gguf |
- 其他语言翻译到中文(7B 效果很差,14B 勉勉强强,最好使用在线接口)
| 显存大小 | 模型规模 | 启动脚本 | 下载链接 |
|---|---|---|---|
| 8G/10G | 7B | 01_1280_NP16.bat | Qwen2.5-7B-Instruct-IQ4_XS.gguf |
| 11G | 14B | 01_1280_NP4.bat | Qwen2.5-14B-Instruct-IQ4_XS.gguf |
| 12G | 14B | 01_1280_NP6.bat | Qwen2.5-14B-Instruct-IQ4_XS.gguf |
| 16G | 14B | 01_1280_NP16.bat | Qwen2.5-14B-Instruct-IQ4_XS.gguf |
| 24G | 14B | 01_1280_NP16.bat | Qwen2.5-14B-Instruct-Q6_K.gguf |
- 搭配 KeywordGacha 抓取实体词语表
| 显存大小 | 模型规模 | 启动脚本 | 下载链接 |
|---|---|---|---|
| 8G/10G/11G/12G/16G/24G | 7B | 01_2k_NP16.bat | Qwen2.5-7B-Instruct-IQ4_XS.gguf |
启动
- 现在你的文件结构应该类似于:
OneClickLLAMA\llama\...
\00_Core.bat
\01_1280_NP16.bat
\sakura-14b-qwen2.5-v1.0-iq4xs.gguf
\...
- 根据
你的显存和模型的搭配组合选择对应的启动脚本,双击启动即可
应用设置
- 根据你的需求和使用的应用查看对应设置教程
- 搭配 LinguaGacha 进行日中翻译 Wiki - LinguaGacha_Sakura
推荐👈👈 - 搭配 LinguaGacha 进行其他语言翻译 Wiki - LinguaGacha
推荐👈👈 - 搭配 KeywordGacha 进行文本分析 Wiki - KeywordGacha
推荐👈👈 - 搭配 AiNiee 进行日中翻译 Wiki - AiNiee_Sakura
- 搭配 轻小说翻译机器人(绿站) 进行日中翻译 Wiki - AutoNovel_Sakura
- 搭配 LinguaGacha 进行日中翻译 Wiki - LinguaGacha_Sakura
常见问题
-
什么是
爆显存,会导致什么问题?- 系统需求的显存超过了显卡实际的物理显存大小,称之为
爆显存 爆显存时,翻译的速度和结果都会出现异常,基本丧失可用性,所以要避免这种情况
- 系统需求的显存超过了显卡实际的物理显存大小,称之为
-
如何判断是否
爆显存- 如果爆的比较厉害,程序会直接报错或者退出
- 爆了一点又没有完全爆比较难判断
- 一个可参考的方式是通过第三方软件监测显卡功耗
- 满载执行任务时,显卡实际功耗应为最大功耗的
70%-80%或者更高 - 如果显存接近用完,但是显卡实际功耗很低,则大概率是爆显存了
-
如何避免
爆显存- 在模型启动后,模型占用的显存大小是固定的,不会变化,但是系统中的其他应用也会占用显存
- 本项目中的脚本都预留了一定的冗余空间,但如果开启过多应用,依然可能导致显存消耗完
- 所以在使用时,应尽量减少开启其他消耗显存的应用
- 比如
浏览器、动态壁纸、视频播放器或QQNT、VSCODE等基于浏览器内核的应用