免费干货 | 剑侠AI本地聊天整合包 · 开源模型适配显卡说明与下载!
本文章说明:将 .gguf 模型放入 Models 文件夹后,各模型对显卡的要求, 以及是否支持「上传图片识图」、是否倾向无审查版本。 【估算说明】 · 显存需求 ≈ 模型文件体积 + mmproj(如有,约 0.2~1.1 GB) + 上下文 KV 缓存(默认 4096 约 0.5~2 GB) · 整合包默认全 GPU 卸载(-ngl 999),以下为 NVIDIA 独显参考 · 无独显时可 CPU 运行,速度较慢,不在此表重点列出 · 「无审查」依据模型文件名及社区惯例,非实测保证;instruct/it 多为对齐版 gemma-4-31b-jang-crack Q3_K_M 14.2 GB ✅ 倾向无审查 16 GB(24 GB 更稳) ❌ 过大,需 CPU 混跑或换卡 Qwen3.6-35B Uncensored IQ2_M 10.9 GB ✅ 有 mmproj 12 GB(16 GB 更稳) ✅ 接近满显存 Llama-3.1-8B Lexi Q8_0 8.0 GB 8 GB(12 GB 舒适) Lexi-Llama-3-8B Uncensored Q8_0...




