| RSS |
| 消费级显卡(16G A 卡)是不是不适合运行 vllm 和 sglang,好像使用 transformer 推理都比这两个框架快,并且占用显存低 zhengfan2016 • 16h 36m ago • Lastly replied by oldlamp | 18 |
| 本地大模型最佳 Mac 配置选择 SteveRogers • 13h 4m ago • Lastly replied by SteveRogers | 26 |
| 关于 5070ti 模型推理的速度和本地部署思考 tootfsg • May 20 • Lastly replied by tootfsg | 9 |
| 有没有能够兼容 Win7 的离线模型工具 faketemp • May 19 • Lastly replied by tairan2006 | 12 |
| 想折腾一个 AI 主机,请行家出手 davidyin • May 14 • Lastly replied by jhytxy | 80 |
| 锤子找钉子的项目分享:假想企业本地部署后不用人工洗库接入 llm 的中间层。 KaiWuBOSS • May 10 • Lastly replied by yijihu | 2 |
| 都 2026 年了,为什么还有人觉得 AMD 比 Nvidia 更适合部署本地大模型? babymonster • May 12 • Lastly replied by jinsongzhaocn | 130 |
| 推荐一个 GPU 推理速度计算器, 可能方便买配件自建本地大模型的人用上 Hermitist • May 8 • Lastly replied by diudiuu | 18 |
| DGX Spark、ASUS GX10、MSI EdgeXpert 看起来都像是一个母胎的产品,用起来有差别吗? SzgSw5zGyN1iy • May 8 • Lastly replied by qazwsxkevin | 11 |
| gemma4:31b-coding-mtp-bf16
Livid PRO |
| 我自己的电脑是 5070Ti,总感觉跑一些模型算力不够 babymonster • May 15 • Lastly replied by JerningChan | 51 |
| 有适合本地跑训练 AI 的电脑配置吗? linxiaojialin • May 6 |
| LiteChat 轻量级本地大模型聊天 WebUI,支持 vLLM zsj1029 • May 6 • Lastly replied by Orangeee | 7 |
| 能一起给本地部署的开源模型做个适配的 coding agent 吗?我憋了口气 KaiWuBOSS • May 8 • Lastly replied by KaiWuBOSS | 115 |
| github 看到一个项目, 3090 跑 27B, 129tps,最高 207tps stefwoo • May 6 • Lastly replied by jiaorong | 10 |
| 请问各位大神,在隔离环境中,有本地 qwen 大模型,有没什么解决方案,做本地的知识库的方案,类似谷歌那个 notebooklm ,也勉强可以? ken2025 • May 3 • Lastly replied by jinsongzhaocn | 5 |
| 私有化部署大模型的“终点”是 Mac 还是 Nvidia? babymonster • May 2 • Lastly replied by bobguo | 29 |
| 自己做了一款在线 GPU 推理速度计算器 · TPS Calculator diudiuu • May 7 • Lastly replied by diudiuu | 12 |
| 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s,记录一下技术发现 KaiWuBOSS • May 6 • Lastly replied by kevan | 107 |
| 有一台 16 寸 m1max 64g+1T 满 GPU 的 MacBook Pro 适合部署哪个本地模型 alangz • May 2 • Lastly replied by davidqw | 11 |