1
czfy 207 天前
你对于流畅运行端侧大模型的配置需求有误解
|
2
AS4694lAS4808 207 天前 via Android
NAS 如果有显卡,本地部署 7B+模型和全量 RAG 可以实现楼主的功能,如果没有,只能放弃隐私用云端 LLM+短分片 RAG 了,7B 以下的模型都是凑活事的。我司倒是在做类似产品,也有量化和压缩的 2B 高通端侧模型,不过业余是 toB 的
|
3
LuckyLauncher 207 天前
“性能还可以”
A100? |
4
PerFectTime 206 天前
跑大模型也费电啊
|