V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  coefu  ›  全部回复第 1 页 / 共 51 页
回复总数  1005
1  2  3  4  5  6  7  8  9  10 ... 51  
21 小时 40 分钟前
回复了 sslzjx 创建的主题 生活 明天去见女方家长,这套配置怎么样
@Fish1024 论嘴臭,还得是你小子,哈哈,😄
1 天前
回复了 davidyin 创建的主题 Local LLM 如何在 vs code 上应用自建的 ollama 模型
@davidyin 搞是能搞成的,工程角度来看,是有办法的,只是麻烦。你自己要学一堆东西先。你这种需求,不是共性需求,没人造轮子的。
@diudiuu #8 谢谢你先,但是我没搞🦞。而且,我对🦞这个方向没什么兴趣,😄。

去年这个时候,我把 langchain/rag 那套都搞过一遍,没什么意思。LLMs 整个领域,我都只用而已。
@diudiuu #5 我几百块的成本捡的垃圾,都组了一个智能密度看起来还可以的♾️tokens 。只是有时候慢一点。😄
@diudiuu #5 不差钱的话,全都买啊。mac studio m3 ultra 要是不搞 512g mem ,意义不大,顶配要 10w ,比 dgx spark 贵太多了。如果预算有限,就 dgx spark 咯?反正现在小模型的智能密度很高了。你要专业性和准确性的话,用 rag 提升,当前 ocr 和 rerank 都发展的不错了。

mac studio m3 ultra 可以串起来,组一个 1T mem 的组合 跑 671B 的 deepseek 。不差钱儿的话,这个肯定更好。
@diudiuu https://www.v2ex.com/t/1126516

小伙子,在我面前耍大刀了啊。我只是没有钱买 dgx-spark 。
1 天前
回复了 neteroster 创建的主题 Apple Macbook Neo
@unneeded #2 吝啬这一块,还得是 apple 。
1 天前
回复了 cat9life 创建的主题 Local LLM qwen3.5 过度思考的问题
@cat9life #5 你集成的 gpu tensor core 和 gmem bandwidth ,肯定其中有一个是瓶颈,或者两个都是。
1 天前
回复了 cat9life 创建的主题 Local LLM qwen3.5 过度思考的问题
@cat9life #5 我刚才加上了 open-webui ,然后在里面让它读网页 URL ,确实耗时一点,但是真能读。并且内容分析的还可以,中规中矩,没有胡说八道。确实很夯了。
1 天前
回复了 cat9life 创建的主题 Local LLM qwen3.5 过度思考的问题
@cat9life 我昨天一天的测试,都没有出现思考时间过长,思考+回答,几乎都在 2~3s 完成,非常快了。所以我觉得,夯爆了。准备加上 rag+network 试一下 质量效果。专业性和准确度完全可以靠 rag 来兜底的,实时性就靠 network 了。rag 里的最重要的就是 ocr 和 rerank ,搞好这两点,还是能打的。
1 天前
回复了 davidyin 创建的主题 Local LLM 如何在 vs code 上应用自建的 ollama 模型
你应该问 chatgpt 或者 gemini 。
1,你小子真舍得,牛逼。
2 ,我没有设备,你的问题没办法回答。
3 ,如果你愿意共享出来,还是能帮你 debug 试一下的。
1 天前
回复了 cat9life 创建的主题 Local LLM qwen3.5 过度思考的问题
我昨天也跑了一下。我发现这个 4b 确实很好了。在 tuning 架构的卡 gddr6 的位宽下,能跑 40+ T/s ,主要是回复体现的智力中规中矩。辅以外挂 rag+mem+network 的话,还是很顶的。主要是可以在几乎完全平价的资源下,跑出来一定的效果。这还要什么自行车?

x99 贴牌新板( 150+)+ xeon e5 14core/2thread(70+) + ddr4 16g*2 (200+,前年买的库存) + 五手矿 p106(150+,前年的价格,现在估计对半) 6g+ CMP 40HX(300+ ,前年的价格现在估计对半)8g ,1000 以内的成本,几乎♾️tokens ,还有一定的准确性和实时性。垃圾佬的胜利。✌🏻
linux 托管在 github ,是 github 的荣耀。
2 天前
回复了 lellansin 创建的主题 OpenClaw 建了个 OpenClaw 养虾群,欢迎交流
@lynn1su 那叫模仿学习。不是强化学习。
2 天前
回复了 caocong 创建的主题 职场话题 阿里千问负责人林俊旸千问离职
@huaweii #17 讲真,我看到的第一感觉,也是这样。见怪不怪了,人多了,心思多。反正各自早就不为生活操心了,在大厂里,归根到底都不是自己的家业。满足一下斗争的心思,摘桃成功与否,嚯嚯的也不心疼,成功了升几级,失败了大不了认错降级边缘化,反正财务早就自由了。只是做事的人搞走了,一时半会儿又要找人,比较麻烦罢了。
2 天前
回复了 caocong 创建的主题 职场话题 阿里千问负责人林俊旸千问离职
@glacer 以前一起看月亮的时候,叫“小甜甜”。现在新人换旧人了,就叫“牛夫人”。😄
本末倒置了,小老弟。

基础知识 是这个行业里必须有的。你不把这些基础知识夯实了,别说走多远了,站稳脚跟都是问题。vibe coding 只是锦上添花,夯实的基础才是永久。夯实的基础能让你 vibe coding 发挥出没有基础的人,更大的威力。现代意义上的 coding ,搞一点 web 应用,不需要夯实的 cs 基础,也能搞。但是整个 cs 领域,也不只有 web/mobile app 的技术啊。
典中典,有点钱的人想法就是奇特。这种大环境,还能想到这种点子,属实不易了。不过,颇有点 201x 年代那种勃勃生机 万物竞发的 荒诞感了。😄
3 天前
回复了 gtese 创建的主题 求职 [求职] 上海 - 基础架构运维及桌面支持相关
@gtese #11 windows 这套有什么技术含量? windows 专家 对于 cs 整体而言,也就是个皮毛水平。在 gui 上记概念,点点点。底层原理 毛都摸不到。这点也就外企有钱的时候尊重一下学习的过程,吃点苦记点概念,理解封装好之后的点点点的逻辑。这点东西,从始至终就值 8k ,专家也就值这么多。

不说别的,给你一个月时间,k8s ,能把 WordPress 搞到 100w 并发能力。这才是当前初级运维需要的技术。


“我当年是一个门外汉从看电脑报开始,纯纯的爱好。” 80 后大部分都是先从小霸王开始的,这有什么好说的。我也是从小霸王开始的,后面打三角洲 1 ,那时候电脑室还没联网。
1  2  3  4  5  6  7  8  9  10 ... 51  
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   2683 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 34ms · UTC 01:49 · PVG 09:49 · LAX 17:49 · JFK 20:49
♥ Do have faith in what you're doing.