V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  LaTero  ›  全部回复第 6 页 / 共 18 页
回复总数  344
1 ... 2  3  4  5  6  7  8  9  10  11 ... 18  
2024 年 10 月 30 日
回复了 babyedi31996 创建的主题 程序员 本地部署大语言模型哪家强?
刚才去看了下 hermes 的模型卡,fp16 要超过 800GB 的显存,而 fp8“仅需”430GB ,这样的模型,在 openrouter100 万个输入 token 才 1.79 美元……
本地的话最多也就 int4 量化 70B 了,但是效果真的不是很好。最近的 70B 跑分王 qwen2.5 和英伟达的 Nemotron 我都试过,真的就只是跑分王。尤其是 Nemotron ,它高分主要是输出长,不切实际的跑分就喜欢输出长的,然而对人类来说就是啰嗦、废话多。Qwen 经常英语中文乱混,我用英语的时候它喜欢夹几个汉字,我用中文它又整几个英文单词出来了,很无语。这俩还是有审查的,需要找越狱 prompt ,越狱也不是一定管用的。
另外还有两个我个人用的多一点的模型是 WizardLM 和 DolphinLM ,都是基于 Mistral 的 MoE 模型,优点是很便宜。Wizard 有一点点审查,一个简单的系统 prompt 就搞定了,Dolphin 无审查。
2024 年 10 月 30 日
回复了 babyedi31996 创建的主题 程序员 本地部署大语言模型哪家强?
玩 silly tavern ,建议用 openrouter ,silly tavern 支持他家的 api ,而且是按量付费,用多少付多少,还能匿名用 claude/gpt 不怕封号,多好,搞什么本地。模型建议 hermes 3 405b (基本是 llama 3 405b 的去审查版)或 command r+(无审查的商用模型,个人感觉效果其实不是很好,但是非英语会比 hermes 好一些。社区微调一般只会英语)。效果真的把那些本地 13b 小模型吊着打,还快。本地搞一堆非常低的量化也就勉勉强强跑个 70b ,速度还不行,而且你本地买两张 24g 的卡能在 openrouter 玩多久……
@pyre 如果是国产的 400IU 800IU 是很难过量,但是我买的 doctor's best 一粒就是 5000IU ,吃多了还是有风险的。而且人和人体质不同,口服中毒风险个体差异巨大,有条件还是去医院测一测血羟维生素 D 浓度。
你确定真的需要吃吗?去医院测过吗?如果是 B 、C 之类的还好,水溶性很难超量,但是你要是 A 、D 狂吃过量后果很严重。
@heyjei 5km/h?你确定没打错?这是走路的速度啊,我们小区楼下的小朋友学骑自行车都比这快,怎么能摔的?这速度把脚一伸不就停了吗。
2024 年 10 月 20 日
回复了 ProgramFiles 创建的主题 信息安全 上了外网但谷歌推荐都是中文
@ProgramFiles 我先确认一下,你是在模拟器外面的 Windows 开的代理软件,还是在模拟器里面的 Android 开的?在外面可能有很多问题。另外换个代理软件试试,我用的 https://karing.app/download/,这个软件点“速度”上的绿色显示器图标可以看到活动连接,不过它 UI/UX 特别差,手动加 socks 要先点+号添加自定义配置,在去配置里找到刚加的配置,点最左边+号添加 socks 。
2024 年 10 月 20 日
回复了 ProgramFiles 创建的主题 信息安全 上了外网但谷歌推荐都是中文
@ProgramFiles 先去侧栏里的 route (中文应该会是路由或分流)看看有没有可疑的规则会把谷歌流量分走,再去设置里把日志开到 info ,然后侧栏点日志看看流量有没有走。还有就是不一定是 IP 的问题,模拟器的语言啊区域设定等等都有可能,比如 clip studio paint 假如 regional format 是中文中国就用不了(经典正版受害者)。
2024 年 10 月 20 日
回复了 ProgramFiles 创建的主题 信息安全 上了外网但谷歌推荐都是中文
还有你具体是怎么用代理的?你一直说全局全局真的代理到了吗?用的是 tun 虚拟网卡还是仅仅设置了代理?如果只是在安卓 wifi 设置了指定了代理,那个要软件/库主动去用才行。如果用的是 tun ,模拟器到底走不走虚拟网卡?而流量进到 singbox 里,分流是什么样的?比如我的机场配置就把一些谷歌域名(比如 mtalk.google.com )走直连了。
2024 年 10 月 20 日
回复了 ProgramFiles 创建的主题 信息安全 上了外网但谷歌推荐都是中文
你一直在强调 IP ,但是问题是真的是 IP 的问题吗?你只是观测到 play 商店地区不是代理区域,但是你并没有找到证据它识别到了 IP 啊?
2024 年 10 月 19 日
回复了 ProgramFiles 创建的主题 信息安全 上了外网但谷歌推荐都是中文
另外你是用的什么软件?确定是走代理了吗?代理软件的日志也可以看看。
2024 年 10 月 19 日
回复了 ProgramFiles 创建的主题 信息安全 上了外网但谷歌推荐都是中文
2024 年 10 月 18 日
回复了 ojbkk 创建的主题 问与答 关于生铁锅
开锅不用猪皮,普普通通的炒菜植物油就行,亲测,炒饭煎淀粉肠等都试过。而且也不需要像一些视频里那么麻烦,什么烧到变蓝之类的,只要把油烧到特别热就行了,不管是热锅加油还是冷锅加油都行,只是热锅加油容易控制一点。开完后用洗洁精洗或者用钢丝球的话要重新来一遍。
2024 年 10 月 7 日
回复了 adrianzhang 创建的主题 问与答 Linux 或 Mac 上有没有类似“文本整理器”这样的工具
把不是紧跟着标点符号的\n 删掉试试
2024 年 9 月 30 日
回复了 LaTero 创建的主题 宽带症候群 科学上网落地方式/拓扑结构求指点
@MFWT 很详细,谢谢。我现在在看 nekobox 的文档,但是好像做不到单独给 BT 协议分流。
2024 年 9 月 30 日
回复了 LaTero 创建的主题 宽带症候群 科学上网落地方式/拓扑结构求指点
@yeh 感谢回复。落地自己租好几种成本有点高吧,而且旁路由在外面流量用不了有点不方便,不知道 termux 行不行。
@yyzh 感谢回复。这个确实,它们的 IP 比 Vultr 是干净多了,主要还是怕 IP 变动。比如某个地区的节点炸了,我可以换个地区,自己落地还是不变。但是机场的 IP 基本都不用验证码,还有家宽能注册用。
@Removable 请问你是用的什么客户端?是走的全局吗,还是有什么分流的办法?
@zeroonetwo 打了很多字但是自己看了下,感觉戾气有点重(想起了很多被 Unity 折磨的时光)又删掉了,先给你个赞吧,我也是希望 Unity 能赶上和 Unreal 竞争的,一家独大几乎从来都不好。前天发的 Unity 7 Roadmap 也是感觉到了希望,Unity 6 还加了个 beta 决策树,至少它是回到正轨(游戏)了。
@nikenidage1 小型游戏 Unity 并不会更好。除非是做 2D ,那 Unreal 是真的渣渣,但是要做 3D 真的感觉不是一个时代的东西了。大工作室可以自己做动画系统,有专门的人做 editor tooling ,有专业 technical artist 做 content pipeline ,能买得起 simplygon 这种超贵的软件,地形用 gaea ,PCG 大团队可以自己写,决策树、AI 、导航、各种模拟(如布料,Unity 自带的布料模拟问题很大)也能自己搞定,音频有专业的音频设计师用 WWise 和 FMod ,物理有时候也会换成第三方的(比如 Havok ),到最后就剩一个渲染还在用 Unity 了,而现在 URP 和 HDRP 分开导致如果想要兼顾高端和低端设备,连渲染管线也要自己写,和自研引擎也没什么差别了。大工作室可以这样玩,独立可不行,基本上就是引擎支持什么做什么,更何况 Epic 每个月免费送素材呢(可惜 Megascan 以后不免费了)。
1 ... 2  3  4  5  6  7  8  9  10  11 ... 18  
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   3163 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 32ms · UTC 00:05 · PVG 08:05 · LAX 16:05 · JFK 19:05
♥ Do have faith in what you're doing.