 |
|
GreenHand
V2EX 第 22077 号会员,加入于 2012-06-09 22:18:32 +08:00
|
If you wanna make the world a better place, take a look at yourself, and then make a change.
 |
根据 GreenHand 的设置,主题列表被隐藏 |
二手交易 相关的信息,包括已关闭的交易,不会被隐藏
GreenHand 最近回复了
你爸 55 岁跑滴滴不只是要考虑“年龄不行”,更大的问题是:合规门槛 + 智能手机/导航能力 + 在大城市长期驾驶的体力与心态(一个人在杭州是否有住的地方、是否孤单,性格是否适合做服务行业)。“先租几个月试试再买车”,方向非常对,但还要细化。比如租车验证三个月,每个月能够赚 1000 ,才考虑买车。
建议先评估。在公司内收集一批带 groundtruth 的题目,找几个最好的模型,用盲评评估下结果,看哪些模型最好。可选的就 deepseek 、claude 4 sonnet 、codex (既然提到规则编写,默认就把 coding sota 模型加进来了),其它认为效果不错的模型。这里分两批模型:可落地的模型和 sota 模型。
决定是否训练模型。基于可落地模型和 sota 模型的效果评估和差距,决定是否要训练模型。最好的情况是可落地的模型( deepseek 、qwen3 、doubao-1.5 等)效果就不错了,直接用(不考虑数据泄露)或者买 gpu 自己部署(数据安全)。
如果差距较大且对效果不满意,需要考虑训练模型,确定如何训练,蒸馏、sft 、rft 等。这条路比上面的成本就高多了,需要考虑准备数据、制定评估标准、评估、训练,甚至数据飞轮。你们公司大概率是没有训练平台,需要找一个。整个过程,一个人是搞不定的。
最后模型效果好了,才考虑落地。
建议先评估下 roi ,是否值得做。评估下「大模型可以回答当前我们软件的一些流程怎么进行,最好可以实现一些 DRC/LVS 规则文件的编写什么的」能够带来多大的收益,是否值得投入对应的成本。
字节那么确认,不考虑内部活水么?是不想再字节呆了吧
另外,这薪资要求,让我怀疑帖子的真实性