V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  yanyao233  ›  全部回复第 14 页 / 共 18 页
回复总数  350
1 ... 6  7  8  9  10  11  12  13  14  15 ... 18  
好耶!
2023-11-08 21:48:50 +08:00
回复了 bigboss60 创建的主题 NAS 群晖挂载阿里云为本地 WEBDEV,备份永远目的地损毁
照片这种东西我建议还是多网盘备份,毕竟丢失了就再找不回来了...我的 30 多 g 照片,就是电脑一份,nas 一份,onedrive 和 google drive 各一份
2023-11-08 21:15:13 +08:00
回复了 token10086 创建的主题 程序员 求求你们都别卷工具站了
果然,工具站、日记是所有程序员一定会做的项目
2023-11-07 22:03:37 +08:00
回复了 cuishunbiao 创建的主题 分享创造 利用 ChatGPT 开发了一个「几分钟前是几点」的网站
@bkzly83851 改名:互联网博物馆
2023-11-07 21:23:34 +08:00
回复了 amber0317 创建的主题 分享创造 做了个一站式 Bilibili 音乐下载器,以下是我的思考
哇哦,这 ui 好好看
2023-11-05 21:00:35 +08:00
回复了 yueji 创建的主题 机器学习 如何搭建一个基于聊天记录 训练的 AI 对话机器人
@yueji 没听过这个欸...看了一下似乎是英文的模型?恐怕中文不行吧
2023-11-04 19:07:32 +08:00
回复了 yueji 创建的主题 机器学习 如何搭建一个基于聊天记录 训练的 AI 对话机器人
几个月前刚训练过一个,安卓手机的话需要把微信数据库导出并解密 https://github.com/greycodee/wechat-backup
然后导出 contact 和 message 表,我先是对导出的表进行了清洗,把非目标群聊/联系人的聊天数据和大部分根本不需要的字段全部删除,删除不使用的聊天记录类型(比如图片啥)然后再清洗掉个人敏感信息

对于数据集生成,我的思路是
1.群聊: 先筛选出我发送的消息,然后向上追溯一分钟之内的其他人的消息作为一组对话(我这里没考虑引用回复),一天内的消息均作为上下文(但实际上我并不推荐使用群聊消息,现在并没有成本低且效果很好的方式来分割聊天,第三次训练时我去掉群聊的数据集,胡言乱语的情况好了很多)
2.联系人: 一问一答为一组对话,多条连续消息合并,一天内为上下文
最后总共有 8k 条聊天记录

我当时使用的 chatglm2 模型,lora 和 pt 都试了,lora 效果好太多,最终 15steps 的 loss 稳定在 1.0 左右

效果怎么说呢...确实金句频出,但记忆力明显下降,并且指令服从性几乎没有,也就仅仅能用来聊天了。

另外,我多次尝试让他认识到自己是谁,无论是通过数据集强化的方式,还是靠推理时增加 system prompt ,都无法达到效果...
2023-10-28 18:26:33 +08:00
回复了 yhtbiy 创建的主题 JetBrains 看看 jetbrains 又出了新的 IDE [writerside]
@zen1 这样高度统一的 ui 风格我觉得挺好的,降低了很多学习成本
2023-10-28 18:12:38 +08:00
回复了 Jack0 创建的主题 GitHub github 的 star 有什么用处?
@AoEiuV020JP star 还能刷的吗...
2023-10-28 18:07:55 +08:00
回复了 luzemin 创建的主题 程序员 命名的时候,会把缩写后的单词当做普通单词使用吗?
id 小写,其他缩写大写
2023-10-28 17:41:03 +08:00
回复了 oszlso 创建的主题 Google 为什么 Google 搜索结果会去除空格?
才发现...还真是
2023-10-27 20:34:01 +08:00
回复了 guchengzhihuan 创建的主题 奇思妙想 什么 AI 能精简八股文公告
ai 读的懂字面意思,但无法联系上下文(指社会舆论环境、时事新闻、历史)等来判断深层含义。

甚至普通人都很难理解的东西,就别强求 ai 了...
2023-10-27 20:30:26 +08:00
回复了 chenzw2 创建的主题 分享创造 写给孙子玩的视觉错觉可视化
@chenzw2 哈哈哈哈哈哈哈笑死
2023-10-26 20:10:18 +08:00
回复了 xuelang 创建的主题 OpenAI 身边非 IT 的人也知道 ChatGPT 吗? ChatGPT 渗透力到底有多少
火,很火...几乎没有人不知道,但大部分人似乎都没真正用过
2023-10-25 19:38:59 +08:00
回复了 qingxia 创建的主题 OpenAI 好奇问一下,你们都用 chatgpt 干什么?
@qingxia 如果要硬找的话,确实找不到,写代码、读论文、聊琐碎问题,哪个原来不是靠自己和搜索引擎完成的?但是 chatgpt 提供了一种捷径,提供质量几乎相同甚至更高的内容,只要你认为它带给你的便利性或给你创造出来的价值超过 chatgpt 本身,那他就是值得的
2023-10-24 22:05:56 +08:00
回复了 audiozen3001 创建的主题 音乐 V 友们 上班听的什么音乐
1 ... 6  7  8  9  10  11  12  13  14  15 ... 18  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2486 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 39ms · UTC 15:50 · PVG 23:50 · LAX 07:50 · JFK 10:50
Developed with CodeLauncher
♥ Do have faith in what you're doing.