codingmiao's recent timeline updates
codingmiao

codingmiao

V2EX member #582929, joined on 2022-05-27 09:19:04 +08:00
codingmiao's recent replies
@huanxianghao 计算机相关的东西还是挺容易规避 AI 扯淡的,我前段时间补 transformer 的知识,直接先把 github 上 transformer 代码拉下来,让 claude code 给我出个学习教程,每一章节找对应的代码把我当傻子给我讲,边跑 demo 边问,它不厌其烦地回答我,有代码卡着也不会跑偏,感觉很好。
知识库本身只是提供个工具,开源的随便弄弄,大头做好业务梳理,做好合理的分门别类,不然还是一坨放在那没什么大用
这玩意真能作为加解密方法吗?即使明天你把答案发出来,也没有一个快速验证的方法验证你发的答案对不对。反之如果你有快速验证的方法并公布出来,那这个加解密方法也会像 MD5 彩虹表那样迅速被破解掉
这玩意越高水越深,所以我们简单的需求 langchain4j(因为我们有好多 java 的基建),复杂的直接套壳 claude code 😄
这个中转似乎非流式请求有点问题,下面这个请求,"stream"为 false 时就没有输出"content",为 true 时是正常的

curl "https://www.hi-code.cc/v1/chat/completions" \
-H "Content-Type: application/json" \
-H "Authorization: Bearer sk-xxx" \
-d '{
"model":"gpt-5.4",
"stream": false,
"messages":[
{"role":"user","content":"你好"}
]
}'


{"id":"resp_0f935c87f6d1df2d0169e7013c67c08196abb8a696e0191e21","object":"chat.completion","created":1776746813,"model":"gpt-5.3","choices":[{"index":0,"message":{"role":"assistant"},"finish_reason":"stop"}],"usage":{"prompt_tokens":18,"completion_tokens":41,"total_tokens":59}}
生成出来乍一看效果挺唬人,仔细看很多经不起推敲,我现在是让 claude code 自己去 arxiv 和 github 上搜了总结了,比直接 deep research 可控一点
@spribree 已补充微调脚本至[sft/run_sft.sh]( https://github.com/codingmiao/qwen35-short-cot/blob/main/sft/run_sft.sh)

用了 ms-swift 这个框架来做 lora 微调的,没写代码😄,配下参数一行命令就跑起来了😄。
Mar 24
Replied to a topic by cat9life Local LLM qwen3.5 过度思考的问题
这个似乎是 qwen3.5 系列太喜欢过度思考了,我这几天搞了点 deepseek-r1 的数据去微调它,让它学习 ds 的思考套路,效果好了不少 https://github.com/codingmiao/qwen35-short-cot
Mar 18
Replied to a topic by Ayanokouji Java JDK 26 发布,非 lts 版本
向量 API 还是没孵化出来,用这玩意写了个 RAG 的玩具,速度确实可以
~/.claude.json 这个下面写了 zp mcp 了吧
About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   5637 Online   Highest 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 19ms · UTC 07:07 · PVG 15:07 · LAX 00:07 · JFK 03:07
♥ Do have faith in what you're doing.