iv8d

iv8d

V2EX 第 253364 号会员,加入于 2017-09-09 13:51:48 +08:00
今日活跃度排名 3960
根据 iv8d 的设置,主题列表被隐藏
二手交易 相关的信息,包括已关闭的交易,不会被隐藏
iv8d 最近回复了
1 天前
回复了 zhwguest 创建的主题 程序员 deepseek 的源代码开源在哪里啊?
人家说的开源模型,你要求的有点多啊
训练数据可能包含了 openai 相关内容,很正常吧。

DeepSeekV3 训练成本不及 Meta 高管薪资,DeepSeek 使行业质疑千亿美元支出效用

1 月 24 号,一条发布在匿名平台 teamblind 上的帖子疯传。一名 Meta 员工称,现在 Meta 内部因为 DeepSeek 的模型,已经进入恐慌模式。
这位 Meta 员工写道:“一切源于 DeepSeek-V3 的出现,它在基准测试中已经让 Llama 4 相形见绌。更让人难堪的是,一家‘仅用 550 万美元训练预算的中国公司’就做到了这一点。工程师们正在争分夺秒地分析 DeepSeek ,试图复制其中的一切可能技术。这绝非夸张。管理层正为 GenAI 研发部门的巨额投入而发愁。当部门里数 10 位高管其中之一的薪资就超过训练整个 DeepSeek V3 的成本。
你准备 996 了没,工资最低期望多少
4 天前
回复了 jwh199588 创建的主题 程序员 mybatis 结果集太多导致转换对象太慢
用 list<map> ,自行读取
6 天前
回复了 iv8d 创建的主题 Local LLM LLM local 模型入门和使用
@YsHaNg 这个刚了解到,需要先安装环境,先试试,谢谢
就是左脚踩右脚,裁几个看看有没有影响,没有原因
6 天前
回复了 iv8d 创建的主题 Local LLM LLM local 模型入门和使用
@hertzry 好 终于找到教程了
6 天前
回复了 iv8d 创建的主题 Local LLM LLM local 模型入门和使用
@Donaldo OpenAI 格式的 API 是什么,我就用过 transformers 这个框架,还有示例用 pipeline 这种方法。
6 天前
回复了 iv8d 创建的主题 Local LLM LLM local 模型入门和使用
@YsHaNg 目前只了解到 huggingface 的,仅限于使用了 gpt2. ollama 相比 huggingface 有优势?更好学?
7 天前
回复了 Niner 创建的主题 Java update 大家会允许这样写吗?
根据你业务量决定,在一个就是关于金融积分等要避免,其他无所谓吧
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1682 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 9ms · UTC 06:52 · PVG 14:52 · LAX 22:52 · JFK 01:52
Developed with CodeLauncher
♥ Do have faith in what you're doing.