DeepSeek 发布了推理模型 R1-Lite-Preview

This topic created in 580 days ago, the information mentioned may be changed or developed.

看 V2 好像没人提发一下这个新闻 https://api-docs.deepseek.com/zh-cn/news/news1120

使用： https://chat.deepseek.com/

省流：

类似 o1-mini 的模型，能输出思考过程并反复推理，官方给出的 benchmark 在部分领域打败了 o1-preview
目前每天可用 50 次据称未来会完整开源基座模型 R1
实际体验目前不支持上传文件解析，感觉下来确实是聪明了一些不过 token 消耗也很恐怖：比较一下 1.11 和 1.8 数字大小那个思维过程就要写篇小作文。个人认为完整模型如果开源的话，确实会成为 LLM 的搅局者，想起来上半年李彦宏说开源模型会越来越落后有点贻笑大方了。

DeepSeek

R1-Lite-Preview

开源

6 replies • 2024-11-22 12:39:02 +08:00

cat9life

Nov 21, 2024

看起来很有意思，支持 api 了吗

zhmouV2

Nov 21, 2024

@cat9life #1 目前还不支持

cookii

Nov 21, 2024 via Android

支持 deepseek ，国产里面算好用的

PositionZero

Nov 21, 2024

过度思考太严重了，问了一道数学题思考五分钟，花了 15000 tokens ，同样问题 gpt-4o 不思考也能做对。不过确实很厉害，不知道 kimi 的 k0-math 什么水平

A1st0n

Nov 22, 2024

感觉 deepseek 在代码问答还不是如 ChatGPT 免费版

linglingfa

Nov 22, 2024

国内的诸多模型我也都一直在尝试和测试。

应该来说，Deepseek 算是代码能力相对比较优秀的一款国产大模型。

不方便注册 openai 或者 claude 的朋友，也可以考虑让 deepseek 来帮你。

当然，缺点也有，就是 deepseek 出代码的速度相对较慢。

有时候写的代码行数(字数) 一多的话，就看着 deepseek 一个字母一个字母的给你输出，那种感觉真酸爽。特别是当你习惯了 ChatGPT 和 claude 的代码输出之后。