作者:张海龙 本文转载自微信公众号:捡起来
Cursor 最近在社交媒体上大红大紫,产品体验确实做的好,我也从 VSCode 切换到了 Cursor 。Cursor 刚成立的时候非常难用,但两年之后终于跑出来了。在我印象中,Cursor 是少有的不信邪,硬刚大厂成功的案例。
Cursor 在 23 年 9 月获得了来自 OpenAI 的天使投资,又在 24 年 8 月宣布了 6000 万美金的 A 轮融资
Cursor 背后的公司叫做 Anysphere ,成立于 2022 年,Cursor 是他们的第一款产品,2023 年发布。在 Cursor 发布的时候,Coding Copilot 领域实际上已经发展了相当一段时间,并且有好几个大玩家在做。
Github Copilot 于 2022 年 3 月底在 VSCode 上正式推出,在 24 年 1 月份已达一百三十万付费用户,是目前 用户规模最大的 Coding Copilot 产品,并且仍然保持高速增长。
Codeium 在 2022 年转型做 Coding Coilot 产品。今年八月底披露了 一亿五千万美金的 C 轮融资,目前有 70 万免费用户,并在企业级市场达成八位数的 ARR 。
主营代码搜索的 Sourcegraph 在 2023 年底推出的新产品线,目前没有披露用户数据,Sourcegraph 曾在 21 年披露一亿两千五百万美金的 D 轮融资
2019 年上线的 Tabnine 目前已经获得 2500 万美元的 B 轮融资,根据披露的数据,2022 年其用户量达到 100 万,并获得 580 万美元的收入。
这个赛道除了 Github Copilot 商业化的特别成功,其他虽然融了很多钱,但都发展的比较缓慢。这个时候,有几个年轻人跳出来说要做一个 AI Native IDE ,基于 VSCode 魔改,用 OpenAI 的模型,挑战微软( Github )。初生牛犊不怕虎,基于大厂的技术,挑战大厂已经大规模商业化的产品。这个故事要是发生在中国,投资人第一个问的问题就是“你这事儿要是能成,为啥 Github/微软自己不做呢?”,“Github Copilot 已经那么多用户,并且商业化的很成功,你有什么优势呢?”。但,即使是这种听起来非常不靠谱的故事,依然筹集到了 800 万美元。
从技术的角度讲 Cursor 的成功就是一句话:在几乎一样的技术基础上,找到了更好的产品化的方式。这是一个非常典型的 Product-Market-Fit + Product-Model-Fit 的案例。这个更好的产品化体现在哪里呢?最核心的只有一条:AI 对于单一文件的多处修改/多个文件的同时修改。这里的详情可以参见 Cursor 官方博客 。
在 GPT-4 甚至 GPT-4-Turbo 时代,Cursor 想要的产品体验是做不出来的,因为底层模型太慢了。但是 2024 年上半年出现了 Sonnet 3.5 以及 Llama 3 。虽然这两个模型在智力上并没有超越 GPT-4 ,但是性能更好了,并且 Llama 3 的出现第一次让应用侧有了一个智力正常的可以微调的模型。这两个点放在整个行业可能没啥,但是恰恰是解锁 Cursor 设想的产品体验的核心要素。这是 Product-Model-Fit 。
OpenAI HumanEval 测评集得分随时间变化
Cursor 的产品体验脱胎于 Github Copilot ,可以说 Product-Market-Fit 是 Github 帮 Cursor 做的,就是这个产品形态,以月费的形式向个人开发者收费能行得通。所以 Cursor 其实从 Day 1 就形成了商业闭环,这一点在国内也是不成立的。硅谷的开发者非常愿意为了效率自掏腰包,哪怕只有少量改进。
你难以想象 Cursor 是在 Github 的眼皮子底下抢用户,然后 Github 似乎没有任何反应,到目前为止。Cursor 现在的产品体验并不是只有 Sonnet 3.5 能做到,GPT-4o 也是可以的,但是为啥 Github 没做呢?有人说是因为 VSCode 和 Github 是两个部门,有部门墙?但凡 Github 内部稍微有点话语权的人想干 Cursor 的事,都可能把 Cursor 扼杀在摇篮里。但,这种事情在硅谷往往不会发生。某种意义上,这也是 Product-Market-Fit 。
以上三点,我认为是 Cursor 成功的必要条件,但这些条件对于很多创业公司都是一样的,为啥其他人没成呢?最关键的还是 Cursor 做了一个正确的产品假设,然后一直在打磨以及等待技术的成熟使得这个假设成立。正确的问题往往比解法更重要。不知道这里远见占了几分,运气占了几分?
既然用户因为一定程度的产品体验改进,很容易从 Github Copilot 迁移到 Cursor ,那是不是意味着也很容易迁移走?这就涉及到 Copilot 这类产品的模式问题。实际上真正的护城河是 VSCode ,不是 Github Copilot 也不是现在的 Cursor 。VSCode 已经从一个简单的编辑器变成了一个平台。用户之所以能从 Github Copilot 很容易的迁移到 Cursor ,是因为他们都寄生于 VSCode ,用户的使用习惯,体验,功能/插件都完全一样。如果 Cursor 不能迁移 VSCode 现有的体验,那它一定不能以现有的这些改进来让用户放弃 VSCode 。要复制 VSCode 生态带来的各种插件和可扩展的能力非常非常困难。如果你关注这个领域,你大概知道最近还有另外一个 IDE 开始被人关注到 Zed ( zed.dev )。从工程角度来讲 Zed 的工程复杂度至少是 Cursor 的 10 倍,因为 Zed 从零开始自己写了这个 IDE ,完全不依赖 VSCode ,并且也集成了 AI Copilot 能力。但是从目前用户的使用来看,Cursor 至少是 Zed 的 10 倍。确实,选择比努力重要。
所以无论是 Github Copilot 还是 Cursor 都是 VSCode 生态里的工具,对于开发者来说就是一把更好的锤子,本身不具备网络效应等护城河。另外 Cursor 这事儿也证明了 Copilot 产品所谓的数据飞轮是不存在的,Github 先发这么多也没有在产品体验上拉开差距。你能拿到的数据,大模型都能拿到,已经是模型的一部分了。
今年六月份的时候我在硅谷听过一次 Cursor 创始人的演讲,他们的核心思路就是造牛逼的工具让 Human Developer 变成 Human Super Developer 。这个理念实际上是比较另类的,我记得当时那个分论坛叫做 Developer Agent ,只有他们一家在讲 Copilot ,其他人全部在讲 Agent 。
Copilot 是不是 Agent 的路径?目前并没有共识,我认为不是。虽然 Cursor 目前没有做 Agent ,但是我觉得他们会改变这个想法。前一阵子 OpenAI 发布了 SWE-bench_Verified 测试集,是目前这个领域最权威的 benchmark 。赛道刚刚开始,但已经竞争激烈,你会看到很多跟 Copilot 领域完全不一样的玩家: SWE-bench_Verified 是用于测试 AI 解决真实世界中软件问题的测评集
目前 Agent 产品形态的技术基础是不成熟的,即使我们( gru.ai )已经是目前的最高分,但也只有 45 分左右,远远达不到实际商用的标准。根据之前 OpenAI HumanEval benchmark https://paperswithcode.com/sota/code-generation-on-humaneval 的经验,我们估计等这个榜的分数普遍在 70 分以上的时候,这个领域才具有商业化的技术基础。可以说目前 Agent 领域两个 PMF 一个都没达成,没有被验证过的产品形态,没有成熟的技术。
但这个领域依然吸引了非常多的注意,我们看到有越来越多的创业公司在加入这个领域的竞争,光 YC 就毕业了至少 3 个相关团队。一方面大家在努力竞争技术储备,另外一方面在努力寻找商业化的落脚点,从解决软件工程中的小问题开始,例如写文档,写测试等等。当然,这个领域也被很多人质疑,这是普遍存在的非共识。
悲观者正确,乐观者前行。我们正在招募一批企业用户试用我们的测试 Agent,感兴趣的朋友欢迎联系我们 [email protected],
1
mauve 66 天前 1
我的观点是 Cursor 好用是因为 Claude Sonnet 3.5 ,什么时候 VSCode 改一下代码,支持 AI aware 的 API ,Cursor 也就寄了
|
2
Bazingawang OP @mauve claude 3.5 sonnet 确实在他的成功里是不可或缺的
|