V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
mooncakeSec
V2EX  ›  OpenAI

使用了 copilot,本地写的代码出现在了 chatgpt 上

  •  2
     
  •   mooncakeSec · 2023-02-16 09:28:57 +08:00 · 7073 次点击
    这是一个创建于 644 天前的主题,其中的信息可能已经有所发展或是发生改变。

    今天发生的一件事还是蛮让我后怕的,正式决定拥抱 AI ,刚用 copilot 写完一个小模块,函数名和注释都是我自己写的,后面需要修改,就顺便问了一下 chatgpt 。 没想到他给出的代码和我本地的连同注释和名称一模一样。 一时间让我不寒而栗,我自己在 copilot 里没勾选分享数据,没有有严格的抓包分析验证

    第 1 条附言  ·  2023-02-16 10:20:38 +08:00
    这条不是石锤贴,这里主要还是比较后怕,可能标题党了,抱歉。我自己后面简单了做了一下验证,写一段包含自己 id 的注释,然后定义了一个 id 的函数,我输入注释 chatgpt 并没有给出对应的代码。
    巧合的可能性也蛮大,不过确实蛮吓人的,因为我对 copilot 生成的代码改了挺多,后面发现连同注释都出现的同时,真的惊了。
    顺便问一句,如果大家使用 chatgpt 问比较个性化的问题,下一个人提问 chatgpt 的时候,chatgpt 会不会使用你调教过的内容呢?
    第 2 条附言  ·  2023-02-16 10:39:09 +08:00
    代码不太方便放,很多朋友提了训练数据的问题,chatgpt 是生成内容,21 年前的素材足够他生成任何内容了,有没有可能通过用户的使用数据和反馈,来调整自己的生成内容。
    比如说刚开始 chatgpt 生成的内容是错误的,用户引导他生成了正确的答案,以后 chatgpt 会不会改进,最后直接生成正确的答案。
    我自己没有抓包严格分析,单纯脑洞,欢迎大家讨论
    37 条回复    2023-02-16 19:20:37 +08:00
    ersic
        1
    ersic  
       2023-02-16 09:29:32 +08:00
    不太可能吧,chatgpt 的数据不是截止到 2021 年吗?
    hakim
        2
    hakim  
       2023-02-16 09:30:30 +08:00
    不敏感的话,贴一下代码段大家一起看看?
    MengiNo
        3
    MengiNo  
       2023-02-16 09:35:18 +08:00 via Android   ❤️ 6
    恭喜你和 ai 55 开 2333 。
    IDAEngine
        4
    IDAEngine  
       2023-02-16 09:37:46 +08:00   ❤️ 1
    不太可能,毕竟不是实时训练的。估计是你写的代码也是其他地方参考了思路的
    registerrr
        5
    registerrr  
       2023-02-16 09:38:23 +08:00   ❤️ 1
    55 开,豹笑了啊🤣🤣
    AllenTsui
        6
    AllenTsui  
       2023-02-16 09:42:59 +08:00   ❤️ 10
    有没有可能,你本身是一个 chatgpt ,装在人脑里了。
    icyalala
        7
    icyalala  
       2023-02-16 09:46:23 +08:00
    如果你想说 "copilot 把你的代码分享给了 chatgpt 然后 chatgpt 记住了" 那绝对不可能。
    chatgpt 没有连网功能,训练用的数据集只到 2021 年。你和它给的代码一样,只能说你的想法别人早就有过了。
    cmu2chert
        8
    cmu2chert  
       2023-02-16 09:47:38 +08:00
    不可能。
    dreasky
        9
    dreasky  
       2023-02-16 09:48:10 +08:00
    有没有可能你当时写的代码是 ctrl+v 的
    qsnow6
        10
    qsnow6  
       2023-02-16 09:50:02 +08:00
    先不说有没有联网功能了,刚用的代码就被当成语料库训练了?实时训练的开销可不小,目前还没有产品能做到吧
    kop1989smurf
        11
    kop1989smurf  
       2023-02-16 09:50:13 +08:00
    说明你的代码撰写思路和大多数人的一致。
    虽然你认为你的函数名字、变量名字是你自己编的,但是通过上下文,业务,功能,基本上能猜个七七八八。

    btw:copilot 一样出自 openAI ,模型基于 GPT-3 结合 github 上的开源代码进行训练所获得。
    kop1989smurf
        12
    kop1989smurf  
       2023-02-16 09:52:13 +08:00   ❤️ 1
    而且这也顺道证明了,很多开发工作,真的就是在无限的 ctrl+v ,它们在统计学上的重复率非常高。
    jenlors
        13
    jenlors  
       2023-02-16 09:58:41 +08:00
    是的,用了 copilot 之后,我感觉我想要的变量命名什么的它完全能猜出来
    alne
        14
    alne  
       2023-02-16 09:59:46 +08:00
    说明 chatgpt 开始上 V2EX 装人类发帖了 /doge
    22too
        15
    22too  
       2023-02-16 10:21:14 +08:00
    有没有可能,你是抄写的 chatgpt ,然后自己忘记了。
    以为是 chatgpt 偷窃你的成果?
    krixaar
        16
    krixaar  
       2023-02-16 10:27:10 +08:00
    你今天能想到的代码变量注释和 2021 年之前的一样,说明人类的本质就是复读机……
    mooncakeSec
        17
    mooncakeSec  
    OP
       2023-02-16 10:28:36 +08:00
    @icyalala 训练数据可能是之前的,但是模型的输出,不会随着输入反馈改变吗(回答的点赞),另外 chatgpt 一直在自我迭代吧,这里只是一个讨论,我自己没有严格的验证
    mooncakeSec
        18
    mooncakeSec  
    OP
       2023-02-16 10:30:50 +08:00
    @qsnow6 从讨论的角度看,不用实时训练数据,chatgpt 生成的内容会根据用户的反馈改变的,maybe 根据用户使用的数据就可以完成更新
    ponycoding3
        19
    ponycoding3  
       2023-02-16 10:32:39 +08:00   ❤️ 1
    看来开发真就是 cv
    Cloud9527
        20
    Cloud9527  
       2023-02-16 10:33:21 +08:00
    gpt 的数据模型没可能更新这么快把,除非 copilot 和 gpt 数据互通,但不是一家公司也不可能啊。
    xujinkai
        21
    xujinkai  
       2023-02-16 10:33:43 +08:00 via Android
    可能真的只是五五开🤣
    我自己的经验 copilot 经常比我自己还懂😂
    OnlyShimmer
        22
    OnlyShimmer  
       2023-02-16 10:50:35 +08:00   ❤️ 1
    说明什么?说明你的代码质量跟 AI 五五开.作为渣渣前端经常用 chatgpt 优化代码.
    ytmsdy
        23
    ytmsdy  
       2023-02-16 11:27:03 +08:00
    前几天面试一个工程师,在 live 的 coding 。我在 leetcode 上随便找了 2 个简单题,想看看他的编程能力。
    然后他问我能不能用 copilot ,我也没多想,说可以用。
    他在 vs 里,把题目的内容用注释写了一下,还没等注释写完,coplit 就提示了一大堆的代码。
    快速扫了一眼,基本上大差不差。
    反正相当的蛋疼。
    QuixoteCoding
        24
    QuixoteCoding  
       2023-02-16 11:33:17 +08:00
    @ytmsdy 面试 coding 用 copilot 那还面个啥...
    otakustay
        25
    otakustay  
       2023-02-16 11:51:00 +08:00
    1. 代码出现在 ChatGPT:不可能,ChatGPT 不会读新数据
    2. chatgpt 会不会使用你调教过的内容呢:不会
    3. 有没有可能通过用户的使用数据和反馈,来调整自己的生成内容:会,但要发布新的模型版本,版本不变当前的模型就是 21 年的数据
    4. 事实上你拿 davinci 模型模拟 ChatGPT ,就有 22 年的数据了,效果也很接近
    he15hiss
        26
    he15hiss  
       2023-02-16 12:16:05 +08:00 via iPhone
    有没有可能,你也是 AI ,和 chargpt 一个模型,/狗头
    shinession
        27
    shinession  
       2023-02-16 12:30:53 +08:00
    copilot 使用经验来看, AI 已经会根据上下文和习惯等, 给出变量名和注释了, 而且看起来就像是自己写的一样, chatGPT 应该进化过, 有类似的体验不奇怪
    maggch97
        28
    maggch97  
       2023-02-16 12:56:45 +08:00 via Android
    醉了,copilot 和 chatgpt 就是 gpt 的两个分支...都是 openai 做的,生成结果一样有什么好奇怪的吗?
    zhchaos
        29
    zhchaos  
       2023-02-16 13:41:26 +08:00
    @ersic 是的 问过 chatgpt ,数据到 2021 年
    Tink
        30
    Tink  
       2023-02-16 13:42:28 +08:00
    贴一下注释看看
    nojsja
        31
    nojsja  
       2023-02-16 13:47:08 +08:00
    copilot 会根据代码上下文,模仿你的编程风格
    galaxychan
        32
    galaxychan  
       2023-02-16 14:15:15 +08:00
    [免费获取] OpenAi ChatGPT 智能聊天机器人账号共享 2 月 16 日批次,免费直接体验 chatgpt ,欢迎来到查特世界。话不多说,微信搜索关注公众号:

    查特世界


    聊天窗口回复 chatgpt 可领取更多 ChatGPT 官网共享账号
    NSAgold
        33
    NSAgold  
       2023-02-16 14:27:02 +08:00
    @Livid #32 的 @galaxychan 无意义 AD
    ThirdFlame
        34
    ThirdFlame  
       2023-02-16 14:27:46 +08:00
    #32 在各个帖子里面回复相同的内容,是公众号推广。
    @Livid @Kai @Olivia @GordianZ @sparanoid @Girlphobia
    kadycui
        35
    kadycui  
       2023-02-16 18:31:06 +08:00
    有没有一种可能, 这个帖子就是 ChatGPT 发的.......
    vitoaaazzz
        36
    vitoaaazzz  
       2023-02-16 19:07:34 +08:00
    copilot 的实际体验如何
    mooncakeSec
        37
    mooncakeSec  
    OP
       2023-02-16 19:20:37 +08:00
    @vitoaaazzz 还可以,我自己不怎么写 python 基本只需要我稍微改改,有的时候提示会比较烦,我使用的还不够熟练,我应该多适应适应,提示这些,熟练了会有很大提升
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1634 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 24ms · UTC 16:53 · PVG 00:53 · LAX 08:53 · JFK 11:53
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.