V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
cnbatch
V2EX  ›  程序员

利用 AI 像洗黑钱那样洗代码版权会不会产业化?(可能属于灰产、黑产)

  •  
  •   cnbatch · 5 小时 19 分钟前 · 368 次点击

    最近有个行为叫做 License Laundering (洗许可证)引起了不少人的警觉。顾名思义,类似于 Money Laundering (洗黑钱),就是把利用 AI 重写代码,使得新代码的重合度与原版相差甚远,“洗”到与原作品无关,然后更换许可证。

    前段时间,Python 社区的 chardet 引发了争议。现任维护者 Dan Blanchard 利用 AI 把 chardet 的代码重写了一遍,重写后的版本使用 MIT 许可证。原作者 Mark Pilgrim 已经现身反对更改许可证,因为 chardet 原先的许可证是 LGPL 。

    具体分析:License Laundering and the Death of Clean Room

    与此同时,还有公司更进一步,利用 License Laundering 搞恶意竞争,克隆客户的软件然后低价转卖。
    很快就有人同样把“License Laundering”打包成一站式服务,嘲讽这种公司的恶意竞争行为。 “洗代码即服务!”火了!“开源代码洗白”奇葩网站上线,反讽白嫖企业:开源合规太昂贵了! CC 逆向复刻客户软件,十分之一的价格转卖!

    说到底,这类 Laundering 做法算不算侵权?毕竟 AI 的训练过程中的语料就有开源代码,没人能保证 AI 从未“看”过 GPL 系列代码吧。

    3 条回复    2026-03-16 00:26:19 +08:00
    Admstor
        1
    Admstor  
       5 小时 6 分钟前
    AI 训练使用了大量人类智慧精华,这里没有哪家说我训练数据具有完全的排他版权,并且目前的 AI 生成就是黑箱,没有哪家公司说我可以指定不使用某些数据生成

    所以我觉得 AI 生成的内容不具备完全的版权
    jacketma
        2
    jacketma  
       4 小时 58 分钟前
    如果严格执行版权法律,AI 大模型根本训不出来,印象里 Anthropic 吃官司陪了不少钱和解的,视频模型 Seedance 这类就是明摆着把版权视频全拿来当料,源头都是“带罪”的,后面的再生产肯定是“脏”的。
    只是这个“脏”的判定程度,现在的法律没跟上。
    SheepChef
        3
    SheepChef  
       3 小时 26 分钟前
    你说的是一个争论已久的问题,退一步来说,你把别人的科研论文拿来一段不作引用,用 AI 洗洗直接用,如果没有同行评审,也并没什么人能看得出来。

    说到底是侵害版权这一行为的界定问题,难道侵害版权的界定一定要奉“文本重合度/相似度”为圭臬?这是要个案分析的,具体到法庭怎么判,是另一回事。
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   889 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 20ms · UTC 19:52 · PVG 03:52 · LAX 12:52 · JFK 15:52
    ♥ Do have faith in what you're doing.