最近有个行为叫做 License Laundering (洗许可证)引起了不少人的警觉。顾名思义,类似于 Money Laundering (洗黑钱),就是把利用 AI 重写代码,使得新代码的重合度与原版相差甚远,“洗”到与原作品无关,然后更换许可证。
前段时间,Python 社区的 chardet 引发了争议。现任维护者 Dan Blanchard 利用 AI 把 chardet 的代码重写了一遍,重写后的版本使用 MIT 许可证。原作者 Mark Pilgrim 已经现身反对更改许可证,因为 chardet 原先的许可证是 LGPL 。
具体分析:License Laundering and the Death of Clean Room
与此同时,还有公司更进一步,利用 License Laundering 搞恶意竞争,克隆客户的软件然后低价转卖。
很快就有人同样把“License Laundering”打包成一站式服务,嘲讽这种公司的恶意竞争行为。
“洗代码即服务!”火了!“开源代码洗白”奇葩网站上线,反讽白嫖企业:开源合规太昂贵了! CC 逆向复刻客户软件,十分之一的价格转卖!
说到底,这类 Laundering 做法算不算侵权?毕竟 AI 的训练过程中的语料就有开源代码,没人能保证 AI 从未“看”过 GPL 系列代码吧。
1
Admstor 5 小时 6 分钟前
AI 训练使用了大量人类智慧精华,这里没有哪家说我训练数据具有完全的排他版权,并且目前的 AI 生成就是黑箱,没有哪家公司说我可以指定不使用某些数据生成
所以我觉得 AI 生成的内容不具备完全的版权 |
2
jacketma 4 小时 58 分钟前
如果严格执行版权法律,AI 大模型根本训不出来,印象里 Anthropic 吃官司陪了不少钱和解的,视频模型 Seedance 这类就是明摆着把版权视频全拿来当料,源头都是“带罪”的,后面的再生产肯定是“脏”的。
只是这个“脏”的判定程度,现在的法律没跟上。 |
3
SheepChef 3 小时 26 分钟前
你说的是一个争论已久的问题,退一步来说,你把别人的科研论文拿来一段不作引用,用 AI 洗洗直接用,如果没有同行评审,也并没什么人能看得出来。
说到底是侵害版权这一行为的界定问题,难道侵害版权的界定一定要奉“文本重合度/相似度”为圭臬?这是要个案分析的,具体到法庭怎么判,是另一回事。 |