用 AI 写了一篇 3000 多字的文章,中间掺了一点人工修改(大概几百字),然后拿去给几个检测工具测,结果基本都不太行。
只要稍微调整一下风格,比如句子长短不均、加点口语表达、偶尔写得没那么通顺,检测结果就会明显偏向人类写作。
AI 说了 2 种方案
1:基于语言统计特征。 比如:困惑度( perplexity );句式重复率;用词分布;连接词密度
只要让模型“写得更口语一点”,再手动改几段,这些统计特征基本就被打散了。
2:embedding + 风格一致性。 比如用 Sentence-BERT 把文章切段,算段落之间的相似度。
如果控制了写作风格(比如统一语气),这个特征也会失效。
AI 检测感觉就是“伪命题”。有没有人做过类似的东西,或者踩过坑的?
1
NoDataNoBB 10 小时 58 分钟前
让 AI 检测一下
|
2
miyuki 10 小时 49 分钟前
比如毕业论文现在多数学校都要求额外再查 AI 率,很搞笑了属于是,同一份论文每次结果都不一样
|
3
whoosy 10 小时 47 分钟前
让 ai 去检测都比手动设计算法强
|
5
106npo 10 小时 46 分钟前 via Android
针对单独模型的有,有些模型有文字隐水印,其他是扯蛋。
|
6
Haku 10 小时 45 分钟前 文本类的话,有一种做法是用 AI 补全,例如把文章交给 AI ,然后 AI 输入前面几个字,观察后面生成的字和当前文章的字确定置信度。
例如文章内容 ABCDEFG,把 AB 喂给 AI ,AI 提示接下来是 C 的概率 20%,C 后面是 D 的概率是 50%,从而得到一个概率分布,越是靠近 AI 生成的置信度的,越会提示属于 AI 生成。 |
7
Sundayz 9 小时 52 分钟前
AI 内容检测,本身就是个伪命题
|
8
anmie 8 小时 55 分钟前
AI 基于人类语料训练,AI 生成的内容,交给 AI 测 AI 率。。。我一直觉得这个事很魔幻。
|
9
hugowangnz 59 分钟前
检测不准,前两天才看见用 AI 检测几十年前的论文被判定 AI 生成
|