“AI 内容检测”从技术上，功能是如何实现的？

This topic created in 123 days ago, the information mentioned may be changed or developed.

用 AI 写了一篇 3000 多字的文章，中间掺了一点人工修改（大概几百字），然后拿去给几个检测工具测，结果基本都不太行。

只要稍微调整一下风格，比如句子长短不均、加点口语表达、偶尔写得没那么通顺，检测结果就会明显偏向人类写作。

AI 说了 2 种方案

1：基于语言统计特征。比如：困惑度（ perplexity ）；句式重复率；用词分布；连接词密度

只要让模型“写得更口语一点”，再手动改几段，这些统计特征基本就被打散了。

2：embedding + 风格一致性。比如用 Sentence-BERT 把文章切段，算段落之间的相似度。

如果控制了写作风格（比如统一语气），这个特征也会失效。

AI 检测感觉就是“伪命题”。有没有人做过类似的东西，或者踩过坑的？

检测

风格

9 replies • 2026-03-30 19:15:32 +08:00

NoDataNoBB

Mar 30

让 AI 检测一下

miyuki

Mar 30

比如毕业论文现在多数学校都要求额外再查 AI 率，很搞笑了属于是，同一份论文每次结果都不一样

whoosy

Mar 30

让 ai 去检测都比手动设计算法强

RTX440

Mar 30

@miyuki 用 AI 写的东西再用 AI 查重，假几把插飞机杯了一刚

106npo

Mar 30 via Android

针对单独模型的有，有些模型有文字隐水印，其他是扯蛋。

Haku

Mar 30

文本类的话，有一种做法是用 AI 补全，例如把文章交给 AI ，然后 AI 输入前面几个字，观察后面生成的字和当前文章的字确定置信度。

例如文章内容 ABCDEFG,把 AB 喂给 AI ，AI 提示接下来是 C 的概率 20%，C 后面是 D 的概率是 50%，从而得到一个概率分布，越是靠近 AI 生成的置信度的，越会提示属于 AI 生成。

Sundayz

Mar 30

AI 内容检测，本身就是个伪命题

anmie

Mar 30

AI 基于人类语料训练，AI 生成的内容，交给 AI 测 AI 率。。。我一直觉得这个事很魔幻。

hugowangnz

Mar 30

检测不准，前两天才看见用 AI 检测几十年前的论文被判定 AI 生成