V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
xkwdm
1.72D
V2EX  ›  问与答

“AI 内容检测”从技术上,功能是如何实现的?

  •  
  •   xkwdm · 11 小时 4 分钟前 · 1007 次点击

    用 AI 写了一篇 3000 多字的文章,中间掺了一点人工修改(大概几百字),然后拿去给几个检测工具测,结果基本都不太行。

    只要稍微调整一下风格,比如句子长短不均、加点口语表达、偶尔写得没那么通顺,检测结果就会明显偏向人类写作。


    AI 说了 2 种方案

    1:基于语言统计特征。 比如:困惑度( perplexity );句式重复率;用词分布;连接词密度

    只要让模型“写得更口语一点”,再手动改几段,这些统计特征基本就被打散了。

    2:embedding + 风格一致性。 比如用 Sentence-BERT 把文章切段,算段落之间的相似度。

    如果控制了写作风格(比如统一语气),这个特征也会失效。


    AI 检测感觉就是“伪命题”。有没有人做过类似的东西,或者踩过坑的?

    9 条回复    2026-03-30 19:15:32 +08:00
    NoDataNoBB
        1
    NoDataNoBB  
       10 小时 58 分钟前
    让 AI 检测一下
    miyuki
        2
    miyuki  
       10 小时 49 分钟前
    比如毕业论文现在多数学校都要求额外再查 AI 率,很搞笑了属于是,同一份论文每次结果都不一样
    whoosy
        3
    whoosy  
       10 小时 47 分钟前
    让 ai 去检测都比手动设计算法强
    RTX440
        4
    RTX440  
       10 小时 46 分钟前   ❤️ 3
    @miyuki 用 AI 写的东西再用 AI 查重,假几把插飞机杯了一刚
    106npo
        5
    106npo  
       10 小时 46 分钟前 via Android
    针对单独模型的有,有些模型有文字隐水印,其他是扯蛋。
    Haku
        6
    Haku  
       10 小时 45 分钟前   ❤️ 1
    文本类的话,有一种做法是用 AI 补全,例如把文章交给 AI ,然后 AI 输入前面几个字,观察后面生成的字和当前文章的字确定置信度。

    例如文章内容 ABCDEFG,把 AB 喂给 AI ,AI 提示接下来是 C 的概率 20%,C 后面是 D 的概率是 50%,从而得到一个概率分布,越是靠近 AI 生成的置信度的,越会提示属于 AI 生成。
    Sundayz
        7
    Sundayz  
       9 小时 52 分钟前
    AI 内容检测,本身就是个伪命题
    anmie
        8
    anmie  
       8 小时 55 分钟前
    AI 基于人类语料训练,AI 生成的内容,交给 AI 测 AI 率。。。我一直觉得这个事很魔幻。
    hugowangnz
        9
    hugowangnz  
       59 分钟前
    检测不准,前两天才看见用 AI 检测几十年前的论文被判定 AI 生成
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   3365 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 22ms · UTC 12:14 · PVG 20:14 · LAX 05:14 · JFK 08:14
    ♥ Do have faith in what you're doing.