V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
senooo
V2EX  ›  程序员

离谱的中转站模型响应

  •  1
     
  •   senooo · 19 小时 8 分钟前 · 2749 次点击

    用例一个中转站接入 openclaw ,之前看到 V 友发的贴子说模型掺假用的开源的 7B 模型,我这个就更离谱了,我配置的是 GPT5.4 但是结果里面全是一些违禁词 彩票 还有色情的。 https://s1.img-e.com/20260323/69c08f26a0904.png !(离谱)[https://s1.img-e.com/20260323/69c08f26a0904.png]

    第 1 条附言  ·  18 小时 27 分钟前
    请不要在此贴下发中转站的推广链接了
    22 条回复    2026-03-23 21:10:19 +08:00
    cat9life
        1
    cat9life  
       19 小时 2 分钟前
    哪个中转站,可以贴出来给大家避个坑
    xue777hua
        2
    xue777hua  
       18 小时 58 分钟前 via iPhone
    这是直接吐 embedding 了 你看过原版 embedding token 表就知道 彩票 色情 小姐 在中文公开互联网语料里都是高频词汇。
    brantyu
        3
    brantyu  
       18 小时 55 分钟前
    用中转站一定要小心甄别,套路贼多
    推荐 http://1xm.ai 新注册送 10$体验金,一分钱不花先体验一遍 claude gemini gpt 最新的顶级大模型,用好了再决定要不要续杯~
    senooo
        4
    senooo  
    OP
       18 小时 54 分钟前
    @xue777hua 是模型没问题吗/? 怎么可以禁止/忽略这个输出
    wangmn
        5
    wangmn  
       18 小时 53 分钟前
    6 ,我开的站 GPT5.4 只是反代 codex ,还没看到这些玩意
    calmbinweijin
        6
    calmbinweijin  
       18 小时 53 分钟前
    看看我的吧,现在新人买 10 送 10 ,再送八折,0.4 一刀
    calmbinweijin
        7
    calmbinweijin  
       18 小时 52 分钟前
    https://chintao.cn 支持 hvoy.ai 检测模型真实
    gouziding
        8
    gouziding  
       18 小时 51 分钟前
    这好像并不能证明模型有问题,有时候是会输出这种有问题的响应,之前也爆出来过,要测试模型的真假你还是要去提那种只有能力足够强的模型才能回答的问题试试。
    ScotGu
        9
    ScotGu  
       18 小时 47 分钟前
    V2 已经被中转站机器人攻占了么?
    Folder
        10
    Folder  
       18 小时 43 分钟前
    最近这些中转站广告真的是无孔不入, 评论区都能看到宣传的. 宣传的能不能发到宣传板块?
    hackroad
        11
    hackroad  
       18 小时 33 分钟前   ❤️ 7
    @brantyu 如果我是站长,直接给你 BAN 了
    yelog
        12
    yelog  
       18 小时 23 分钟前
    有的也不是中转站问题,我上个月使用 codex 官方 API 经常在回答中夹杂 `xx 爱彩票`,应该是中文数据集被污染了,这个月就好多了,没再见过
    star9029
        13
    star9029  
       18 小时 13 分钟前   ❤️ 1
    Speculating LLMs' Chinese Training Data Pollution from Their Tokens
    https://arxiv.org/abs/2508.17771
    PerFectTime
        14
    PerFectTime  
       18 小时 1 分钟前
    @Livid #3 依旧在 spam ,@brantyu
    ByteCat
        15
    ByteCat  
       17 小时 21 分钟前
    这个是 GPT 本身的语料问题,和中转站没关系……相反还是挺纯的 GPT 😂目前看到的概率还是挺高的
    codehz
        16
    codehz  
       17 小时 18 分钟前
    @senooo 理论上可以设置 logits bias 来减少,但其实模型输出到这种 token 的时候,内部状态基本上已经炸了,不是采样的时候调整可以解决的
    momocraft
        17
    momocraft  
       17 小时 17 分钟前
    寻思一下 中转站的利润哪来的
    codehz
        18
    codehz  
       16 小时 56 分钟前
    @ByteCat 可能是中转站给你用低一档的模型,例如拿 5.2 替换 5.4/5.3-codex
    dismantle
        19
    dismantle  
       16 小时 19 分钟前
    这个还真不是中转站的锅, 感觉是 geo 的问题, 把 gpt 的污染了
    abc0123xyz
        20
    abc0123xyz  
       12 小时 11 分钟前
    @momocraft 算灰产吧,薅资本主义羊毛,买单的是投资人
    asdf12303116
        21
    asdf12303116  
       10 小时 3 分钟前
    出现这个反而证明了这是 gpt 正品,gpt-5.3/5.3codex/5.4 被中文垃圾语料污染,出现工具调用的时候大概率出这种
    kda1578888
        22
    kda1578888  
       6 小时 53 分钟前
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   962 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 23ms · UTC 20:03 · PVG 04:03 · LAX 13:03 · JFK 16:03
    ♥ Do have faith in what you're doing.