V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
zxCoder
V2EX  ›  问与答

请教炼丹师们一个二分类的问题

  •  
  •   zxCoder · May 10, 2020 · 1381 views
    This topic created in 2188 days ago, the information mentioned may be changed or developed.
    用 pytorch 实现的一个 FM 模型做一个二分类,然后 logloss 很大,然后发现训练样本大多数是准确的,但是有几个比如实际值是 0,预测值是 9.9999999,实际值是 1,预测值是 0.00000...,这是因为数据太少(数据集只有 600 行左右)的原因吗,还是因为模型撘错了。
    Supplement 1  ·  May 10, 2020
    而且感觉训练结果特别不稳定的样子,每跑一遍的结果都不太一样,loss 从 0.6 到 1.2.。。
    Supplement 2  ·  May 10, 2020
    换成了 focal loss 损失函数,效果就变好了
    4 replies    2020-05-11 11:16:58 +08:00
    Liyiw
        1
    Liyiw  
       May 10, 2020
    1 、先统计正负样本的数量
    2 、准不准确要在 val set 或者 test set 上面测,在训练样本上测没用的
    zxCoder
        2
    zxCoder  
    OP
       May 10, 2020
    @Liyiw 测试集效果也很差,用的交叉熵损失函数是 0.8 左右。。。有几个样本偏差得很奇怪,完全反的
    neosfung
        3
    neosfung  
       May 11, 2020 via iPhone
    不对吧,你一个二分类模型,预测值只有 0 和 1 两个标签的概率。预测值怎么跑到 9.9999999
    zxCoder
        4
    zxCoder  
    OP
       May 11, 2020
    @neosfung 写错了,应该是 0.999999999
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   5626 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 37ms · UTC 09:00 · PVG 17:00 · LAX 02:00 · JFK 05:00
    ♥ Do have faith in what you're doing.