• 请不要在回答技术问题时复制粘贴 AI 生成的内容
wudikua
V2EX  ›  程序员

请教个数学问题

  •  
  •   wudikua · Jun 27, 2014 · 3143 views
    This topic created in 4361 days ago, the information mentioned may be changed or developed.
    我有两组样本

    1 1 1 10
    E=3.25
    方差=7.79

    10 10 10 100
    E=32.5
    方差77.9

    假如我想按照一个固定的方差数,来过滤出不均匀的数据,这个固定数的选择好像受不同样本基数的影响,怎么能消去这种误差呢。
    4 replies    2014-06-30 13:54:17 +08:00
    blacktulip
        1
    blacktulip  
       Jun 27, 2014
    方差 / E ?
    kokdemo
        2
    kokdemo  
       Jun 27, 2014
    ……没懂你这是要消除啥误差
    akfish
        3
    akfish  
       Jun 27, 2014   ❤️ 1
    没理解错的话,lz是想要过滤掉数据里的outlier。
    通过固定方差阈值的方法并不可靠,因为方差是一组数据本身固有的统计学性质,对一组数据有效的阈值,可能会过滤掉另一组数据中的有效值。
    鉴别、消除outlier的方法很多,可以自己搜索类似outlier elimination的关键字。
    几个参考:
    http://en.wikipedia.org/wiki/Outlier
    http://en.wikipedia.org/wiki/Peirce's_criterion
    https://www.eol.ucar.edu/system/files/piercescriterion.pdf
    http://www.seas.upenn.edu/~ese302/extra_mtls/REGRESSION_OUTLIERS.pdf
    wudikua
        4
    wudikua  
    OP
       Jun 30, 2014
    @akfish 并不是outlier,我说个通俗的例子吧,两个运动员,一个是射击运动员,一个是短跑运动员,给他们10次机会,并记录他们的成绩,然后计算方差来看他们的发挥的是否稳定,稳定的就可以去参加奥运会,但是由于他们的成绩的单位不同,我就没法说方差小于X的才能去参加奥运会。
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   3022 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 47ms · UTC 08:42 · PVG 16:42 · LAX 01:42 · JFK 04:42
    ♥ Do have faith in what you're doing.