[详情请关注 www.turingtopia.com ] 在高能物理实验中,实验数据中或多或少都会存在本底噪声,背景噪声的来源很多,对于 LHAASO 实验来说,主要来自于低能宇宙线或其次级粒子在探测器中的响应信号,如质子,电子和光子,μ子等等;也有一部分来自于探测器本身的噪声,如光电倍增管的暗噪声、放射性本底信号等等。
这些噪声会对后续的重建及粒子鉴别产生影响,会降低重建精确度和粒子鉴别的准确性,而且还加大了存储与计算的压力。
噪声过滤有两个方面,一方面是纯背景噪声信号的过滤,这可以大幅减少需要保存的原始数据量,提高信噪比;另一方面是从真正宇宙线信号中扣除背景噪声的影响,使得真正的信号更加准确,这也是粒子鉴别中需要做的事情。
本次竞赛的目的是希望大家能够对这个噪声过滤问题给出优秀的解决方案。
数据说明
每个记录的信号是一个事例 event,由多个 hit 组成。其中包含触发的探测器 id、触发时间及信号大小。信号大小可以用电荷量来描述。无论是高能宇宙线还是背景噪声,只要达到一定的触发条件,探测器就会把一个时间窗口(~2000 ns )内的所有 hit 记录下来,因此原始数据很大部分由噪声组成。
具体到本次比赛给到的数据集:
相对于背景噪声, 真实信号类似于异常点,所以针对单纯噪声信号过滤的情况,可以考虑使用异常检测的相关算法,比如 KNN - K 最近邻,Isolation Forest 孤立森林,支持向量机等等方法。
初赛: 参赛者通过构建去噪模型,在测试数据集对粒子的 hit 进行判别,识别噪声或信号,将对测试集的判断结果以 csv 的格式提交。
分数说明:本次比赛的初衷是找到优于传统方法的模型,因此线上测试集最终得分是与传统方法的差异分数,负数为劣于传统方法。
决赛: 入伍队伍带参赛模型,答辩 PPT 现场答辩
时间及赛程安排
报名及组队时间:2020 年 2 月 11 日 ~ 2020 年 3 月 31 日 初赛提交时间:2020 年 2 月 11 日 ~ 2020 年 4 月 7 日 初赛发榜时间:2020 年 4 月 8 日 决赛提交时间:2020 年 4 月 9 日 ~ 2020 年 4 月 17 日 决赛发榜时间:2020 年 4 月 20 日