公司有个项目,最近要考试做一个无纸化考试的作弊实时发现和考后数据分析的项目
目前能提供的数据只有考生在考试期间发生的所有文本型的数据,没有影像数据
之前有大概 2000 个考生的样本,这些样本都是通过监考的老师现场评测出来的可以分为三类:肯定没作弊、有作弊嫌疑、肯定作弊
现在的想法是:通过机器学习或者叫数据挖局这 2000 个考生的数据,找出三类的共同性,应用在以后考试实时监考中
有过这方面经验的朋友,请多给出出想法,感觉大家
1
3dwelcome 2022-02-22 12:46:07 +08:00
个人表示怀疑,这能用 AI 去提取共性吗?
作弊分类是根据监考老师现场观察,和学生的答题卡之间,又没有必然联系。 你需要分析的数据,不是答题卡文本,而是套用监考老师的现场作弊评分表。 |
2
renmu123 2022-02-22 12:57:13 +08:00 via Android
看看隔壁座位的人答案是否高度一致?
|
3
kop1989smurf 2022-02-22 13:08:10 +08:00
非机器学习专业,感觉很难。
1 、每次考试的题目与答案并不同。 2 、老师评测的结果未必正确。 3 、作弊和答案相似(不管是和同学还是和标准答案),其实只有理论上的相关性,没有因果性。作弊能够导致答案相似,但答案相似并不意味着作弊。 所以通过机器学习的方式,拿到的特征模型,个人理解可信度不高。 |
4
xingshu1990 2022-02-22 14:31:54 +08:00
如何判断:肯定没作弊、有作弊嫌疑、肯定作弊。这三个要有较为明显的特征值。
2 楼说的答案一致,还不如看推导过程是否有明显的特性。 考试作弊,监考老师通常通过观察学生头、身体的动作, 如果作弊学生为了拿答案 故意把铅笔丢地上,人靠下去拿铅笔顺手拿答案,这个倒是有可能性。 或者是鬼头鬼脑的四处张望偷看别人的答案,这个也是一个作弊特征。 这些靠的是摄像头进行身体动作追踪。 |
5
CCCTS OP @3dwelcome
@renmu123 @kop1989smurf @xingshu1990 首先感谢大家的回复和讨论,这里说一下这个不是答题卡形式的,是纯无纸化的电子考试触摸屏选择答案的 这里想发现的共同性,我举两个例子: 1 、考生开始考试后一直不答题,等待几分钟后突然开始答题,答题速度还非常快,这里就怀疑是否有耳机传送答案或者别的传送答案的方式 2 、考试盯着某一道应该 10 几秒就答完的题,但是用了几分钟才答完,但是本应该一分多钟才能答完的题结果用了几秒钟就答完了 等等这些能通过后台得到的数据做出一个可以分析的模型 |