V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
这是一个专门讨论 idea 的地方。

每个人的时间,资源是有限的,有的时候你或许能够想到很多 idea,但是由于现实的限制,却并不是所有的 idea 都能够成为现实。

那这个时候,不妨可以把那些 idea 分享出来,启发别人。
mlhadoop
V2EX  ›  奇思妙想

有没有一种更好的方法能够发现套牌车辆?

  •  1
     
  •   mlhadoop · 2014-11-03 20:29:34 +08:00 · 5030 次点击
    这是一个创建于 3672 天前的主题,其中的信息可能已经有所发展或是发生改变。
    目前拿到的数据是某个地区一天内经过某个检测点的车辆信息(检测点名称、车牌号码、瞬时车速、监测点经纬度、通过时间),想要实现对套牌车辆的分析。。
    暂时的想法是通过时间-距离上的差异来得出异常的车牌号。(比如A到B距离100km 平均时速50 那么2个小时可以到达 但是从数据中却发现 半个小时之内检测到车X分别在A 和B出现过 那么我们认为他有可疑。。)这只是初步的想法,其中有很多的问题,比如这个平均速度会根据不同地方而不同不知道如何设定。。

    请各位v友 不要吝啬你们的想法 让我们风暴一下吧。。。
    31 条回复    2014-11-05 18:43:11 +08:00
    Keinez
        1
    Keinez  
       2014-11-03 20:39:00 +08:00   ❤️ 1
    没理解你“车X分别在A和B出现过”的思路。

    不是程序员,说个想法:
    根据监测点绘制车牌的运动路径,假设套牌车辆A在路上换成车牌B,那么可以得出车牌A或B的运动路径较正常车辆要短。
    semicircle21
        2
    semicircle21  
       2014-11-03 20:46:52 +08:00   ❤️ 1
    其实我觉得基础算法你已经想得很清楚了, 你想要的大概是一些工程性的思路:

    如果糙一点, 可以把车速参数设置的非常高, 比如 200km/h, 这样会漏过一些套牌车, 但不会误杀.
    如果细致一点, 你可以将 N 个监测点之间的消耗时间都算出来, 不知百度高德谷歌地图的 API 能不能帮到你, 就是搜索线路时, 经常会给出"全程耗时1小时40分钟"这样的数据.

    然后是要实时发现还是事后分析?
    mlhadoop
        3
    mlhadoop  
    OP
       2014-11-03 20:47:24 +08:00
    @Keinez 不好意思 说的不够明白 意思就是在很短的时间内我们发现同一个车牌号出现在了距离很远的两个地方(重常理上来说基本是不可能的,那么无非就认为有两个同样的车牌号码同时在行驶而且被派到了咯。。那么这两个就至少一个是假的吧,当然也不排除两个都是假的啦。。。总之我们就得出这个号码比较异常了。。不知道我将明白了没。。嘿嘿)
    mlhadoop
        4
    mlhadoop  
    OP
       2014-11-03 20:52:36 +08:00
    @semicircle21 谢谢 这个暂时还没有要求实现实时分析 可以经过离线分析 得到这些认为有异常的车牌数据就可以了 查过百度的lbs 有提供一个相对自己计算 精确一点的值 的接口 ,具体还没有计算最终的效果 现在只是想有哪些解决方案 然后针对大量的这些数据如何构建这么一个模型。。再次感谢
    Keinez
        5
    Keinez  
       2014-11-03 21:05:29 +08:00
    @mlhadoop 对,但是同一个城市里,套牌出现相同号码的几率很低吧。就算在全国也会有所套牌号并不重复的情况。检测号码重复在我看来并不是一个好方案……
    mlhadoop
        6
    mlhadoop  
    OP
       2014-11-03 21:33:20 +08:00
    @Keinez 这个情况也不算少 目前没有一种较好的检测方式 大部分是群众举报录入数据库的
    mikelaile
        7
    mikelaile  
       2014-11-03 21:42:25 +08:00   ❤️ 1
    难道你只有一个监控么?如果同时两地出现了同样牌照的,当然是套牌了。
    uuair
        8
    uuair  
       2014-11-03 21:49:48 +08:00   ❤️ 1
    看时间啊,同时出现就是套牌。。。我就是这么被抓的,还有,对照行驶本的颜色
    Pactzhao
        9
    Pactzhao  
       2014-11-03 22:23:09 +08:00 via iPhone
    @uuair 你就是这么被抓的...
    yangyanggnu
        10
    yangyanggnu  
       2014-11-04 01:08:03 +08:00   ❤️ 1
    我觉得从时间而不是从距离考虑更直接些。具体而言,0)以车牌为主线,车管所有所有车辆车牌和车型(包括颜色)的对应关系,所以,一旦发现不一致则视为套牌,这可以抓出大部分套牌情况;1)同个车牌同一时刻(或者较短时段)不可能出现在不同地点,所以对于那些同个时刻不同地方出现的同个车牌视为套牌。这两种情况加起来基本都能抓出来,除了一种情况:我和小王买一样的车型,我再办一个和小王一样的车牌(套牌),然后我还知道小王长期不用他的车,这时,上面说的两种情况是抓不到我的,但都已经套牌了,在心理上,“反正扣的不是老子的分,怕毛”,所以,2)针对违章次数较多的(定个阀值),人工介入核实是否套牌。

    即便这样还是有很多不可控因素,比如,车辆信息是否全国联网、天网覆盖区域是否完善、回收车牌是否重新入市等等。

    不好玩。
    pimin
        11
    pimin  
       2014-11-04 04:38:08 +08:00 via iPhone   ❤️ 1
    我觉得这不是一项即时任务,应该是属于长期优化型,宁可放过1000,也不错杀一个。时空跳跃是最准确的判断依据,但是不是筛选依据。
    不应该做每辆路过车辆都对所有数据进行时空跨度计算,1.是效率太低,2.是套牌车只是正常车辆里非常非常少的一部分异常。

    说白了更像是大数据挖掘,从海量的信息里提取概率非常小的套牌车辆。我给的建议是,更多的考虑统计学。

    首先做的应该是筛选工作。对整体数据进行统计,对多种数据进行分别统计,找出异常部分,维护多个警报列表,对列表上车辆进行每次时间统计,达到x次异常则输出至套牌车辆列表。

    异常方面来说,要考虑的因素非常多,比如统计每天/月通过监测站数量的前3%,开始的时候肯定是都是出租车啊什么的。警报列表基本无效。我要说的是对这个列表进行长期维护,做好白名单移除工作,判断方式可以是对时间跳跃的验证,也可以是其它任何方式。
    随着时间增长,可能白名单会越来越长,定期对白名单进行监测和更新迭代。使其维持在一个动态平衡的长度。
    loading
        12
    loading  
       2014-11-04 09:08:52 +08:00   ❤️ 1
    如果将高速路出口收费信息发送到车主(根据车牌),就可以将这个识别运算量分配到每一名真正的车主。

    PS:请点感谢
    vincentqi
        13
    vincentqi  
       2014-11-04 09:28:59 +08:00
    方法1. 拍照的时候做图形识别,判断车辆外观特征,数字化后与车牌号一起存入数据库。号码相同外观不同的,基本就是套牌的。
    方法2. 监控拍照的时候做人脸识别,与行驶证上的人脸进行比对,驾驶人与行驶证人脸不同的,列入可疑对象。
    lijinma
        14
    lijinma  
       2014-11-04 10:05:28 +08:00
    @loading 这难道不是最好的方法吗????
    won
        15
    won  
       2014-11-04 10:34:46 +08:00   ❤️ 1
    是否一定要指望摄像头图像比对?
    我们知道摄像头启动前,会有一波雷达感应。我假设在真的车牌上内置芯片,雷达对于假车牌就可以直接侦测出来。假如是在真车牌上套某一个字母,是否可以通过选定某种穿透性不强的波,造成接受不完整或不稳定来判断
    Shazoo
        16
    Shazoo  
       2014-11-04 10:56:04 +08:00
    我觉得lz的思路本身就是最具操作性的思路。

    根据两条监控记录的时间间隔、路况、时间段、摄像地理位置间距,得出异常数据。然后对异常车牌重点监控,人眼判断,然后抓捕。
    semicircle21
        17
    semicircle21  
       2014-11-04 11:22:41 +08:00
    @mlhadoop 很多好思路啊, 请给大家点感谢,

    楼主应该把 "套牌" 再准确定义一下, 我理解的套牌指的是: 复制了全套的同一车型同一外观颜色另一辆车的牌照+行驶证, 路上碰到交警检查都完全查不出问题, 如果不违章的话, 原车主都不知道, 这种操作方法特别适合限牌照的城市, 比如北京,上海.

    高速入口的方法有点问题, 出远门时换真实牌照就行了, 平时在市里接着用套牌.
    无论什么方式, 如果是为了应对市里限行, 朋友间商量好的套牌, 我估计这种事后分析都查不出所以然来, 因为完全可以抵赖的..
    vincentqi
        18
    vincentqi  
       2014-11-04 11:49:10 +08:00
    @semicircle21 可疑看车架号
    semicircle21
        19
    semicircle21  
       2014-11-04 11:53:48 +08:00
    @vincentqi 嗯, 其实我也想到了, 所以我说是根据视频事后分析, 如果被交警现场按住才能看车架号
    mlhadoop
        20
    mlhadoop  
    OP
       2014-11-04 16:48:18 +08:00
    @pimin 谢谢 确实不是一次性完成的任务,我们只是希望能够重大量的数据中进行分析得到哪些可疑的号码 然后交警可疑拿到这个数据进行人工检测 真的就过 假的就check出来了 时空跳跃这个词用的好。。。至于根据统计信息如何检测异常又是一个大方向了 lz得好好恶补 再次感谢
    mlhadoop
        21
    mlhadoop  
    OP
       2014-11-04 16:51:08 +08:00
    @yangyanggnu

    恩 可以按照时间顺序将车辆经过的地点形成一段序列 判断相邻间隔是否可疑 另外一个 这个违章次数从哪里可以得出呢? 没有相关数据的情况下
    mlhadoop
        22
    mlhadoop  
    OP
       2014-11-04 16:51:56 +08:00
    @loading 哈哈 这个不失为一个好办法。。。
    mlhadoop
        23
    mlhadoop  
    OP
       2014-11-04 16:54:04 +08:00
    @vincentqi 目前车牌已经识别好 拿到的是车牌号 也有车辆颜色 不需要自己进行处理
    对于二 如果我把车借给别人了 那岂不是XXX了 哈哈 还有 貌似证件照和本人照区别不是一般的匹配哈哈哈。。。
    mlhadoop
        24
    mlhadoop  
    OP
       2014-11-04 16:55:01 +08:00
    @mikelaile 有多个监控 而且精确到秒 那么这个同时该怎么定义合适呢?
    akfish
        25
    akfish  
       2014-11-04 17:01:43 +08:00
    最为简单粗暴的方式是试验下无监督机器学习算法,选好分类器,设计好feature,直接把大量数据喂给分类器,看看数据集会不会自发的出现聚类现象,然后再观察聚类在现实中对应的意义。
    运气好的话,数据会聚成N团,其中一团就是套牌车辆。
    a01113
        26
    a01113  
       2014-11-04 17:36:32 +08:00 via iPhone
    这个命题如果是某地区有套牌车,我来找出这个号码。那么,根据车辆行驶的速度,和出现的时间点,距离。就可判断。至于不同地方,不同速度,市区里最快不能过50km/h, 超速20%扣三分。
    uuair
        27
    uuair  
       2014-11-04 18:23:25 +08:00
    其实现在公安已经实现了探头自动识别套牌车了。。你这是研究,还是做项目啊。。。
    kokdemo
        28
    kokdemo  
       2014-11-04 18:28:25 +08:00
    @yangyanggnu “订个阀值”……


    那个字是 “阈”!!!念 yu 四声!!!
    yangyanggnu
        29
    yangyanggnu  
       2014-11-04 19:44:19 +08:00
    @kokdemo

    thx, bro. 真没想到一直都读错了。http://baike.baidu.com/view/648990.htm?fr=aladdin
    csx163
        30
    csx163  
       2014-11-04 20:37:42 +08:00
    是我的话,我会把每个地区划分为若干个网格,如果车辆跨网格移动即为套牌,当然天眼要覆盖完整。
    mlhadoop
        31
    mlhadoop  
    OP
       2014-11-05 18:43:11 +08:00
    @uuair 研究 单纯的数据分析 不需要进行车牌号码识别
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2578 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 24ms · UTC 04:46 · PVG 12:46 · LAX 20:46 · JFK 23:46
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.