V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
推荐学习书目
Learn Python the Hard Way
Python Sites
PyPI - Python Package Index
http://diveintopython.org/toc/index.html
Pocoo
值得关注的项目
PyPy
Celery
Jinja2
Read the Docs
gevent
pyenv
virtualenv
Stackless Python
Beautiful Soup
结巴中文分词
Green Unicorn
Sentry
Shovel
Pyflakes
pytest
Python 编程
pep8 Checker
Styles
PEP 8
Google Python Style Guide
Code Style from The Hitchhiker's Guide
sujin190
V2EX  ›  Python

python下有没有好用的规则引擎呐?

  •  
  •   sujin190 ·
    snower · Aug 6, 2013 · 10397 views
    This topic created in 4660 days ago, the information mentioned may be changed or developed.
    现在想要从大量数据中按一定规则抽取符合规则的数据,想使用python开发,有没有适合的规则引擎啥的呢?虚心求指导
    7 replies    1970-01-01 08:00:00 +08:00
    crazybubble
        1
    crazybubble  
       Aug 7, 2013
    不如按照规则制定一个feature pipeline吧, 每条数据过一下这个pipeline,返回一串feature vector,然后这串feature vector可以反映数据符合规则的程度。比如假如你有规则A和B,数据d1,d2,d3. d1可能满足A不满足B;d2满足B不满足A;d3满足A也满足B。这样可以表达他们成:
    d1: [1,0]
    d2: [0,1]
    d3: [1,1]
    xdyl
        2
    xdyl  
       Aug 7, 2013
    除了Java的Drools么发现任何好用的规则引擎
    sujin190
        3
    sujin190  
    OP
       Aug 7, 2013   ❤️ 1
    @crazybubble 这个不行啊,现在有近千万条数据,有必须在很短的时间内完成,同时每时刻都生成新数据,要定时重复过滤才行,每条过滤肯定不行啊
    sujin190
        4
    sujin190  
    OP
       Aug 7, 2013
    @xdyl Drools是不错,但它能实现对数据进行计算再判断吗?
    luojun
        5
    luojun  
       Aug 8, 2013
    我用过VisualRules规则引擎,可以直接在规则中操作数据库,然后使用RuleExecuter来定时执行,设置为5秒钟执行一次,或者设置为每天的00:00执行一次,你说的很短的时间,大概是多长时间呢?因为这个跟你的规则复杂程度也有关系,我曾经试过在规则中从数据库读取200万左右的数据,然后中间经过规则处理也会生成200多万条中间数据,最后在规则中再将数据写回数据库,大概花了5分钟左右的时间,当时用的个人笔记本电脑,
    xdyl
        6
    xdyl  
       Aug 8, 2013
    @sujin190
    没明白你说的数据再计算是指什么。
    xdyl
        7
    xdyl  
       Aug 8, 2013
    重新看了一下你的要求。
    如果规则会变的话,用Drools也可以。

    如果有推理过程的话,用Drools也合适。

    如果规则不会变也没什么中间数据。还是直接写代码吧
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   1683 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 32ms · UTC 16:19 · PVG 00:19 · LAX 09:19 · JFK 12:19
    ♥ Do have faith in what you're doing.