V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
推荐学习书目
Learn Python the Hard Way
Python Sites
PyPI - Python Package Index
http://diveintopython.org/toc/index.html
Pocoo
值得关注的项目
PyPy
Celery
Jinja2
Read the Docs
gevent
pyenv
virtualenv
Stackless Python
Beautiful Soup
结巴中文分词
Green Unicorn
Sentry
Shovel
Pyflakes
pytest
Python 编程
pep8 Checker
Styles
PEP 8
Google Python Style Guide
Code Style from The Hitchhiker's Guide
paloalto
V2EX  ›  Python

如何在web.py模板中输出数据时过滤html标签?

  •  
  •   paloalto · 2012-11-17 19:44:59 +08:00 · 3084 次点击
    这是一个创建于 4389 天前的主题,其中的信息可能已经有所发展或是发生改变。
    我是用的web.py自带的模板,不知道这是不是其缺陷之一。

    我想在view层(xxxx.html)中输出数据时把其中的html标签(主要是<p></p>和<br/>)过滤掉,找了一些脚本,不过基本上都需要import re,但是view层中似乎无法import,只能在model和controller层import。

    附 找到的过滤脚本:

    6 条回复    1970-01-01 08:00:00 +08:00
    paloalto
        1
    paloalto  
    OP
       2012-11-17 20:25:46 +08:00
    想复杂了,其实就是想用正则过滤。。。。汗。。。貌似我知道该怎么做了。
    CoX
        2
    CoX  
       2012-11-17 20:39:57 +08:00
    如果装了lxml,就很简单了

    >>> import lxml.html
    >>> html='<img /><a>srcd</a>hello</br><br/>'
    >>> html = lxml.html.document_fromstring(html)
    >>> html.text_content()
    'srcdhello'
    paloalto
        3
    paloalto  
    OP
       2012-11-17 20:44:36 +08:00
    @CoX view里面没法 import 啊。。。
    CoX
        4
    CoX  
       2012-11-17 20:52:12 +08:00
    自定个函数,然后传递到view层;
    不知道为什么非要在view层处理,实质上还是controller层处理的
    paloalto
        5
    paloalto  
    OP
       2012-11-17 21:24:16 +08:00
    @CoX 最后的解决办法非常简单:

    .replace(r'<br/>', '')

    原先试过 .replace('<br/>', '') ,但是只能替换第一行的<br/>,不知道为啥改成r'<br/>'之后就能全部替换了。。
    lj0014
        6
    lj0014  
       2012-11-19 11:04:10 +08:00
    @paloalto 可以import哦,官方文档里有:
    import web
    import markdown

    globals = {'markdown': markdown.markdown}
    render = web.template.render('templates', globals=globals)
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2803 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 30ms · UTC 11:44 · PVG 19:44 · LAX 03:44 · JFK 06:44
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.