请教个python替换字符的问题

_re_imgs = re.compile('(http[s]?://?\S*\w\.(jpg|jpe|jpeg|gif|png))\w*', re.UNICODE|re.I|re.M|re.S)
_re_gist = re.compile('(http[s]?://gist.github.com/[\d]+)', re.UNICODE|re.I|re.M|re.S)
_re_con_sup = re.compile('\B!([^<>\/].+?)!\B', re.UNICODE|re.I|re.M|re.S)

#sup
if _re_con_sup.search(text):
text = _re_con_sup.sub(r'<div id="sup">\1</div>', text)
#gist
if '://gist' in text:
text = _re_gist.sub(r'<script src="\1.js"></script>',text)
#auto img
if _re_imgs.search(text):
text = _re_imgs.sub(r'<a class="imga" href="\1"><img class="lazy" border="0" style="max-width:540px;" src="./static/grey2.gif" data-original="\1"/></a>', text)

怎么对_re_con_sup过的内容就不做_re_imgs、_re_gist处理了呢，谢谢

第 1 条附言 · 2012-11-22 13:44:22 +08:00

已经搞定了，谢谢了

Text

sup

3 条回复 • 1970-01-01 08:00:00 +08:00

dreampuf

2012-11-20 19:29:55 +08:00

1. 合并到一个regex中，用"|"处理.
2. 获取所有_re_con_sup匹配的边界，在后面的捕获中一旦在这些边界中的，就视为匹配不成功。

gino

2012-11-20 23:01:20 +08:00

@dreampuf
第一个方式，我测试过了，因为regex比较多，会很麻烦
对应第二个方式，是否能在指点下，感谢了

dreampuf

2012-11-21 00:48:09 +08:00

@gino
In [1]: import re

In [2]: a = re.search(r"""(?:(?P<pic>http[s]?://?\S*\w\.(jpg|jpe|jpeg|gif|png))\w*|(?P<gist>http[s]?://gist.github.com/[\d]+)|\B!(?P<con>[^<>\/].+?)!\B)""", "http://huangx.in/a.jpg")

In [3]: a.groupdict()
Out[3]: {'con': None, 'gist': None, 'pic': 'http://huangx.in/a.jpg'}