在 python 核心编程中看到这样一个例子: ''' print re.findall('http://(?:\w+.)(\w+.com)', 'http://code.google.com') ''' 最后的结果是输出['google.com']. 请问为什么前面的 http://没有掉了,求助...
1
liuxu 2018-05-31 19:00:04 +08:00 2
正则的()是捕获匹配,会返回的,其他的不会返回给你
|
2
malaohu 2018-05-31 19:03:34 +08:00
建议楼主 查询一下 ?: 的意思
|
3
summerwar 2018-05-31 19:03:50 +08:00
因为没有在括号里
|
4
summerwar 2018-05-31 19:08:50 +08:00
(?:pattern)
匹配 pattern,但不捕获匹配结果。 顺手学了个新东西,感谢 |
5
mikefy OP 原来这就是子组...另外这里有写错没有给.加上反斜杠没人看见吗...嘎嘎
|
6
F1024 2018-05-31 19:17:59 +08:00
|
7
hahastudio 2018-05-31 19:20:04 +08:00
1. help('re.findall') Return a list of all non-overlapping matches in the string
2. https://deerchao.net/tutorials/regex/regex.htm 匹配 exp,不捕获匹配的文本,也不给此分组分配组号 |
8
hahastudio 2018-05-31 19:21:08 +08:00
@mikefy 反正 . 也匹配 .
|
9
0x400 2018-05-31 19:22:47 +08:00 via Android
所以要怎么才能返回全部呢。比如我想要以 a 或者 b 开头加后面五个任意字符(a|b).{5}这样肯定不行,只能(a.{5}|b.{5}),但是。。。如果有 abcdefg 等等很多情况开头呢,又或者后面相同的条件也很长。。。
|
12
F1024 2018-05-31 19:38:01 +08:00
|