>cat sample.txt
</span>
<span _content="">
那种写书不好好解释
动不动就留作习题
<div content="" class="sample" style="sample: 5px;">
</span>
<span _content="">
课后习题的答案除了最终结果什么都没有的作者
我真的很想踢爆你的头了……
<div content="" class="sample" style="sample: 5px;">
期望匹配出:
那种写书不好好解释
动不动就留作习题
课后习题的答案除了最终结果什么都没有的作者
我真的很想踢爆你的头了……
*/即起始标签为带换行的两个标签</span>
<span _content="">
结束为 <div content="" class="sample" style="sample: 5px;">
*/
网上搜了一大堆都不管用,要么根本不行,要么换行不行 = =
1
grewer 2018-06-14 09:53:19 +08:00
var str = '</span> <span _content="">那种写书不好好解释动不动就留作习题<div content="" class="sample" style="sample: 5px;"></span> <span _content="">课后习题的答案除了最终结果什么都没有的作者我真的很想踢爆你的头了……<div content="" class="sample" style="sample: 5px;">'
str.match(/>.*?</g) |
2
spencerqiu OP @grewer
是一整个 HTML,所以还有很多其他标签 = = |
3
grewer 2018-06-14 10:19:25 +08:00
@spencerqiu 组件了解一下正则,然后写一个,不然想要契合你的需求是很难的
|
4
BOYPT 2018-06-14 10:26:18 +08:00
收费定制正则表达式
|
5
feibinyang 2018-06-14 10:35:09 +08:00
需求是获取所有文本节点吧,这用 DOM 操作遍历更方便吧
|
6
wplct 2018-06-14 10:50:59 +08:00
bs4 了解一下
|
7
rabbbit 2018-06-14 10:59:28 +08:00
另一种思路,不去匹配文字,把 html 符号全替换掉
https://imgur.com/a/sgT5mIJ |
8
rabbbit 2018-06-14 10:59:39 +08:00
|
9
Alife 2018-06-14 11:30:24 +08:00 via iPhone
正则前将其变成一行
|