光用正则不用Xpath/DOM,有些时候蛮抓瞎的,比如
<span class='a'><span class='b'>bbb<span>aaaa<span>
其中<span class='b'>bbb<span>
有时不出现
想提取出<span class='b'>bbb<span>aaaa
很难啊……
试了PHP的几个函数,似乎不支持有错误的Html/Xml?至少没有浏览器那么Robust的样子。
比如http://share.dmhy.org 这种在https://validator.w3.org 能查出1776个错误的网页。
原生PHP有没有办法解决?request_once
引用外部库也行,只要不上框架,不用编译PHP。
1
lianyue 2015-05-27 15:17:43 +08:00
噗
|
2
lianyue 2015-05-27 15:22:52 +08:00 1
|
3
lianyue 2015-05-27 15:27:19 +08:00 1
|