https://mercury.postlight.com/web-parser/
号称可以直接拉到 HTML 的文章内容正文的数据,测试了很多资讯站基本上都覆盖的比较完美。
不过感觉不太可能是手动覆盖了这些测试站点的样式,所以应该用的算法之类的实现。
大家有相关的资料可以参考下吗?对这个非常感兴趣
号称可以直接拉到 HTML 的文章内容正文的数据,测试了很多资讯站基本上都覆盖的比较完美。
不过感觉不太可能是手动覆盖了这些测试站点的样式,所以应该用的算法之类的实现。
大家有相关的资料可以参考下吗?对这个非常感兴趣