用了 xml.dom.minidom,加载个 100M 的 XM 的文件用了 60s,好慢
1
no1xsyzy 2021 年 5 月 12 日 |
2
wellsc 2021 年 5 月 12 日
换语言
|
3
imn1 2021 年 5 月 12 日 100M 的应该什么语言都用流式解析吧,整体加载 DOM 太大了,非常耗资源
找 xml parser 相关的库,例如 sax |
4
abersheeran 2021 年 5 月 12 日 via Android
@no1xsyzy 提到这玩意儿。我想起来以前写一个页面解析的时候,用 docker 跑的,阿里云 Serverless 上 lxml 怎么都解析不出来,我本机次次跑都没问题,最后还是换了 html.parser 。
|
5
ALLROBOT 2021 年 5 月 13 日
用 C/C++最快
python 执行速度比它们慢多了 |
6
wohenfuyou OP 改用 c++ tinyxml2 了 就 2s 钟,差距也太大了
|