目前我这边有个数据批量整理的的需求,接收到大量基于 Word 和 Excel 的表单字段,我需要将其整理相应的字段汇总输出成 Excel 进行分析在处理,整体数据在 50W 条左右,请问有相应的工具或者思路解决这个问题吗?
目前想到的是 Python 和 VBA 处理 Excel,对于 Word 没有太好的方法
1
qlbr 2017-09-16 17:27:59 +08:00
把后缀名 docx 改成 rar, 解压, 然后看 word\document.xml 有没有你想要的东西吧
|
2
053700 2017-09-16 17:38:27 +08:00
用 java 都可以做没理由用 python 做不出。楼主可以考虑用 java 做,有相关的轮子。
|
3
oisc 2017-09-16 17:45:32 +08:00
pandas
|