读取文本:
9.78043902348e+12,Suzanne Collins,2008.0,The Hunger Games,"The Hunger Games (The Hunger Games, #1)",eng,4.34,4780653
分隔符是逗号,但是列中如 "The Hunger Games (The Hunger Games, #1)" 包含了逗号,这要如何处理? 使用正则可以吗?
1
Chemist Apr 28, 2019
写 parser,引号方括号圆括号之类的结对出现的字符优先匹配,没有匹配上的话之后逗号都视为普通字符不匹配。
|
2
my3157 Apr 28, 2019
如果不特别 care 性能, 建议正则
|
3
lululau Apr 28, 2019
这不是 CSV 吗,人家已经把包含分隔符的字段引起来了啊
|
4
annielong Apr 28, 2019
就如 csv 大文件导入时候文本包含引号的问题一样
|
5
gaolycn Apr 28, 2019 via Android
请使用 csv parser,不用当作纯文本自己处理
|
6
autogen Apr 29, 2019
我还见过这样的代码。。。。
if cols.length == 9: fullname = cols[4] +',' + cols[5] cols.pop(5) else: fullname = cols[4] - |