我计算机本地有一个 CSV 文件,表头汉字编码格式是 ASCII,我用 spider(pyton 3.6)的 pandas 读取的时候显示 UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc9 in position 3: invalid continuation byte
问一下该怎么解决?
问一下该怎么解决?
1
chenstack Sep 6, 2018
csv 也是文本文件,要么手动处理成 utf-8 编码的再读取,要么用 pandas read_csv 时指定 encoding
|
2
glacer Sep 6, 2018
reload(sys)
sys.setdefaultencoding('utf8') |
4
bmos Sep 6, 2018
我用比较笨的方法,直接指定编码方式,open,然后 readlines,list 再转化成其他格式。。占个座看看有没有好的方法。
|
6
acone2003 OP 谢谢 chenstack,搞定!同时也谢谢楼上两位
|
7
raysonx Sep 6, 2018 via Android
你说的汉字编码是 GB 吧,ASCII 不支持中文。
|