我用 requests 下载文件,文件名在 response header 的 Content-Disposition 中, 在浏览器中虽然 devtools 解析乱码,但下载弹框的文件名正确,而在程序中获取到的内容也是乱码,类似于
attachment; filename=å½±å®
ã·ã£ãã¼ãã¦ã¹ 01;filename*=utf-8''å½±å®
ã·ã£ãã¼ãã¦ã¹ 01
经过尝试,可能是进行了如下错误解码
raw = '影宅 シャドーハウス 01'
b = bytes(raw, 'utf8')
dec = b.decode(encoding='iso-8859-1', errors='replace')
print(dec)
output:
å½±å®
ã·ã£ãã¼ãã¦ã¹ 01
逆向解码:
print(bytes(dec, 'iso-8859-1').decode('utf8'))
按规范来说,接收方不保证能解析 utf8 header,所以各位开发同学请不要再在 header 中填入 utf8 内容了!