用 python 读取后
b'ibtpdbws\x00\x01\x00\x00\xdfg\x012\xd3U\x00\x1e\x00\x00\x00\x00\x00\x01\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x01\x00\x00\x00\x01\x00\x00\x00\x02\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x03P\x00\x00%\x18\x00\x01\x00\x00\x00\x00%\x18\x00\x01\x00\x00
是类似这种。
1
ooh 2018-10-31 16:34:50 +08:00
你读的是 Unicode 文本吗?把代码贴出来吧
|
2
hundan 2018-10-31 16:37:23 +08:00 via Android
这个看起来就不是可见字符吧,啥原样
|
3
dapengzhao OP @ooh 读的是百度词库的文本,具体模样可以下载一个看看 https://shurufa.baidu.com/dict_list?cid=217。我的需求是将这个文本的字符解析成汉字。由于我发现
result = '1105' content = binascii.a2b_hex(result).decode('utf-16') 可以解析出汉字。 word= open(地址,'rb') 读出来的是上面那种形式。无法使用。 我还在测试就写了几行代码看看这种行不行得通。 |
4
dapengzhao OP @hundan https://shurufa.baidu.com/dict_list?cid=217 原文本就是百度词库的文本
|
5
Shy07 2018-10-31 17:00:54 +08:00
|
6
dapengzhao OP @Shy07 我就是从那过来的,知道思路,代码有点不好用
|
7
dapengzhao OP 知道了很简单
fileText = open(filename,'rb') return fileText.read().hex()(手动狗头) |