为什么这个 utf8 编码后面会多个 0？

This topic created in 2944 days ago, the information mentioned may be changed or developed.

        Charset utf8 = Charset.forName("utf8");
        String ss = "I love you";
        ByteBuffer buffer = utf8.encode(ss);

        byte[] bytes = buffer.array();
        for (byte b : bytes){
            System.out.println(b);
        }

打印结果： 73 32 108 111 118 101 32 121 111 117 0 把"I love you"的'u'去掉得到： 73 32 108 111 118 101 32 121 111 没 0 啊？

8 replies • 2018-07-04 15:55:35 +08:00

ThirdFlame

Jul 3, 2018

00 代表结束？

codechaser

Jul 3, 2018

@ThirdFlame 你好，我刚刚把'u'去掉了也没有 0 啊？

Finest

Jul 3, 2018

C 里的结束字符\0?

codechaser

Jul 3, 2018

@hand515 这是 java，java 有结束字符吗？

sagaxu

Jul 3, 2018 via Android

https://stackoverflow.com/questions/11319499/java-bug-why-extra-zero-byte-in-utf8-encoding

codechaser

Jul 3, 2018

@sagaxu Thanks!

joyme

Jul 3, 2018

ByteBuffer 有 limit 和 capacity 成员变量，limit 是结束位，capacity 是实际的容量。应该根据 limit 去读实际的内容。

lcdxiangzi

Jul 4, 2018

没有看懂为什么 ByteBuffer 要这样设计呢？有人可以指点一下吗？