哈夫曼编码:一种无损数据压缩方法,通过为更常见的符号分配更短的二进制码、为不常见的符号分配更长的二进制码,来降低整体编码长度。它通常生成一种前缀码(任何码字都不是另一个码字的开头),便于解码。除这一常见含义外,“coding”在其他语境也可指“编程/编码”等。
/ˈhʌfmən ˈkoʊdɪŋ/
Huffman coding can reduce the size of a text file without losing information.
哈夫曼编码可以在不丢失信息的情况下减小文本文件的大小。
By building a Huffman tree from character frequencies, the compressor assigns shorter codes to common symbols and achieves near-optimal average code length.
通过根据字符频率构建哈夫曼树,压缩器会给常见符号分配更短的码字,从而实现接近最优的平均码长。
“Huffman”来自提出该算法的美国计算机科学家 David A. Huffman(大卫·A·哈夫曼)。1952年他发表论文提出一种构造最小冗余编码的方法;“coding”意为“编码”。因此 “Huffman coding” 直译为“哈夫曼(提出的)编码方法”。