在写一个 HTTP 服务器，想问一下请求报文中的 Content-Length 该如何验证

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

› httpbin - 协议调试工具

› httpstatuses - 协议状态码查询

› httpie - cURL-like tool for humans

Fiddler

这是一个创建于 2381 天前的主题，其中的信息可能已经有所发展或是发生改变。

平台是 linux，使用 select 函数来进行 IO 复用

对于每一个已连接的描述符，会有一个缓冲区来存储其发送过来的数据。（存储数据的逻辑在文尾）

由于是来多少数据就往缓冲区里存多少数据，这样如果有两个及以上的报文同时进了缓冲区，需要对他们进行分割。

我打算是先以两个\r\n 来进行分割，取出缓冲区里的第一个报文头，如果报文头里有 Content-Length 字段，就继续从缓冲区里读相应长度的数据。

然后就遇到了问题，假如 Content-Length 是伪造的，数值大于实际发送过来的数据的长度，那么会读到下一个报文的报文。

所以想问一下各位有什么解决办法吗

缓冲区

报文头

数据

报文

13 条回复 • 2019-08-30 15:09:28 +08:00

leaflxh

2019 年 8 月 7 日

zzzbkl

2019 年 8 月 7 日 via Android

rfc 里面描述 content-length 时用的是 should 而不是 must，通过它来验证长度确实不靠谱。同好奇

009694

2019 年 8 月 7 日 via iPhone

content-length 是用来验证报文完整性而不是用来听之任之长度读取的吧。。

abcbuzhiming

2019 年 8 月 7 日

楼主，我觉得你的思路不对，首先 Http 是基于 TCP 的，每个连接的缓冲区都是独立的，现在假设有一个有恶意的人，伪造了 Content-Length，把它变的更长，那么就算你读下去，你读到的仍然是这个人后续发来的包，你就把后续得到的包数据也当成是 request body 的内容好了。这有什么问题呢，你是告诉我有这么长的，我就读这么长，我看过 Nginx 的实现，只有在读到不够长度的数据时才会报错断开连接，但是只要后续能继续读到数据，就会继续读下去，http 的 content-length 就是 body 长度指示器，只要它不超过 http 协议定义的最大长度，你就照着读，没错的