标题部分的结尾用空行表示:
最后,请求可能包含一个“主体”,即一个随请求发送到服务器的任意有效负载。
综合起来,就是一个简单的GET请求:
一个简单的POST请求和正文:
响应格式
以请求响应为例,它由一系列 作为分隔的行组成。响应中的第一行称为“状态行”,它以HTTP协议版本开头,后跟一个空格,后跟响应状态码,后跟另一个空格,接着是状态码原因,最后是 :
状态行到达响应头,后跟空行,之后是可选的响应体:
简单的服务器
根据目前对协议的了解,我们需要编写一个服务器,不管输入的请求如何,都输出相同的响应。
首先,创建一个套接字,将它绑定到一个地址,然后开始监听连接。
如果现在尝试运行此代码,它将打印标准输出,在监听127.0.0.1:9000之后退出。为了实际处理传入连接,需要accept在套接字上调用该方法。这样做会阻止进程,直到客户端连接到我们的服务器。
一旦有了与客户端的套接字连接,我们就可以开始与它进行通信。使用sendall方法,发送连接客户端的示例响应:
如果现在运行代码,然后在常用的浏览器中访问http://127.0.0.1:9000,它应该呈现字符串“Hello!”。不过,服务器在发送响应后会退出,导致页面刷新失败。下图代码可以用于解决该问题:
文件的服务器
我们需要扩展HTTP服务器,方便它从磁盘提供文件。
请求抽象化
在此之前,我们需要读取和解析来自客户端的传入请求数据。由于请求数据是由许多行构成的,每个线段都有 字符分隔,所以需要编写一个生成器函数,该函数从套接字读取数据并生成每行代码:
它所做的是尽可能多的从bufsize块中读取数据,将数据连接在一个缓冲区(buff)中并不断将缓冲区分成单独的行,从而一次产生一个。一旦找到空行,它将返回它读取的额外数据。
使用iter_lines,就可以开始打印我们获得的请求:
如果现在运行服务器并访问http://127.0.0.1:9000,应该在控制台中看到以下内容:
接下来通过定义一个Request类来对这些数据进行抽象:
现在,只能了解方法、路径和请求标头。我们留下解析查询字符串参数,以供以后使用。
为了封装构建请求所需的逻辑,我们将添加一个类方法from_socket到Request中:
它使用iter_lines之前定义的函数来读取请求行。将得到method和path,然后读取和分析这些单独的标题行。最后,它构建Request对象并返回。如果将其插入到我们的服务器循环中,如下所示:
现在连接到服务器,如下所示:
因为from_socket在某些情况下可能会引发异常,所以如果现在给出不合法请求,服务器可能会崩溃。我们可以使用telnet连接到服务器并发送一些伪造数据来模拟这个操作: