web 应用

1. 基于socket写一个web应用

1. 客户端是浏览器,服务端自己写(python)

2. 静态页面 动态页面
	静态页面:静态的html,内容不会改变,每次访问看到的数据都一样
    动态页面:页面的数据会发生变化,每次访问看到的可能都不一样(数据来源可能是数据库)

1. main.py

# 1 写一个web应用的服务端,通过浏览器(客户端),来访问

import socket

server = socket.socket()

# server.bind(('127.0.0.1', 8080)) 
server.bind(('0.0.0.0', 8080))
server.listen(5)

while True:
    conn, addr = server.accept()
    # 接收浏览器传过来的数据
    data = conn.recv(1024)
    print(data)
    # 返回给浏览器数据(不符合http协议)
    # conn.send(b'hello world')
    # 返回数据符合http协议
    # conn.send(b'HTTP/1.1 200 ok \r\n\r\n hello world')

    # 返回符合html格式的数据
    # conn.send('HTTP/1.1 200 ok \r\n\r\n <h1>title</h1>'.encode('utf-8'))

    # 返回一个html页面,打开文件,转成二进制,send一下
    # with open('index.html','r',encoding='utf-8') as f:
    #     data=f.read()
    #
    # response='HTTP/1.1 200 ok \r\n\r\n %s'%data
    # conn.send(response.encode('utf-8'))

    # 实现动态页面(静态页面,动态页面)
    # 在index.html中写一个特殊标记,使用python的变量去替换这个特殊标记
    import time
    ctime=time.time()  # 可能是数据库查询出来的
    with open('index.html','r',encoding='utf-8') as f:
        data=f.read().replace('{{time}}',str(ctime))
    response='HTTP/1.1 200 ok \r\n\r\n %s'%data
    conn.send(response.encode('utf-8'))
    conn.close()

2. index.html

<!DOCTYPE html>
<html lang="en">
<head>
    <meta charset="UTF-8">
    <title>Title</title>
</head>
<body>
{{time}}
<br>
<img height="100" width="100" src="https://timgsa.baidu.com/timg?image&quality=80&size=b9999_10000&sec=1601009198247&di=b7b696110501b0e1ba3b5c508335c7b2&imgtype=0&src=http%3A%2F%2Fb-ssl.duitang.com%2Fuploads%2Fitem%2F201509%2F29%2F20150929213123_Mvy4S.jpeg" alt="">
</body>
</html>

2. http 协议

1. http 简介

1. HTTP协议是Hyper Text Transfer Protocol(超文本传输协议)的缩写
   是用于万维网服务器与本地浏览器之间传输超文本的传送协议

2. 应用层的协议

3. http协议特性
	1. 基于tcp/ip之上的应用层协议
    2. 基于请求-响应模式
    3. 无状态保存
    4. 无连接

4. 请求协议(浏览器发出来的)
三部分:请求首行,请求头,请求体
'''
# 请求首行(以第一个\r\n区分的)
# 请求方式:GET  请求地址:/lqz/handsome   协议:http   版本:1.1版本
GET /lqz/handsome HTTP/1.1\r\n

# 请求头(key:value形式)
Host:  192.168.11.211:8080\r\n
Connection:  keep-alive\r\n
Cache-Control:  max-age=0\r\n
Upgrade-Insecure-Requests:  1\r\n
User-Agent:  Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/85.0.4183.83 Safari/537.36\r\n
Accept:  text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.9\r\n
Accept-Encoding:  gzip, deflate\r\n
Accept-Language:  zh-CN,zh;q=0.9\r\n\r\n'

# \r\n\r\n  下面的是请求体的内容
# 请求体
......
......
......
'''

5 响应协议
    # 响应首行 响应协议和版本:HTTP/1.1  响应的状态码和标志:200 ok  
    HTTP/1.1 200 ok \r\n
    # 响应头(key:value形式)
    key:value
    key:valu
    \r\n\r\n
    # 响应体:在浏览器里看到的东西(浏览器能把下面的html渲染成好看的样子)
    <!DOCTYPE html>
    <html lang="en">
    <h1>hello</h1>
    </html>

6 响应状态码
	1xx:请求正在处理(用户一般看不到)        
    2xx:请求成功(200)
    3xx:重定向(301 302)访问一个地址,转到另一个地址
    4xx:客户端错误(404 403)
    5xx:服务端错误(502)

7 url:统一资源定位符
	# 格式
    http://127.0.0.1:8080/order.html
    ftp://xxx
    协议://IP:端口(80)/路径?name=lqz&age=18  # 浏览器发送的请求,默认是80
    统一资源定位符是可以从互联网上访问资源的一种方式,协议就是资源的地址

8 http协议总结
	-请求协议
    	-请求首行:请求方式(GET,POST) 请求地址  协议和版本\r\n
        -请求头:key:value\r\n\r\n
        -请求体  
    -响应协议
    	-响应首行:协议版本  状态码和状态 \r\n
        -响应头:key:value\r\n\r\n
        -响应体:html的内容
    -特点:
    	-无状态无连接
        -基于请求响应
        -基于tcp/ip

2. http 请求格式

HTTP 1.1(请参阅 IETF RFC 2068)
	提供一组可供客户端与服务器通讯的方法,并指定响应(从服务器返回发出请求的客户端)的格式
	WebDAV 完全采用此规范中的所有方法,扩展其中的一些方法,并引入了其他可提供所描述功能的方法
	Web 分布式创作和版本管理 (WebDAV) 扩展了HTTP/1.1 协议,允许客户端发布、锁定和管理Web上的资源

WebDAV(Web-based Distributed Authoring and Versioning)一种基于 HTTP 1.1协议的通信协议
	基于web的分布式创作和版本控制,它扩展了HTTP 1.1
	在GET、POST、HEAD等几个HTTP标准方法以外添加了一些新的方法,使应用程序可对Web Server直接读写
	并支持写文件锁定(Locking)及解锁(Unlock),还可以支持文件的版本控制

WebDAV 中使用的方法包括:
    1.Options、Head 和 Trace
    	主要由应用程序用来发现和跟踪服务器支持和网络行为
    2.Get
    	检索文档
    3.Put 和 Post
    	将文档提交到服务器
    4.Delete
    	销毁资源或集合
    5. Mkcol
    	创建集合
    6.PropFind 和 PropPatch
    	针对资源和集合检索和设置属性
    7.Copy 和 Move
    	管理命名空间上下文中的集合和资源
    8.Lock 和 Unlock
    	改写保护

WebDAV 请求的一般结构遵循 HTTP 的格式
并且由以下三个组件构成:
    1. 方法   声明由客户端执行的方法(上面描述的方法)
    2. 标头   描述有关如何完成此任务的指令
    3. 主体(可选) 定义用在该指令或其他指令中的数据,用以描述如何完成此方法
       在主体组件中,XML 成为整个 WebDAV 结构中的关键元素

WebDAV 允许客户端进行下列操作
处理服务器上 WebDAV 发布目录中的资源。使用此功能的优点:
    1.具有正确权限的用户可以在 WebDAV目录中复制和移动文件
    2.修改与某些资源相关联的属性。例如,用户可写入并检索文件的属性信息
    3.锁定并解锁资源以便多个用户可同时读取一个文件。但每次只能有一个人修改文件
    4.搜索 WebDAV 目录中的文件的内容和属性

3. http 状态码

1. 消息
1xx (消息)	
    这一类型的状态码,代表请求已被接受,需要继续处理
    这类响应是临时响应,只包含状态行和某些可选的响应头信息,并以空行结束
    由于HTTP/1.0协议中没有定义任何1xx状态码,所以除非在某些试验条件下,服务器禁止向此类客户端发送1xx响应
    
100 Continue
	客户端应当继续发送请求
    这个临时响应是用来通知客户端它的部分请求已经被服务器接收,且仍未被拒绝
    客户端应当继续发送请求的剩余部分,或者如果请求已经完成,忽略这个响应
    服务器必须在请求完成后向客户端发送一个最终响应
    
101 Switching Protocols
	服务器已经理解了客户端的请求,并将通过Upgrade消息头通知客户端采用不同的协议来完成这个请求
    在发送完这个响应最后的空行后,服务器将会切换到在Upgrade消息头中定义的那些协议
	只有在切换新的协议更有好处的时候才应该采取类似措施
    例如:切换到新的HTTP版本比旧版本更有优势,或者切换到一个实时且同步的协议以传送利用此类特性的资源
        
102 Processing
	由WebDAV(RFC 2518)扩展的状态码,代表处理将被继续执行
2. 成功
2xx (成功)
	这一类型的状态码,代表请求已成功被服务器接收、理解、并接受
    
200 OK
	请求已成功,请求所希望的响应头或数据体将随此响应返回。出现此状态码是表示正常状态

201 Created
	请求已经被实现,而且有一个新的资源已经依据请求的需要而建立,且其 URI 已经随Location 头信息返回
    假如需要的资源无法及时建立的话,应当返回 '202 Accepted'

202 Accepted
	服务器已接受请求,但尚未处理。正如它可能被拒绝一样,最终该请求可能会也可能不会被执行
    在异步操作的场合下,没有比发送这个状态码更方便的做法了
	返回202状态码的响应的目的是允许服务器接受其他过程的请求(例如某个每天只执行一次的基于批处理的操作)
    而不必让客户端一直保持与服务器的连接直到批处理操作全部完成
    在接受请求处理并返回202状态码的响应,应当在返回的实体中包含一些指示处理当前状态的信息
    以及指向处理状态监视器或状态预测的指针,以便用户能够估计操作是否已经完成

203 Non-Authoritative Information
	服务器已成功处理请求,但返回的实体头部元信息不是在原始服务器上有效的确定集合而是来自本地或第三方的拷贝
    当前的信息可能是原始版本的子集或者超集。例如,包含资源的元数据可能导致原始服务器知道元信息的超集。
    使用此状态码不是必须的,而且只有在响应不使用此状态码便会返回200 OK的情况下才是合适的

204 No Content
	服务器成功处理了请求,但不需要返回任何实体内容,并且希望返回更新了的元信息
    响应可能通过实体头部的形式,返回新的或更新后的元信息
    如果存在这些头部信息,则应当与所请求的变量相呼应
	如果客户端是浏览器的话,那么用户浏览器应保留发送了该请求的页面,而不产生任何文档视图上的变化
    即使按照规范新的或更新后的元信息应当被应用到用户浏览器活动视图中的文档
	由于204响应被禁止包含任何消息体,因此它始终以消息头后的第一个空行结尾

205 Reset Content
	服务器成功处理了请求,且没有返回任何内容
    但是与204响应不同,返回此状态码的响应要求请求者重置文档视图
    该响应主要是被用于接受用户输入后,立即重置表单,以便用户能够轻松地开始另一次输入
	与204响应一样,该响应也被禁止包含任何消息体,且以消息头后的第一个空行结束

206 Partial Content
	服务器已经成功处理了部分 GET 请求
    类似于 FlashGet 或者迅雷这类的 HTTP下载工具都是使用此类响应实现断点续传或者将一个大文档分解为多个下载段同时下载
	该请求必须包含 Range 头信息来指示客户端希望得到的内容范围,并且可能包含 If-Range 来作为请求条件
	
响应必须包含如下的头部域:
	Content-Range 用以指示本次响应中返回的内容的范围
    如果是 Content-Type 为 multipart/byteranges 的多段下载
    则每一 multipart 段中都应包含 Content-Range 域用以指示本段的内容范围
    假如响应中包含 Content-Length,那么它的数值必须匹配它返回的内容范围的真实字节数
	Date
    ETag 和/或 Content-Location,假如同样的请求本应该返回200响应
    Expires, Cache-Control,和/或 Vary,假如其值可能与之前相同变量的其他响应对应的值不同的话
    假如本响应请求使用了 If-Range 强缓存验证,那么本次响应不应该包含其他实体头
    假如本响应的请求使用了 If-Range 弱缓存验证,那么本次响应禁止包含其他实体头
    这避免了缓存的实体内容和更新了的实体头信息之间的不一致
    否则,本响应就应当包含所有本应该返回200响应中应当返回的所有实体头部域
    假如 ETag 或 Last-Modified 头部不能精确匹配的话,则客户端缓存应禁止将206响应返回的内容与之前任何缓存过的内容组合在一起

207 Multi-Status
	由WebDAV(RFC 2518)扩展的状态码,代表之后的消息体将是一个XML消息
    并且可能依照之前子请求数量的不同,包含一系列独立的响应代码
3. 重定向
3XX
	这类状态码代表需要客户端采取进一步的操作才能完成请求
    通常,这些状态码用来重定向,后续的请求地址(重定向目标)在本次响应的 Location 域中指明

	当且仅当后续的请求所使用的方法是 GET 或者 HEAD 时,用户浏览器才可以在没有用户介入的情况下自动提交所需要的后续请求。
    客户端应当自动监测无限循环重定向(例如:A->A,或者A->B->C->A),因为这会导致服务器和客户端大量不必要的资源消耗。按照 HTTP/1.0 版规范的建议,浏览器不应自动访问超过5次的重定向。

300 Multiple Choices
	被请求的资源有一系列可供选择的回馈信息,每个都有自己特定的地址和浏览器驱动的商议信息。
    用户或浏览器能够自行选择一个首选的地址进行重定向。
	除非这是一个 HEAD 请求,否则该响应应当包括一个资源特性及地址的列表的实体,以便用户或浏览器从中选择最合适的重定向地址。
    这个实体的格式由 Content-Type 定义的格式所决定。
    浏览器可能根据响应的格式以及浏览器自身能力,自动作出最合适的选择。
    当然,RFC 2616规范并没有规定这样的自动选择该如何进行。
	如果服务器本身已经有了首选的回馈选择,那么在 Location 中应当指明这个回馈的 URI;浏览器可能会将这个 Location 值作为自动重定向的地址。
    此外,除非额外指定,否则这个响应也是可缓存的。

301 Moved Permanently
	被请求的资源已永久移动到新位置,并且将来任何对此资源的引用都应该使用本响应返回的若干个 URI 之一。
    如果可能,拥有链接编辑功能的客户端应当自动把请求的地址修改为从服务器反馈回来的地址。
    除非额外指定,否则这个响应也是可缓存的。
	新的永久性的URI 应当在响应的 Location 域中返回。
    除非这是一个 HEAD 请求,否则响应的实体中应当包含指向新的 URI 的超链接及简短说明。
	如果这不是一个 GET 或者 HEAD 请求,因此浏览器禁止自动进行重定向,除非得到用户的确认,因为请求的条件可能因此发生变化。
	注意:对于某些使用 HTTP/1.0 协议的浏览器,当它们发送的 POST 请求得到了一个301响应的话,接下来的重定向请求将会变成 GET 方式。

302 Move Temporarily
	请求的资源临时从不同的 URI响应请求。
    由于这样的重定向是临时的,客户端应当继续向原有地址发送以后的请求。
    只有在Cache-Control或Expires中进行了指定的情况下,这个响应才是可缓存的。
	如果这不是一个 GET 或者 HEAD 请求,那么浏览器禁止自动进行重定向,除非得到用户的确认,因为请求的条件可能因此发生变化。
	注意:虽然RFC 1945和RFC 2068规范不允许客户端在重定向时改变请求的方法,但是很多现存的浏览器将302响应视作为303响应,并且使用 GET 方式访问在 Location 中规定的 URI,而无视原先请求的方法。状态码303和307被添加了进来,用以明确服务器期待客户端进行何种反应。

303 See Other
	对应当前请求的响应可以在另一个 URL 上被找到,而且客户端应当采用 GET 的方式访问那个资源。
    这个方法的存在主要是为了允许由脚本激活的POST请求输出重定向到一个新的资源。
    这个新的URI不是原始资源的替代引用。同时303响应禁止被缓存,当然,第二个请求(重定向)可能被缓存。
	注意:许多HTTP/1.1版以前的浏览器不能正确理解303状态。如果需要考虑与这些浏览器之间的互动,302状态码应该可以胜任,因为大多数的浏览器处理302响应时的方式恰恰就是上述规范要求客户端处理303响应时应当做的。

304 Not Modified
	如果客户端发送了一个带条件的 GET 请求且该请求已被允许,而文档的内容(自上次访问以来或者根据请求的条件)并没有改变,则服务器应当返回这个状态码。
    304响应禁止包含消息体,因此始终以消息头后的第一个空行结尾。

该响应必须包含以下的头信息:
	Date,除非这个服务器没有时钟。
    假如没有时钟的服务器也遵守这些规则,那么代理服务器以及客户端可以自行将 Date 字段添加到接收到的响应头中去(正如RFC 2068中规定的一样),缓存机制将会正常工作。
	ETag 和/或 Content-Location,假如同样的请求本应返回200响应。
	Expires, Cache-Control,和/或Vary,假如其值可能与之前相同变量的其他响应对应的值不同的话。
	假如本响应请求使用了强缓存验证,那么本次响应不应该包含其他实体头;否则(例如某个带条件的GET请求使用了弱缓存验证)本次响应禁止包含其他实体头;这避免了缓存了的实体内容和更新了的实体头信息之间的不一致。
	假如某个304响应指明了当前某个实体没有缓存,那么缓存系统必须忽视这个响应,并且重复发送不包含限制条件的请求。
	假如接收到一个要求更新某个缓存条目的304响应,那么缓存系统必须更新整个条目以反映所有在响应中被更新的字段的值。

305 Use Proxy
	被请求的资源必须通过指定的代理才能被访问。
    Location 域中将给出指定的代理所在的 URI 信息,接收者需要重复发送一个单独的请求,通过这个代理才能访问相应资源。只有原始服务器才能建立305响应。
	注意:RFC 2068中没有明确305响应是为了重定向一个单独的请求,而且只能被原始服务器建立。
    	 忽视这些限制可能导致严重的安全后果。

306 Switch Proxy
	在最新版的规范中,306状态码已经不再被使用。

307 Temporary Redirect
	请求的资源临时从不同的URI响应请求。
	新的临时性的URI应当在响应的 Location 域中返回。
    除非这是一个HEAD 请求,否则响应的实体中应当包含指向新的URI 的超链接及简短说明。
    因为部分浏览器不能识别307响应,因此需要添加上述必要信息以便用户能够理解并向新的URI发出访问请求。
	如果这不是一个GET 或者 HEAD 请求,那么浏览器禁止自动进行重定向,除非得到用户的确认,因为请求的条件可能因此发生变化
4. 请求错误
4XX
	这类的状态码代表了客户端看起来可能发生了错误,妨碍了服务器的处理。
    除非响应的是一个 HEAD 请求,否则服务器就应该返回一个解释当前错误状况的实体,以及这是临时的还是永久性的状况。
    这些状态码适用于任何请求方法。
    浏览器应当向用户显示任何包含在此类错误响应中的实体内容。
	如果错误发生时客户端正在传送数据,那么使用TCP的服务器实现应当仔细确保在关闭客户端与服务器之间的连接之前,客户端已经收到了包含错误信息的数据包。
    如果客户端在收到错误信息后继续向服务器发送数据,服务器的TCP栈将向客户端发送一个重置数据包,以清除该客户端所有还未识别的输入缓冲,以免这些数据被服务器上的应用程序读取并干扰后者。

400 Bad Request
	1. 语义有误,当前请求无法被服务器理解。除非进行修改,否则客户端不应该重复提交这个请求。
	2. 请求参数有误。

401 Unauthorized
	当前请求需要用户验证。
    该响应必须包含一个适用于被请求资源的 WWW-Authenticate 信息头用以询问用户信息。
    客户端可以重复提交一个包含恰当的 Authorization 头信息的请求。
    如果当前请求已经包含了 Authorization 证书,那么401响应代表着服务器验证已经拒绝了那些证书。
    如果401响应包含了与前一个响应相同的身份验证询问,且浏览器已经至少尝试了一次验证,那么浏览器应当向用户展示响应中包含的实体信息,因为这个实体信息中可能包含了相关诊断信息。参见RFC 2617。

402 Payment Required
	该状态码是为了将来可能的需求而预留的。

403 Forbidden
	服务器已经理解请求,但是拒绝执行它。
    与401响应不同的是,身份验证并不能提供任何帮助,而且这个请求也不应该被重复提交。
    如果这不是一个 HEAD 请求,而且服务器希望能够讲清楚为何请求不能被执行,那么就应该在实体内描述拒绝的原因。当然服务器也可以返回一个404响应,假如它不希望让客户端获得任何信息。

404 Not Found
	请求失败,请求所希望得到的资源未被在服务器上发现。
    没有信息能够告诉用户这个状况到底是暂时的还是永久的。
    假如服务器知道情况的话,应当使用410状态码来告知旧资源因为某些内部的配置机制问题,已经永久的不可用,而且没有任何可以跳转的地址。
    404这个状态码被广泛应用于当服务器不想揭示到底为何请求被拒绝或者没有其他适合的响应可用的情况下。出现这个错误的最有可能的原因是服务器端没有这个页面。

405 Method Not Allowed
	请求行中指定的请求方法不能被用于请求相应的资源。
    该响应必须返回一个Allow 头信息用以表示出当前资源能够接受的请求方法的列表。
	鉴于 PUT,DELETE 方法会对服务器上的资源进行写操作,因而绝大部分的网页服务器都不支持或者在默认配置下不允许上述请求方法,对于此类请求均会返回405错误。

406 Not Acceptable
	请求的资源的内容特性无法满足请求头中的条件,因而无法生成响应实体。
	除非这是一个 HEAD 请求,否则该响应就应当返回一个包含可以让用户或者浏览器从中选择最合适的实体特性以及地址列表的实体。
    实体的格式由 Content-Type 头中定义的媒体类型决定。
    浏览器可以根据格式及自身能力自行作出最佳选择。但是,规范中并没有定义任何作出此类自动选择的标准。

407 Proxy Authentication Required
	与401响应类似,只不过客户端必须在代理服务器上进行身份验证。
    代理服务器必须返回一个 Proxy-Authenticate 用以进行身份询问。
    客户端可以返回一个 Proxy-Authorization 信息头用以验证。参见RFC 2617。

408 Request Timeout
	请求超时
    客户端没有在服务器预备等待的时间内完成一个请求的发送。
    客户端可以随时再次提交这一请求而无需进行任何更改。

409 Conflict
	由于和被请求的资源的当前状态之间存在冲突,请求无法完成。
    这个代码只允许在这样的情况下才能被使用:用户被认为能够解决冲突,并且会重新提交新的请求。
    该响应应当包含足够的信息以便用户发现冲突的源头。
	冲突通常发生于对 PUT 请求的处理中。
    例如,在采用版本检查的环境下,某次 PUT 提交的对特定资源的修改请求所附带的版本信息与之前的某个(第三方)请求向冲突,那么此时服务器就应该返回一个409错误,告知用户请求无法完成。此时,响应实体中很可能会包含两个冲突版本之间的差异比较,以便用户重新提交归并以后的新版本。

410 Gone
	被请求的资源在服务器上已经不再可用,而且没有任何已知的转发地址。
    这样的状况应当被认为是永久性的。
    如果可能,拥有链接编辑功能的客户端应当在获得用户许可后删除所有指向这个地址的引用。
    如果服务器不知道或者无法确定这个状况是否是永久的,那么就应该使用404状态码。
    除非额外说明,否则这个响应是可缓存的。

	410响应的目的主要是帮助网站管理员维护网站,通知用户该资源已经不再可用,并且服务器拥有者希望所有指向这个资源的远端连接也被删除。
    这类事件在限时、增值服务中很普遍。同样,410响应也被用于通知客户端在当前服务器站点上,原本属于某个个人的资源已经不再可用。当然,是否需要把所有永久不可用的资源标记为'410 Gone',以及是否需要保持此标记多长时间,完全取决于服务器拥有者。

411 Length Required
	服务器拒绝在没有定义 Content-Length 头的情况下接受请求。
    在添加了表明请求消息体长度的有效 Content-Length 头之后,客户端可以再次提交该请求。

412 Precondition Failed
	服务器在验证在请求的头字段中给出先决条件时,没能满足其中的一个或多个。
    这个状态码允许客户端在获取资源时在请求的元信息(请求头字段数据)中设置先决条件,以此避免该请求方法被应用到其希望的内容以外的资源上。

413 Request Entity Too Large
	服务器拒绝处理当前请求,因为该请求提交的实体数据大小超过了服务器愿意或者能够处理的范围。
    此种情况下,服务器可以关闭连接以免客户端继续发送此请求。
	如果这个状况是临时的,服务器应当返回一个 Retry-After 的响应头,以告知客户端可以在多少时间以后重新尝试。

414 Request-URI Too Long
	请求的URI 长度超过了服务器能够解释的长度,因此服务器拒绝对该请求提供服务。
    这比较少见,通常的情况包括:
		本应使用POST方法的表单提交变成了GET方法,导致查询字符串(Query String)过长。
		重定向URI “黑洞”
        例如,每次重定向把旧的 URI 作为新的 URI 的一部分,导致在若干次重定向后 URI 超长。
	客户端正在尝试利用某些服务器中存在的安全漏洞攻击服务器。
    这类服务器使用固定长度的缓冲读取或操作请求的 URI,当 GET 后的参数超过某个数值后,可能会产生缓冲区溢出,导致任意代码被执行。没有此类漏洞的服务器,应当返回414状态码。

415 Unsupported Media Type
	对于当前请求的方法和所请求的资源,请求中提交的实体并不是服务器中所支持的格式,因此请求被拒绝。

416 Requested Range Not Satisfiable
	如果请求中包含了 Range 请求头,并且 Range 中指定的任何数据范围都与当前资源的可用范围不重合,同时请求中又没有定义 If-Range 请求头,那么服务器就应当返回416状态码。
	假如 Range 使用的是字节范围,那么这种情况就是指请求指定的所有数据范围的首字节位置都超过了当前资源的长度。服务器也应当在返回416状态码的同时,包含一个 Content-Range 实体头,用以指明当前资源的长度。这个响应也被禁止使用 multipart/byteranges 作为其 Content-Type。

417 Expectation Failed
	在请求头 Expect 中指定的预期内容无法被服务器满足,或者这个服务器是一个代理服务器,它有明显的证据证明在当前路由的下一个节点上,Expect 的内容无法被满足。

418 I'm a teapot

421 Misdirected Request
	请求被指向到无法生成响应的服务器(比如由于连接重复使用)

422 Unprocessable Entity
	请求格式正确,但是由于含有语义错误,无法响应。(RFC 4918 WebDAV)

423 Locked
	当前资源被锁定。(RFC 4918 WebDAV)

424 Failed Dependency
	由于之前的某个请求发生的错误,导致当前请求失败,例如 PROPPATCH。(RFC 4918 WebDAV)

425 Too Early
	状态码 425 Too Early 代表服务器不愿意冒风险来处理该请求,原因是处理该请求可能会被“重放”,从而造成潜在的重放攻击。(RFC 8470)

426 Upgrade Required
	客户端应当切换到TLS/1.0。(RFC 2817)

449 Retry With
	由微软扩展,代表请求应当在执行完适当的操作后进行重试。

451 Unavailable For Legal Reasons
	该请求因法律原因不可用
5. 服务器错误
5XX 6XX
	这类状态码代表了服务器在处理请求的过程中有错误或者异常状态发生,也有可能是服务器意识到以当前的软硬件资源无法完成对请求的处理。
    除非这是一个HEAD 请求,否则服务器应当包含一个解释当前错误状态以及这个状况是临时的还是永久的解释信息实体。浏览器应当向用户展示任何在当前响应中被包含的实体。
	这些状态码适用于任何响应方法。

500 Internal Server Error
	服务器遇到了一个未曾预料的状况,导致了它无法完成对请求的处理。
    一般来说,这个问题都会在服务器端的源代码出现错误时出现。

501 Not Implemented
	服务器不支持当前请求所需要的某个功能。当服务器无法识别请求的方法,并且无法支持其对任何资源的请求。

502 Bad Gateway
	作为网关或者代理工作的服务器尝试执行请求时,从上游服务器接收到无效的响应。

503 Service Unavailable
	由于临时的服务器维护或者过载,服务器当前无法处理请求。
    这个状况是临时的,并且将在一段时间以后恢复。
    如果能够预计延迟时间,那么响应中可以包含一个 Retry-After 头用以标明这个延迟时间。
    如果没有给出这个 Retry-After 信息,那么客户端应当以处理500响应的方式处理它。
	注意:503状态码的存在并不意味着服务器在过载的时候必须使用它。
    	 某些服务器只不过是希望拒绝客户端的连接。

504 Gateway Timeout
	作为网关或者代理工作的服务器尝试执行请求时,未能及时从上游服务器(URI标识出的服务器,例如HTTP、FTP、LDAP)或者辅助服务器(例如DNS)收到响应。
	注意:某些代理服务器在DNS查询超时时会返回400或者500错误

505 HTTP Version Not Supported
	服务器不支持,或者拒绝支持在请求中使用的 HTTP 版本。
    这暗示着服务器不能或不愿使用与客户端相同的版本。
    响应中应当包含一个描述了为何版本不被支持以及服务器支持哪些协议的实体。

506 Variant Also Negotiates
	由《透明内容协商协议》(RFC 2295)扩展,代表服务器存在内部配置错误:被请求的协商变元资源被配置C为在透明内容协商中使用自己,因此在一个协商处理中不是一个合适的重点。

507 Insufficient Storage
	服务器无法存储完成请求所必须的内容。这个状况被认为是临时的。WebDAV (RFC 4918)

509 Bandwidth Limit Exceeded
	服务器达到带宽限制。这不是一个官方的状态码,但是仍被广泛使用。

510 Not Extended
	获取资源所需要的策略并没有被满足。(RFC 2774)

600 Unparseable Response Headers
	源站没有返回响应头部,只返回实体内容。

4. http 优势

由于Web已经成为Internet的基础,因此HTTP1.1被证实是用来传输数据的非常灵活的通用协议
HTTP存在一些明显缺点,从而限制了它作为综合的Internet通讯协议而被采用,它非常适合用于查看静态文档
但不能提供以足够复杂(以便向客户端提供丰富的创作功能)的方式来处理文档的方法
例如,当两个作者在未进行交流的情况下同时对一个文档进行更改时,就会出现“更新丢失”问题
只有由最后一个作者完成并将修改后的文档重新上载到服务器的修改才会保留下来,另一个作者进行的更改将丢失
	
IETF WebDAV 工作组的目标是,设计一个协议,它提供基于标准的论坛中任何分布式创作工具需要的功能
当前的 WebDAV 规范 (IETF RFC 2518) 解决协作式创作工具的三个主要问题:
1· 改写保护
	HTTP 1.1 无法确保客户端可以保护资源,并且可以在其他客户端同时编辑它们的情况下进行更改。 使用 WebDAV,可以通过多种方式来锁定资源,以便让其他客户端知道您对所讨论的资源感兴趣,或者防止其他客户端访问该资源。
2. 资源管理
	HTTP 只能直接访问单个资源。 WebDAV 提供一种更有效地组织数据的方法。 WebDAV 引入了可包含资源的集合(类似于文件系统文件夹)概念。 通过 WebDAV 进行的资源管理包括如下功能:创建、移动、复制和删除集合,以及集合中的资源或文件。
3. 文档属性
	不同类型的数据具有唯一的属性,这有助于描述数据。 例如,在电子邮件中,这些属性可能是发件人的姓名和接收邮件的时间。 在协作文档中,这些属性可能是文档原始作者的姓名和最后一个编辑者的姓名。 因为人们使用的文档类型各不相同,所以可能的属性类型列表也变得无限大。 XML 是 WebDAV 所需的一种可扩展通讯工具

3. web 框架

1. web 框架简介

Web框架(Web framework)是一种开发框架,用来支持动态网站、网络应用和网络服务的开发
	大多数的web框架提供了一套开发和部署网站的方式,也为web行为提供了一套通用的方法
	web框架已经实现了很多功能,开发人员使用框架提供的方法并且完成自己的业务逻辑,就能快速开发web应用了	浏览器和服务器的是基于HTTP协议进行通信的
	也可以说web框架就是在以上十几行代码基础张扩展出来的,有很多简单方便使用的方法,大大提高了开发的效率
手写简单web框架
1.1 main.py
import socket

import pymysql
def index(request):
    return '<img src="https://gss2.bdstatic.com/9fo3dSag_xI4khGkpoWK1HF6hhy/baike/c0%3Dbaike92%2C5%2C5%2C92%2C30/sign=5e3814acf9edab64607f4592965fc4a6/14ce36d3d539b600c0c465d0eb50352ac65cb74b.jpg"></img>'

def login(request):
    with open('login.html','r',encoding='utf-8') as f :
        data=f.read()
    return data
def time(request):
    import datetime
    now=datetime.datetime.now().strftime('%Y-%m-%d %X')
    with open('time.html','r',encoding='utf-8') as f :
        data=f.read()
    data=data.replace('@@time@@',now)
    return data
def user_list(request):
    # 创建连接
    conn = pymysql.connect(host='127.0.0.1', port=3306, user='root', passwd='123456', db='lqz')
    cursor = conn.cursor(cursor=pymysql.cursors.DictCursor)
    cursor.execute("select id,name,password from user")
    user_list = cursor.fetchall()
    cursor.close()
    conn.close()
    tr_list=[]
    for row in user_list:
        tr='<tr><td>%s</td><td>%s</td><td>%s</td></tr>'%(row['id'],row['name'],row['password'])
        tr_list.append(tr)

    with open('user_list.html','r',encoding='utf-8') as f:
        data=f.read()
    data=data.replace('@@body@@',''.join(tr_list))
    return data

def user_list_new(request):
    # 创建连接
    conn = pymysql.connect(host='127.0.0.1', port=3306, user='root', passwd='123456', db='lqz')
    cursor = conn.cursor(cursor=pymysql.cursors.DictCursor)
    cursor.execute("select id,name,password from user")
    user_list = cursor.fetchall()
    cursor.close()
    conn.close()
    with open('user_list_new.html','r',encoding='utf-8') as f:
        data=f.read()
    from jinja2 import Template
    template=Template(data)
    response=template.render(user_list=user_list)
    # response=template.render({'user_list':user_list})
    return response

urls = [
    ('/index', index),
    ('/login', login),
    ('/time', time),
    ('/user_list', user_list),
    ('/user_list_new', user_list_new),
]

def run():
    soc = socket.socket()
    soc.bind(('127.0.0.1', 8006))
    soc.listen(5)
    while True:
        conn, port = soc.accept()
        data = conn.recv(1024)
        # data=data.decode('utf-8')
        print(data)
        data = str(data, encoding='utf-8')
        request_list = data.split('\r\n\r\n')
        head_list = request_list[0].split('\r\n')
        method, url, htt = head_list[0].split(' ')
        # conn.send(b'hello web')
        conn.send(b'HTTP/1.1 200 OK \r\n\r\n')
        print(url)
        func_name = None
        for u in urls:
            if url == u[0]:
                func_name = u[1]
                break
        if func_name:
            response = func_name(data)
        else:
            response = '404 not found'
        conn.send(response.encode('utf-8'))
        conn.close()

if __name__ == '__main__':
    run()
1.2 login.html
<!DOCTYPE html>
<html lang="en">
<head>
    <meta charset="UTF-8">
    <title>Title</title>
</head>
<body>
<form action="">
    <p>用户名:<input type="text"></p>
    <p>密码:<input type="password"></p>
</form>
</body>
</html>
1.3 time.html
<!DOCTYPE html>
<html lang="en">
<head>
    <meta charset="UTF-8">
    <title>Title</title>
</head>
<body>
@@time@@
</body>
</html>
1.4 user_list.html
<!DOCTYPE html>
<html lang="en">
<head>
    <meta charset="UTF-8">
    <title>用户列表</title>
</head>
<body>
<table border="1">
    <thead>
        <tr>
            <th>id</th>
            <th>用户名</th>
            <th>密码</th>
        </tr>
    </thead>
    <tbody>
        @@body@@
    </tbody>
</table>
</body>
</html>
1.5 user_list_new
<!DOCTYPE html>
<html lang="en">
<head>
    <meta charset="UTF-8">
    <title>用户列表</title>
</head>
<body>
<table border="1">
    <thead>
    <tr>
        <th>id</th>
        <th>name</th>
        <th>password</th>
    </tr>
    </thead>
    <tbody>
    {% for user in user_list%}
    <tr>
        <td>{{user.id}}</td>
        <td>{{user.name}}</td>
        <td>{{user.password}}</td>
    </tr>
    {%endfor%}
    </tbody>
</table>
</body>
</html>

2. wsgiref 模块

最简单的Web应用就是先把HTML用文件保存好,用一个现成的HTTP服务器软件,接收用户请求,从文件中读取HTML,返回数据
	如果要动态生成HTML,就需要把上述步骤自己来实现。不过,接受HTTP请求、解析HTTP请求、发送HTTP响应都是苦力活,如果我们自己来写这些底层代码,还没开始写动态HTML呢,就得花个把月去读HTTP规范
	正确的做法是底层代码由专门的服务器软件实现,我们用Python专注于生成HTML文档。因为我们不希望接触到TCP连接、HTTP原始请求和响应格式,所以,需要一个统一的接口协议来实现这样的服务器软件,让我们专心用Python编写Web业务。这个接口就是WSGI:Web Server Gateway Interface。而wsgiref模块就是python基于wsgi协议开发的服务模块 (Web Server Gateway Interface web服务网关接口)
基于wsgiref写一个web框架
1. socket自己写的,借助于一个模块,已经实现了socket
2. wsgiref:django默认使用的
3. 在web框架上继续开发
	路径都在urls.py中写
    路径匹配以后执行的函数,都放在views.py
    数据库相关操作,在models.py中
2.1 myserver.py
from wsgiref.simple_server import make_server
from urls import url_patters

def server(environ, start_response):   # 必须传两个参数
    # environ:是字典,http请求拆成字典,请求方式,请求地址,请求头 ...
    # start_response:响应对象,响应状态码,响应头放到里面
    start_response('200 OK', [('Content-Type', 'text/html')])
    func=None
    for item in url_patters:
        if item[0] == environ.get('PATH_INFO'):
            func = item[1]
            break
    if func:
        data = func(environ, start_response)
    else:
        data='error'.encode('utf-8')
    return [data]

if __name__ == '__main__':
    # app是可调用对象,可以加括号执行的(函数内存地址)
    # 只要客户端发送一次请求,就会调用server()
    myserver = make_server('127.0.0.1', 8081, server)
    # 起服务,相当于之前写的socket一直监听8081端口
    myserver.serve_forever()
2.2 urls.py
# 路径和函数对应关系

from views import *
url_patters = [
    ('/login', login),
    ('/index', index),
    ('/time', time),
    ('/order', order),
]
2.3 views.py
def login(environ, start_response):
    with open('templates/login.html', 'rb') as f:
        data = f.read()
    return data

def index(environ, start_response):
    with open('templates/index.html', 'rb') as f:
        data = f.read()
    return data

def time(environ, start_response):
    import time
    with open('templates/time.html', 'r', encoding='utf-8') as f:
        data = f.read().replace('{{time}}', str(time.time()))
    return data.encode('utf-8')

def order(environ, start_response):
    return 'order'.encode('utf-8')