缓存一个讲起来很复杂的话题,但它确实是提高性能最好的方式。缓存类别有很多,什么数据库缓存、服务器缓存(代理服务器缓存-Nginx、CDN缓存)、浏览器缓存等等。
今天主要是来讲讲浏览器缓存,也就是所谓的HTTP缓存,可以说这也是前端需要掌握的重要知识点了,(其实主要我只是个前端切图仔,你懂的哈~),话不多说,开始吹。。。
前言
-
浏览器缓存可以说都是从第二次请求开始的,第一次请求,服务器返回对应资源,并在响应头(Response Headers)中添加缓存策略。
-
浏览器缓存主要分为两种,一种是强缓存,另一种是协商缓存,也有些人习惯称为对比缓存。
-
浏览器缓存主要是为了减少服务器的负担,提高网站性能,加快客户端加载网页的速度,所以浏览器缓存属于一种客户端缓存,缓存的资源文件一般存放在内存与本地磁盘中 。
缓存的优点
- 缓存减少了冗余的数据传输,节省了你的网络费用。
- 缓存缓解了网络瓶颈的问题,不需要更多的带宽就能够更快地加载页面。
- 缓存减轻服务器的请求负担,有缓存就可以少向服务器发送请求,尤其是对于一些访问量大的网站这点还是很重要的。
- 资源从缓存中读取,无需向服务器发送请求再等待返回,加快了客户端的访问速度,因为从较远的地方加载页面会更慢一些。
呃,查看很多篇文章基本这个优点大家都是大同小异,各位看官就随便康康就行,反正坚持一个原则就是让你的站点“快”起来。
分析控制台中的缓存策略
打开一个站点的控制台,选择Network,大致我们能看到这样子如图,我们重点观察Status、Size、Time这三列,主要能看到有 200 状态码(有一些是灰色的状态)、资源大小、from disk cache、时间等字样。
刷新页面,能看到有 304 状态码、from memory cache、0ms。
HTTP的状态码有很多,200和304是比较常见的两个,也是和缓存有关联的两个状态码。正常Size的200表示请求正常处理,返回新资源;304表示资源文件没有改动,可以直接使用缓存,这些状态码都是服务器返回告知。
上面两张图中,我们注意到,有些200是灰色的,灰色的200表示没有向服务器发送请求,而是直接从缓存中读取。从缓存中读取又分为从内存(from memory cache)中读取还是从磁盘中读取(from disk cache)。
我们还要注意一个0ms,该请求是from memory cache状态的,表示从内存中读取,所以为什么常说从内存中读取快呢?根本不花时间呀,能不快吗?
状态 | 描述 |
---|---|
正常 200 状态码 | 从服务器下载最新资源,数值是从服务器获取的全部资源大小。 |
304状态码 | 访问服务器,发现资源没有更新,使用本地资源。数值是与服务器通信报文的大小,并不是资源本身的大小。 |
200-from memory cache | 状态码是灰色的,从内存中读取之前已经加载过的资源,不请求服务器,页面关闭时,资源就会被内存释放,再次打开相同页面不会出现此类情况,在同一页面刷新才会出现。一般脚本、字体、图片会存在内存当中。请求时间为0ms。 |
200-from disk cache | 状态码是灰色的,从磁盘中读取之前已经加载过的资源,不请求服务器,页面关闭不会被释放,这部分资源存在电脑磁盘里,只有用户手动清除浏览器缓存的时候才会释放。一般非脚本会存在内存当中,如css等。 |
缓存工作流程(三级原理)
一、 先查找内存,如果内存中存在,从内存中加载;
二、 如果内存中未查找到,选择硬盘获取,如果硬盘中有,从硬盘中加载;
三、 如果硬盘中未查找到,那就进行网络请求,加载到的资源缓存到硬盘和内存;
缓存策略
浏览器缓存分两种:强缓存 和 协商缓存,有些人也习惯叫 对比缓存。
强缓存
强制缓存主要特点就是不需要发送请求到服务器,在用户第一次访问页面之后,浏览器将资源文档存在缓存中,缓存位置(内存/磁盘)由浏览器控制,在过期时间之内,都不会再请求服务器。过期时间从第一次请求的服务器响应头中获取。是否使用强缓存由Expires、Cache-Control、Pragma首部来控制。
简单说明
- 用户第一次访问页面之后,HTTP会让原始服务器向每个资源文档附加一个“过期日期”,就像所有饮料都会在瓶身打上过期日期一样。
- 而标识这个“过期日期”是通过给HTTP响应头添加Expires字段或者Cache-Control字段来表示,网上更多会将它们称之为“首部”。首部说明了在多长时间内可以将这些内容视为新鲜的。
- Expire首部和Cache-Control首部所做的事情本质上是一样的,都是携带一个日期,不同的是Cache-Control 首部使用的是相对时间而不是绝对日期,并且Cache-Control优先级比Expires高。
- Cache-Control主要的属性值:
- max-age: 单位是秒,缓存内容将在t秒后失效。
- no-cache:不使用强缓存,需要使用协商缓存来验证缓存数据。
- no-store:禁止使用缓存,包括协商缓存,每次都向服务器请求最新的资源。
- private:专用于个人的缓存,中间代理、CDN 等不能缓存此响应。
- public:响应可以被中间代理、CDN 等缓存。
Expires首部产生于HTTP/1.0+,Cache-Control 首部产生于HTTP/1.1。Pragme在三者中优先级最高,并且它只有no-cache这一个属性值,效果和Cache-Control: no-cache的一样,不使用强缓存。
协商缓存
协商缓存,从字面意思,就是要协商,是浏览器和服务器协商,所以浏览器每次都要和服务器通信。在第一次请求服务器时,服务器会返回资源,并且返回一个资源的缓存标识,一起存到浏览器的缓存中。当第二次请求资源时,浏览器会首先将缓存标识发送给服务器,服务器拿到标识后判断标识是否匹配,如果不匹配,表示资源有更新,服务器会将新数据和新的缓存标识一起返回到浏览器;如果缓存标识匹配,表示资源没有更新,并且返回 304 状态码,浏览器就读取本地缓存服务器中的数据。
简单说明
- 协商缓存就是由服务器来确定缓存资源是否可用,所以客户端与服务器要通过某种标识来进来通信,这主要涉及响应头/请求头的两组首部,即Last-Modified/IF-Modified-Since、Etag/IF-None-Match,这两组搭档是成对出现的。
- 第一次请求的响应头会带上某个字段(Last-Modified或者Etag),则后续请求头则会带上对应的请求字段(If-Modified-Since或者If-None-Match),若响应头没有Last-Modified或者Etag字段,则请求头也不会有对应的字段。
- Last-Modified与ETag是可以一起使用的,服务器会优先验证ETag,一致的情况下,才会继续比对Last-Modified,最后才决定是否返回304。
- 一些文件也许会周期性的更改,但是他的内容并不改变(仅仅改变的修改时间),这个时候我们并不希望客户端认为这个文件被修改了,而重新GET。
- 某些文件修改非常频繁,比如在秒以下的时间内进行修改,(比方说1s内修改了N次),If-Modified-Since能检查到的粒度是s级的,这种修改无法判断(或者说UNIX记录MTIME只能精确到秒)。
- 某些服务器不能精确的得到文件的最后修改时间。
- Last-Modified/IF-Modified-Since
- Etag/IF-None-Match
- ETag/If-None-Match 与Last-Modify/If-Modify-Since不同的是,其返回的是一个校验码,ETag可以保证每一个资源是唯一的,资源变化都会导致ETag变化。
- 服务器根据浏览器上送的If-None-Match值来判断是否命中缓存。 与Last-Modified不一样的是,当服务器返回304 Not Modified的响应时,由于ETag重新生成过,响应头中还会把这个ETag返回,即使这个ETag跟之前的没有变化。
- ETag在HTTP1.1出现主要是为了解决:
- 浏览器第一次请求一个资源的时候,服务器返回的响应头中会加上Last-Modified,它是一个标识该资源的最后修改时间,例如Last-Modified: Thu,31 Dec 2037 23:59:59 GMT。 当浏览器再次请求该资源时,HTTP请求头中会包含If-Modify-Since,该值为缓存之前返回的Last-Modified。
- 服务器收到If-Modify-Since后,根据资源的最后修改时间判断是否命中缓存。 如果命中缓存,则返回304状态码,并且不会返回资源内容,也不会返回Last-Modified。
两者同时存在的样子如下:
用户行为对缓存的影响
用户操作 | Expires/Cache-Control | Lash-Modified/ETag |
---|---|---|
地址栏回车 | 有效 | 有效 |
页面链接跳转 | 有效 | 有效 |
新开窗口 | 有效 | 有效 |
前进回退 | 有效 | 有效 |
F5刷新 | 无效 | 有效 |
Ctrl+F5强制刷新 | 无效 | 无效 |
Nginx配置缓存策略
之所以来说这个话题,主要最近在g做个H5项目,但频繁更新版本用户老是无法自动获取最新版本,Leader让我试试自行来解决这个问题,害。
大致知道应该是缓存问题,也学过Nginx就琢磨从Nginx入手解决。
大概分析
项目是一个Vue项目,Vue-cli构建,在打包的时候,css和js名字都加了哈希值,所以改动后打包生成的js和css是唯一的,页面请求的是新资源,不会有缓存问题。但是入口文件index.html会因为缓存造成更新问题,如果我们更新了,但是浏览器使用的是缓存,就会出现问题。所以需要对入口文件设置不使用强缓存,需要每次去服务器验证文件是否修改,即使用协商缓存。
Nginx配置
server { listen 80; server_name 域名; root 文件目录; index index.html; location / { try_files $uri /index.html; } location ~ .*\.(html)$ { add_header Cache-Control no-store; # 不使用强缓存 # add_header Cache-Control no-cache; # add_header Pragma no-cache; } }复制代码
或者
location / { if ($request_filename ~ .*\.(htm|html)$) { add_header Cache-Control no-cache; } }复制代码
参考文章-这个文章非常不错,里面也有相应的例子可以简单测试,图也画得很好,非常棒。