缓存一个讲起来很复杂的话题,但它确实是提高性能最好的方式。缓存类别有很多,什么数据库缓存、服务器缓存(代理服务器缓存-Nginx、CDN缓存)、浏览器缓存等等。

今天主要是来讲讲浏览器缓存,也就是所谓的HTTP缓存,可以说这也是前端需要掌握的重要知识点了,(其实主要我只是个前端切图仔,你懂的哈~),话不多说,开始吹。。。

前端需要了解的浏览器缓存(即HTTP缓存)|_HTTP缓存

前言

  • 浏览器缓存可以说都是从第二次请求开始的,第一次请求,服务器返回对应资源,并在响应头(Response Headers)中添加缓存策略。

  • 浏览器缓存主要分为两种,一种是强缓存,另一种是协商缓存,也有些人习惯称为对比缓存。

  • 浏览器缓存主要是为了减少服务器的负担,提高网站性能,加快客户端加载网页的速度,所以浏览器缓存属于一种客户端缓存,缓存的资源文件一般存放在内存与本地磁盘中 。

缓存的优点

  • 缓存减少了冗余的数据传输,节省了你的网络费用。
  • 缓存缓解了网络瓶颈的问题,不需要更多的带宽就能够更快地加载页面。
  • 缓存减轻服务器的请求负担,有缓存就可以少向服务器发送请求,尤其是对于一些访问量大的网站这点还是很重要的。
  • 资源从缓存中读取,无需向服务器发送请求再等待返回,加快了客户端的访问速度,因为从较远的地方加载页面会更慢一些。

呃,查看很多篇文章基本这个优点大家都是大同小异,各位看官就随便康康就行,反正坚持一个原则就是让你的站点“快”起来。

分析控制台中的缓存策略

打开一个站点的控制台,选择Network,大致我们能看到这样子如图,我们重点观察Status、Size、Time这三列,主要能看到有 200 状态码(有一些是灰色的状态)、资源大小、from disk cache、时间等字样。

前端需要了解的浏览器缓存(即HTTP缓存)|_HTTP缓存_02

刷新页面,能看到有 304 状态码、from memory cache、0ms。

前端需要了解的浏览器缓存(即HTTP缓存)|_HTTP缓存_03

HTTP的状态码有很多,200和304是比较常见的两个,也是和缓存有关联的两个状态码。正常Size的200表示请求正常处理,返回新资源;304表示资源文件没有改动,可以直接使用缓存,这些状态码都是服务器返回告知。

上面两张图中,我们注意到,有些200是灰色的,灰色的200表示没有向服务器发送请求,而是直接从缓存中读取。从缓存中读取又分为从内存(from memory cache)中读取还是从磁盘中读取(from disk cache)。

我们还要注意一个0ms,该请求是from memory cache状态的,表示从内存中读取,所以为什么常说从内存中读取快呢?根本不花时间呀,能不快吗?

状态 描述
正常 200 状态码 从服务器下载最新资源,数值是从服务器获取的全部资源大小。
304状态码 访问服务器,发现资源没有更新,使用本地资源。数值是与服务器通信报文的大小,并不是资源本身的大小。
200-from memory cache 状态码是灰色的,从内存中读取之前已经加载过的资源,不请求服务器,页面关闭时,资源就会被内存释放,再次打开相同页面不会出现此类情况,在同一页面刷新才会出现。一般脚本、字体、图片会存在内存当中。请求时间为0ms。
200-from disk cache 状态码是灰色的,从磁盘中读取之前已经加载过的资源,不请求服务器,页面关闭不会被释放,这部分资源存在电脑磁盘里,只有用户手动清除浏览器缓存的时候才会释放。一般非脚本会存在内存当中,如css等。

缓存工作流程(三级原理)

一、 先查找内存,如果内存中存在,从内存中加载;

二、 如果内存中未查找到,选择硬盘获取,如果硬盘中有,从硬盘中加载;

三、 如果硬盘中未查找到,那就进行网络请求,加载到的资源缓存到硬盘和内存;

前端需要了解的浏览器缓存(即HTTP缓存)|_HTTP缓存_04

缓存策略

浏览器缓存分两种:强缓存 和 协商缓存,有些人也习惯叫 对比缓存。

强缓存

强制缓存主要特点就是不需要发送请求到服务器,在用户第一次访问页面之后,浏览器将资源文档存在缓存中,缓存位置(内存/磁盘)由浏览器控制,在过期时间之内,都不会再请求服务器。过期时间从第一次请求的服务器响应头中获取。是否使用强缓存由Expires、Cache-Control、Pragma首部来控制。

简单说明

  1. 用户第一次访问页面之后,HTTP会让原始服务器向每个资源文档附加一个“过期日期”,就像所有饮料都会在瓶身打上过期日期一样。
  2. 而标识这个“过期日期”是通过给HTTP响应头添加Expires字段或者Cache-Control字段来表示,网上更多会将它们称之为“首部”。首部说明了在多长时间内可以将这些内容视为新鲜的。
  3. Expire首部和Cache-Control首部所做的事情本质上是一样的,都是携带一个日期,不同的是Cache-Control 首部使用的是相对时间而不是绝对日期,并且Cache-Control优先级比Expires高。
  4. Cache-Control主要的属性值:
  • max-age: 单位是秒,缓存内容将在t秒后失效。
  • no-cache:不使用强缓存,需要使用协商缓存来验证缓存数据。
  • no-store:禁止使用缓存,包括协商缓存,每次都向服务器请求最新的资源。
  • private:专用于个人的缓存,中间代理、CDN 等不能缓存此响应。
  • public:响应可以被中间代理、CDN 等缓存。

Expires首部产生于HTTP/1.0+,Cache-Control 首部产生于HTTP/1.1。Pragme在三者中优先级最高,并且它只有no-cache这一个属性值,效果和Cache-Control: no-cache的一样,不使用强缓存。

前端需要了解的浏览器缓存(即HTTP缓存)|_HTTP缓存_05

协商缓存

协商缓存,从字面意思,就是要协商,是浏览器和服务器协商,所以浏览器每次都要和服务器通信。在第一次请求服务器时,服务器会返回资源,并且返回一个资源的缓存标识,一起存到浏览器的缓存中。当第二次请求资源时,浏览器会首先将缓存标识发送给服务器,服务器拿到标识后判断标识是否匹配,如果不匹配,表示资源有更新,服务器会将新数据和新的缓存标识一起返回到浏览器;如果缓存标识匹配,表示资源没有更新,并且返回 304 状态码,浏览器就读取本地缓存服务器中的数据。

简单说明

  1. 协商缓存就是由服务器来确定缓存资源是否可用,所以客户端与服务器要通过某种标识来进来通信,这主要涉及响应头/请求头的两组首部,即Last-Modified/IF-Modified-Since、Etag/IF-None-Match,这两组搭档是成对出现的。
  2. 第一次请求的响应头会带上某个字段(Last-Modified或者Etag),则后续请求头则会带上对应的请求字段(If-Modified-Since或者If-None-Match),若响应头没有Last-Modified或者Etag字段,则请求头也不会有对应的字段。
  3. Last-Modified与ETag是可以一起使用的,服务器会优先验证ETag,一致的情况下,才会继续比对Last-Modified,最后才决定是否返回304。
  • 一些文件也许会周期性的更改,但是他的内容并不改变(仅仅改变的修改时间),这个时候我们并不希望客户端认为这个文件被修改了,而重新GET。
  • 某些文件修改非常频繁,比如在秒以下的时间内进行修改,(比方说1s内修改了N次),If-Modified-Since能检查到的粒度是s级的,这种修改无法判断(或者说UNIX记录MTIME只能精确到秒)。
  • 某些服务器不能精确的得到文件的最后修改时间。
  • Last-Modified/IF-Modified-Since
  • Etag/IF-None-Match
  1. ETag/If-None-Match 与Last-Modify/If-Modify-Since不同的是,其返回的是一个校验码,ETag可以保证每一个资源是唯一的,资源变化都会导致ETag变化。
  2. 服务器根据浏览器上送的If-None-Match值来判断是否命中缓存。 与Last-Modified不一样的是,当服务器返回304 Not Modified的响应时,由于ETag重新生成过,响应头中还会把这个ETag返回,即使这个ETag跟之前的没有变化。
  3. ETag在HTTP1.1出现主要是为了解决:
  4. 浏览器第一次请求一个资源的时候,服务器返回的响应头中会加上Last-Modified,它是一个标识该资源的最后修改时间,例如Last-Modified: Thu,31 Dec 2037 23:59:59 GMT。 当浏览器再次请求该资源时,HTTP请求头中会包含If-Modify-Since,该值为缓存之前返回的Last-Modified。
  5. 服务器收到If-Modify-Since后,根据资源的最后修改时间判断是否命中缓存。 如果命中缓存,则返回304状态码,并且不会返回资源内容,也不会返回Last-Modified。

两者同时存在的样子如下:

前端需要了解的浏览器缓存(即HTTP缓存)|_HTTP缓存_06

用户行为对缓存的影响

用户操作 Expires/Cache-Control Lash-Modified/ETag
地址栏回车 有效 有效
页面链接跳转 有效 有效
新开窗口 有效 有效
前进回退 有效 有效
F5刷新 无效 有效
Ctrl+F5强制刷新 无效 无效

Nginx配置缓存策略

之所以来说这个话题,主要最近在g做个H5项目,但频繁更新版本用户老是无法自动获取最新版本,Leader让我试试自行来解决这个问题,害。

前端需要了解的浏览器缓存(即HTTP缓存)|_HTTP缓存_07

大致知道应该是缓存问题,也学过Nginx就琢磨从Nginx入手解决。

大概分析

项目是一个Vue项目,Vue-cli构建,在打包的时候,css和js名字都加了哈希值,所以改动后打包生成的js和css是唯一的,页面请求的是新资源,不会有缓存问题。但是入口文件index.html会因为缓存造成更新问题,如果我们更新了,但是浏览器使用的是缓存,就会出现问题。所以需要对入口文件设置不使用强缓存,需要每次去服务器验证文件是否修改,即使用协商缓存。

Nginx配置

server {
	listen  80;
	server_name  域名;
	root  文件目录;
	index  index.html;
	location / { 
		try_files $uri /index.html;
	}
	location ~ .*\.(html)$ { 
		add_header Cache-Control no-store;  # 不使用强缓存
		# add_header Cache-Control no-cache;
		# add_header Pragma no-cache;
	}
}复制代码

或者

location / {
	if ($request_filename ~ .*\.(htm|html)$)
	{
		add_header Cache-Control no-cache;
	}
}复制代码

参考文章-这个文章非常不错,里面也有相应的例子可以简单测试,图也画得很好,非常棒。

前端需要了解的浏览器缓存(即HTTP缓存)|_HTTP缓存_08