在构建高性能的网站或Web应用程序时,优化前端资源的加载速度是至关重要的。一个有效的方法是利用HTTP缓存机制,通过缓存静态资源来减少网络请求,降低服务器负载,并提升用户体验。本文将介绍如何使用Nginx配置前端HTTP缓存,以加速网站的加载速度。

什么是HTTP缓存?

HTTP缓存是一种在客户端(浏览器)和服务器之间缓存HTTP响应的机制。当浏览器首次请求一个资源时,服务器会返回响应,并在响应中包含缓存指令。这些缓存指令告诉浏览器如何处理该资源以及何时再次请求该资源。

Nginx缓存基础

在Nginx中,缓存是通过proxy_cache_path和proxy_cache指令来配置的。proxy_cache_path定义了缓存的存储路径和相关参数,而proxy_cache指令则用于指定哪些请求应该被缓存。

Nginx中的缓存机制

Nginx提供了两种主要的缓存机制:代理缓存和浏览器缓存。代理缓存是指Nginx作为代理服务器,将请求的响应存储在自身的缓存中,当再次收到相同请求时,可以直接从缓存中提供响应。而浏览器缓存则是通过设置HTTP响应头来指示浏览器存储资源副本。

配置Nginx实现前端HTTP缓存

server {
  # 其他配置项...

  location ~* .(html)$ {
    access_log off;
    add_header  Cache-Control  max-age=no-cache;
  }

  location ~* .(css|js|png|jpg|jpeg|gif|gz|svg|mp4|ogg|ogv|webm|htc|xml|woff)$ {
    access_log off;
    add_header    Cache-Control  max-age=360000;
  }

  # 其他资源类型的配置...
}

在上述配置中,我们使用location指令结合正则表达式匹配不同类型的资源。对于以.html结尾的资源,我们设置了Cache-Control头部为max-age=no-cache,这告诉浏览器不要缓存该资源。而对于以.css、.js、.png等结尾的资源,我们设置了Cache-Control头部为max-age=360000,这表示浏览器可以缓存该资源,并在360000秒(约为100小时)后再次请求。
通过这样的配置,可以根据不同的资源类型灵活地控制缓存策略,以满足网站的需求。
下面对Cache-Control中的这两个参数进行分析一下:

add_header Cache-Control max-age=no-cache; 的含义:html文件不设置强制缓存时间,协商缓存,使用 Last-Modified。no-cache 会发起往返通信来验证缓存的响应,但如果资源未发生变化,则不会下载,返回304。

add_header Cache-Control max-age=360000; 的含义给上面匹配后缀的文件设置强制缓存,且缓存的时间是360000秒,第一次访问的时候,从服务器请求,当除了第一次以外,再次刷新浏览器,会从浏览器缓存读取,那么强制缓存一般是从内存里面先读取,如果内存没有,再从硬盘读取。

缓存时间的选择

缓存时间的选择取决于资源的更新频率。对于不经常变动的资源,如库文件或图标,可以设置较长的缓存时间。而对于经常更新的资源,如HTML页面,可能需要设置较短的缓存时间或不缓存。
浏览器中关于Cache的3属性:

1. Cache-Control:

设置相对过期时间, max-age指明以秒为单位的缓存时间. 若对静态资源只缓存一次, 可以设置max-age的值为315360000000 (一万年). 比如对于提交的订单,为了防止浏览器回退重新提交,可以使用Cache-Control之no-store绝对禁止缓存,即便浏览器回退依然请求的是服务器,进而判断订单的状态给出相应的提示信息!

Http协议的cache-control的常见取值及其组合释义:
no-cache: 数据内容不能被缓存, 每次请求都重新访问服务器, 若有max-age, 则缓存期间不访问服务器.
no-store: 不仅不能缓存, 连暂存也不可以(即: 临时文件夹中不能暂存该资源).
private(默认): 只能在浏览器中缓存, 只有在第一次请求的时候才访问服务器, 若有max-age, 则缓存期间不访问服务器.
public: 可以被任何缓存区缓存, 如: 浏览器、服务器、代理服务器等.
max-age: 相对过期时间, 即以秒为单位的缓存时间.
no-cache, private: 打开新窗口时候重新访问服务器, 若设置max-age, 则缓存期间不访问服务器.
-  private, 正数的max-age: 后退时候不会访问服务器.
-  no-cache, 正数的max-age: 后退时会访问服务器.

2. Expires:

设置以分钟为单位的绝对过期时间, 优先级比Cache-Control低, 同时设置Expires和Cache-Control则后者生效. 也就是说要注意一点: Cache-Control的优先级高于Expires
expires起到控制页面缓存的作用,合理配置expires可以减少很多服务器的请求, expires的配置可以在http段中或者server段中或者location段中. 比如控制图片等过期时间为30天, 可以配置如下:

location ~ .(gif|jpg|jpeg|png|bmp|ico)$ {
    root /var/www/img/`;`
    expires 30d;
}
再比如:
location ~ .(wma|wmv|asf|mp3|mmf|zip|rar|swf|flv)$ {
    root /var/www/upload/`;`
    expires max;
}

3. Last-Modified:

该资源的最后修改时间, 在浏览器下一次请求资源时, 浏览器将先发送一个请求到服务器上, 并附上If-Unmodified-Since头来说明浏览器所缓存资源的最后修改时间, 如果服务器发现没有修改, 则直接返回304(Not Modified)回应信息给浏览器(内容很少), 如果服务器对比时间发现修改了, 则照常返回所请求的资源.
需要注意:

  1. Last-Modified属性通常和Expires或Cache-Control属性配合使用, 因为即使浏览器设置缓存, 当用户点击”刷新”按钮时, 浏览器会忽略缓存继续向服务器发送请求, 这时Last-Modified将能够很好的减小回应开销.
  2. ETag将返回给浏览器一个资源ID, 如果有了新版本则正常发送并附上新ID, 否则返回304, 但是在服务器集群情况下, 每个服务器将返回不同的ID, 因此不建议使用ETag.
    以上描述的客户端浏览器缓存是指存储位置在客户端浏览器, 但是对客户端浏览器缓存的实际设置工作是在服务器上的资源中完成的. 虽然上面介绍了有关于客户端浏览器缓存的属性, 但是实际上对这些属性的设置工作都需要在服务器的资源中做设置. 通常有两种操作手段对浏览器缓存进行设置, 一个是通过页面指令声明来设置, 另外一个是通过编程方式来设置.
    下面是相关页面设置Cache-Control头信息的几个简单配置:
    例一:
if ($request_uri ~* "^/$|^/search/.+/|^/company/.+/"`) {`
    add_header    Cache-Control  max-age=3600;
}

个人理解的max-age意思是:客户端本地的缓存,在配置的生存时间内的,客户端可以直接使用,超出生存时间的,到服务器上取新数据。当然这些还要看客户端浏览器的设置。
例二:

location ~ .*.(css|js|swf|php|htm|html )$ {
    add_header Cache-Control no-store;
}

例三:

location ~ .*.(js|css)$ {
    expires 10d;
}

例四: 将html结尾的请求加上no-cache

location / {
    access_log /data/nginx/log/xxx`.log api;`
    root /home/www/html`;`
    if ($request_filename ~ .*.(htm|html)$)
{
    add_header Cache-Control no-cache;
    }
}

注意事项

确保缓存策略不适用于所有资源。例如,对于用户个人信息或动态内容,应该始终设置为不缓存。
使用ETag或Last-Modified头部可以进一步提高缓存效率,这些头部可以帮助浏览器识别资源的更新情况。

结论

通过合理配置Nginx的客户端缓存策略,我们可以有效地提升前端资源的加载速度,减少服务器负载,从而提升整个Web应用的性能,可以显著提高Web应用的性能和用户体验。在配置缓存时,我们需要根据资源的更新频率和重要性来调整缓存时间,确保用户总是获取到最新的内容,同时减少不必要的服务器请求。通过细致的配置和优化,Nginx可以成为提升Web应用性能的强大工具。