前端开发者应当了解的 Web 缓存知识

   2016-07-13 0

缓存优点

通常所说的Web缓存指的是可以自动保存常见http请求副本的http设备。对于前端开发者来说,浏览器充当了重要角色。除此外常见的还有各种各样的代理服务器也可以做缓存。当Web请求到达缓存时,缓存从本地副本中提取这个副本内容而不需要经过服务器。这带来了以下优点:

  • 缓存减少了冗余的数据传输,节省流量
  • 缓存缓解了带宽瓶颈问题。不需要更多的带宽就能更快加载页面
  • 缓存缓解了瞬间拥塞,降低了对原始服务器的要求。
  • 缓存降低了距离延时, 因为从较远的地方加载页面会更慢一些。

缓存种类

缓存可以是单个用户专用的,也可以是多个用户共享的。专用缓存被称为私有缓存,共享的缓存被称为公有缓存。

私有缓存

私有缓存只针对专有用户,所以不需要很大空间,廉价。Web浏览器中有内建的私有缓存——大多数浏览器都会将常用资源缓存在你的个人电脑的磁盘和内存中。如Chrome浏览器的缓存存放位置就在:C:\Users\Your_Account\AppData\Local\Google\Chrome\User Data\Default中的Cache文件夹和Media Cache文件夹。

公有缓存

公有缓存是特殊的共享代理服务器,被称为缓存代理服务器或代理缓存(反向代理的一种用途)。公有缓存会接受来自多个用户的访问,所以通过它能够更好的减少冗余流量。
下图中每个客户端都会重复的向服务器访问一个资源(此时还不在私有缓存中),这样它会多次访问服务器,增加服务器压力。而使用共享的公有缓存时,缓存只需要从服务器取一次,以后不用再经过服务器,能够显著减轻服务器压力。

I_GG_YP_TT_5CQ3LPLKDK6

事实上在实际应用中通常采用层次化的公有缓存,基本思想是在靠近客户端的地方使用小型廉价缓存,而更高层次中,则逐步采用更大、功能更强的缓存在装载多用户共享的资源。

缓存处理流程

_R_X_GAK_B3S_D_Q4HQG
而对于前端开发者来说,我们主要跟浏览器中的缓存打交道,所以上图流程简化为:
_TGWF9OK_EXO2IOB5GMR_CY

下面这张图展示了某一网站,对不同资源的请求结果,其中可以看到有的资源直接从缓存中读取,有的资源跟服务器进行了再验证,有的资源重新从服务器端获取。

_I_0_Y_VNT3_HVCOAV_20W

注意,我们讨论的所有关于缓存资源的问题,都仅仅针对GET请求。而对于POST, DELETE, PUT这类行为性操作通常不做任何缓存

新鲜度限值

HTTP通过缓存将服务器资源的副本保留一段时间,这段时间称为新鲜度限值。这在一段时间内请求相同资源不会再通过服务器。HTTP协议中Cache-Control 和 Expires可以用来设置新鲜度的限值,前者是HTTP1.1中新增的响应头,后者是HTTP1.0中的响应头。二者所做的事时都是相同的,但由于Cache-Control使用的是相对时间,而Expires可能存在客户端与服务器端时间不一样的问题,所以我们更倾向于选择Cache-Control。

Cache-Control

下面我们来看看Cache-Control都可以设置哪些属性值:

  • max-age(单位为s)指定设置缓存最大的有效时间,定义的是时间长短。当浏览器向服务器发送请求后,在max-age这段时间里浏览器就不会再向服务器发送请求了。
<html>
  <head>
    <meta http-equiv="Content-Type" content="text/html; charset=utf-8">
    <meta name="viewport" content="width=device-width, initial-scale=1.0, maximum-scale=1.0, user-scalable=no" />
    <meta http-equiv="X-UA-Compatible" content="IE=EDGE" />
    <title>Web Cache</title>
    <link rel="shortcut icon" href=http://www.admin10000.com//document/"./shortcut.png">
    <script>
    script>
  
  
  
  
var http = require(http);
var fs = require(fs);
http.createServer(function(req, res) {
    if (req.url === / || req.url ===  || req.url === /index.html) {
        fs.readFile(./index.html, function(err, file) {
            console.log(req.url)
            //对主文档设置缓存,无效果
            res.setHeader(Cache-Control, "no-cache, max-age=" + 5);
            res.setHeader(Content-Type, text/html);
            res.writeHead(200, "OK");
            res.end(file);
        });
    }
    if (req.url === /cache.png) {
        fs.readFile(./cache.png, function(err, file) {
            res.setHeader(Cache-Control, "max-age=" + 5);//缓存五秒
            res.setHeader(Content-Type, images/png);
            res.writeHead(200, "Not Modified");
            res.end(file);
        });
    }
    
}).listen(8888)

当在5秒内第二次访问页面时,浏览器会直接从缓存中取得资源

O_KPE_I_OPPVT0NW2E_8IL

  • public 指定响应可以在代理缓存中被缓存,于是可以被多用户共享。如果没有明确指定private,则默认为public。
  • private 响应只能在私有缓存中被缓存,不能放在代理缓存上。对一些用户信息敏感的资源,通常需要设置为private。
  • no-cache 表示必须先与服务器确认资源是否被更改过(依靠If-None-Match和Etag),然后再决定是否使用本地缓存。
    如果上文中关于cache.png的处理改成下面这样,则每次访问页面,浏览器都需要先去服务器端验证资源有没有被更改。

    fs.readFile(./cache.png, function(err, file) {
            console.log(req.headers);
            console.log(req.url)
            if (!req.headers[if-none-match]) {
                res.setHeader(Cache-Control, "no-cache, max-age=" + 5);
                res.setHeader(Content-Type, images/png);
                res.setHeader(Etag, "ffff");
                res.writeHead(200, "Not Modified");
                res.end(file);
            } else {
                if (req.headers[if-none-match] === ffff) {
                    res.writeHead(304, "Not Modified");
                    res.end();
                } else {
                    res.setHeader(Cache-Control, "max-age=" + 5);
                    res.setHeader(Content-Type, images/png);
                    res.setHeader(Etag, "ffff");
                    res.writeHead(200, "Not Modified");
                    res.end(file);
                }
            }
    
        });

    AH_NV6A_NCY2HU_QN0J_SJ
  • no-store 绝对禁止缓存任何资源,也就是说每次用户请求资源时,都会向服务器发送一个请求,每次都会下载完整的资源。通常用于机密性资源。

  关于Cache-Control的使用,见下面这张图(来自大额

181841016351634

客户端的新鲜度限值

Cache-Control不仅仅可以在响应头中设置,还可以在请求头中设置。浏览器通过请求头中设置Cache-Control可以决定是否从缓存中读取资源。这也是为什么有时候点击浏览器刷新按钮和在地址栏回车,在NetWork模块中看到完全不同的结果

U_AON_N_XO_AX_P_U0B

Expires

不推荐使用Expires,它指定的是具体的过期日期而不是秒数。因为很多服务器跟客户端存在时钟不一致的情况,所以最好还是使用Cache-Control.

服务器再验证

浏览器或代理缓存中缓存的资源过期了,并不意味着它和原始服务器上的资源有实际的差异,仅仅意味着到了要进行核对的时间了。这种情况被称为服务器再验证。

  • 如果资源发生变化,则需要取得新的资源,并在缓存中替换旧资源。
  • 如果资源没有发生变化,缓存只需要获取新的响应头,和一个新的过期时间,对缓存中的资源过期时间进行更新即可。
    HTTP1.1推荐使用的验证方式是If-None-Match/Etag,在HTTP1.0中则使用If-Modified-Since/Last-Modified。

Etag与If-None-Match

根据实体内容生成一段hash字符串,标识资源的状态,由服务端产生。浏览器会将这串字符串传回服务器,验证资源是否已经修改,如果没有修改,过程如下(图片来自浅谈Web缓存):

60HQ8__TL_6I_P_0Q15O7
__X_T_T_GHESYFLERGV52_9

上文的demo中我们见到过服务器端如何验证Etag:

FXKDYMGEYA4_M__CHTVENT2

由于Etag有服务器构造,所以在集群环境中一定要保证Etag的唯一性

If-Modified-Since与Last-Modified

这两个是HTTP1.0中用来验证资源是否过期的请求/响应头,这两个头部都是日期,验证过程与Etag类似,这里不详细介绍。使用这两个头部来验证资源是否更新时,存在以下问题:

  • 有些文档资源周期性的被重写,但实际内容没有改变。此时文件元数据中会显示文件最近的修改日期与If-Modified-Since不相同,导致不必要的响应。
  • 有些文档资源被修改了,但修改内容并不重要,不需要所有的缓存都更新(比如代码注释)

关于缓存的更新问题,请大家看看这里张云龙的回答,本文就不详细展开了。
本文demo代码如下:

<!DOCTYPE HTML>
<html>
  <head>
    <meta http-equiv="Content-Type" content="text/html; charset=utf-8">
    <meta name="viewport" content="width=device-width, initial-scale=1.0, maximum-scale=1.0, user-scalable=no" />
    <meta http-equiv="X-UA-Compatible" content="IE=EDGE" />
    <title>Web Cache</title>
    <link rel="shortcut icon" href=http://www.admin10000.com//document/"./shortcut.png">
    <script>
    script>
  
  
  
  
var http = require(http);
var fs = require(fs);
http.createServer(function(req, res) {
    if (req.url === / || req.url ===  || req.url === /index.html) {
        fs.readFile(./index.html, function(err, file) {
            console.log(req.url)
            //对主文档设置缓存,无效果
            res.setHeader(Cache-Control, "no-cache, max-age=" + 5);
            res.setHeader(Content-Type, text/html);
            res.writeHead(200, "OK");
            res.end(file);
        });
    }
    if (req.url === /shortcut.png) {
        fs.readFile(./shortcut.png, function(err, file) {
            console.log(req.url)
            res.setHeader(Content-Type, images/png);
            res.writeHead(200, "OK");
            res.end(file);
        })
    }
    if (req.url === /cache.png) {
        fs.readFile(./cache.png, function(err, file) {
            console.log(req.headers);
            console.log(req.url)
            if (!req.headers[if-none-match]) {
                res.setHeader(Cache-Control, "max-age=" + 5);
                res.setHeader(Content-Type, images/png);
                res.setHeader(Etag, "ffff");
                res.writeHead(200, "Not Modified");
                res.end(file);
            } else {
                if (req.headers[if-none-match] === ffff) {
                    res.writeHead(304, "Not Modified");
                    res.end();
                } else {
                    res.setHeader(Cache-Control, "max-age=" + 5);
                    res.setHeader(Content-Type, images/png);
                    res.setHeader(Etag, "ffff");
                    res.writeHead(200, "Not Modified");
                    res.end(file);
                }
            }
            
        });
    }
    
}).listen(8888)
 
标签: 缓存 前端
反对 0举报 0 评论 0
 

免责声明:本文仅代表作者个人观点,与乐学笔记(本网)无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
    本网站有部分内容均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责,若因作品内容、知识产权、版权和其他问题,请及时提供相关证明等材料并与我们留言联系,本网站将在规定时间内给予删除等相关处理.

  • javascript设计模式学习之四——单例模式,缓存
    单例模式的定义:确保一个实例,并提供全局访问。惰性单例的定义:只在需要的时候才创建对象。在开发中,有些对象往往只需要一个,比如线程池、全局缓存、浏览器中的window对象等。java中的单例关键在于使用一个变量来标志当前是否为某个类创建过对象。public
    03-08
  • selenium Firefox禁用js,css.falsh,缓存,设置
    1 profile = FirefoxProfile() 2 #请求头 3 #profile.set_preference("general.useragent.override", util.http_agent_insert(xinhuaUtil.agent_path)) 4 # 激活手动代理配置(对应着在 profile(配置文件)中设置首选项) 5 profile.set_preference("network
    03-08
  • vue日历/日程提醒/html5本地缓存 vue日历组件如何显示节日
    vue日历/日程提醒/html5本地缓存 vue日历组件如
    先上图 功能:1、上拉日历折叠,展示周2、左右滑动切换月2、“今天”回到今天;“+”添加日程3、localStorage存储日程index,htmlbody  div id="app" v-cloak @mousedown="down" @mouseup="heightChange"    !--日历--    div id="calendar"   
    03-08
  • angular ui-router 缓存问题
    在个别情况下$state.go()路径和参数完全相同的时候页面因为缓存问题可以直接跳转,但是不能重新获取数据通过路由参数可以解决路由.state('app.***.***', {url: '/addWorkExp/:type',templateUrl: 'views/***/***-***-***.html',controller: '*****',isNeedAut
    03-08
  • jQuery源代码学习之六——jQuery数据缓存Data
    一、jQuery数据缓存基本原理  jQuery数据缓存就两个全局Data对象,data_user以及data_priv;    这两个对象分别用于缓存用户自定义数据和内部数据;    以data_user为例,所有用户自定义数据都被保存在这个对象的cache属性下,cache在此姑且称之为自
    03-08
  • 【Web缓存机制概述】4 – HTML5时代的Web缓存
    ====索引=====【Web缓存机制概述】1 – Web缓存的作用与类型【Web缓存机制概述】2 – Web浏览器的缓存机制【Web缓存机制概述】3 – 如何构建可缓存站点【Web缓存机制概述】4 – HTML5时代的Web缓存机制【Web缓存机制概述】5 – Web App时代的缓存机制新思路==
    03-08
  • 解决Html页面缓存 html5缓存
    对于一个html页面,缓存分3部分,一个是页面内容,一个是css样式,一个是JS文件CSS和JS文件缓存link rel="stylesheet" type="text/css" href="css/index.css" /改为link rel="stylesheet" type="text/css" href="css/index.css?version=1.0.1" /每次修改后改
    03-08
  • 解决html 图片缓存问题
    问题:上传一张图片,通过js更新src属性刷新图片使其即时显示时, 当img的src当前的url与上次地址无变化时(只更改图片,名称不变,不同图片名称相同)图片不变化(仍显示原来的图片) 但通过firebug看图片已经变化,因为当src的地址不变时浏览器不会重新加载
    03-08
  • react实现组件状态缓存的示例代码
    目录前言一、安装第三方库二、配置操作总结前言在移动端中,用户访问了一个列表页,上拉浏览列表页的过程中,随着滚动高度逐渐增加,数据也将采用触底分页加载的形式逐步增加,列表页浏览到某个位置,用户看到了感兴趣的项目,点击查看其详情,进入详情页,从
    03-08
  • webpack 的第三方库分离并持久化缓存
    webpack 的第三方库分离并持久化缓存
    我们常常需要在浏览器缓存一些稳定的资源,如第三方库等。要达到这个目标,只需要两步:1、提取出“稳定的资源”;2、提供稳定的文件hash 。 处理后的出的文件就像这样子: app.1w3ad4q4.js,然后,我们设置它的缓存规则为永不过期。这样,当文件没有改动时
    02-08
点击排行