最近总有人问 为什么手机上出现奇怪广告 没错 流量劫持惹的祸。下面针对流量劫持做一个知识普及。
流量劫持划分成3大部分:DNS劫持
、数据劫持
、劫持监控
。
DNS劫持:
首先聊聊这个,域名劫持是互联网一种攻击方式,通过攻击 DNS服务器 或者 伪造DNS 服务器方法,把目标服务器网站域名解析到错误地方,让用户无法正常访问真正的地址。
这里提问一个问题:那么 DNS是如何工作的呢?
客户端访问服务端的时候,首先要根据域名获取对应的IP地址,这一步要在 DNS服务器进行获取。请求DNS服务器的时候,需要通过UDP协议去寻找当地网络的运营商提供的公共域名服务器中查找IP。
如果没有找到,就会继续请求上级域名服务器进行处理,一直到返回IP为止。
域名劫持,即使是在请求 DNS解析域名时候出现的问题,目标域名被恶意解析到其他IP地址,造成用户无法正常使用服务。
为了减少 DNS 查询时间,HTTP协议栈中会缓存域名解析:
浏览器可能会缓存域名解析。
用户系统中的域名映射表(hosts)会缓存域名解析。
公共域名服务器通常由 ISP(互联网服务商)提供。
公共域名服务器会缓存上一级域名服务器的结果。
公共域名服务器 TTL 到期后,会向顶级域名服务器获取信息。
那么再提一个问题:如何污染 DNS?
常见的污染 DNS 方式有:
篡改 Hosts 文件;
污染中间链路设备(路由器等);
修改 UDP内容,影响 DNS查询的结果;
入侵 DNS服务器(成本高)。
那么再提一个问题:如何抵御 DNS 劫持?
解决域名劫持的一个办法就是绕开安全性较差的 UDP协议,通过一个可信的源头来解析域名,解析方式不需要拘泥于 UDP协议,也可以通过 HTTP方式。
在 TLS 协议之上传输 DNS内容;
用 HTTP协议来传输 DNS;
用 HTTPS协议来传输 DNS;
使用自己维护的 DNS服务器(成本高)。
数据劫持:
接下来聊聊数据劫持,数据劫持最基本针对明文传输的内容发生。用户发起 HTTP请求,服务器返回页面时候,经过中间的运营商网络,页面内容的篡改或者内容加塞,强行插入弹窗或者广告。
那么问题又来了:如何抵御数据劫持?
目前行业内解决的办法是对内容进行 HTTPS加密,实现密文传输,彻底避免劫持问题。MD5校验同样能起到防止数据劫持的作用,MD5校验是指内容返回前,应用层对返回的数据进行校验,生成校验值。
同时内容接收方接收到内容后,也对内容进行校验,同样生成校验值,将这俩个校验值进行对比,倘若一致,则证明判断数据无劫持。
注意:HTTPS 也能被运营商劫持
1、伪造证书,通过病毒或者其他方式将伪造证书的根证书安装在用户系统中(较少)。
2、代理也有客户的证书与私钥,或者客户端与代理认证的时候不校验合法性,即可通过代理来与我们服务端进行数据交互(较多)。
下面说几款方法对数据劫持起到监控作用,但是并不能对劫持后的页面进行修复。
Content-Security-Policy (CSP)
实质就是白名单制度,开发者明确告诉客户端,哪些外部资源可以加载和执行,等同于提供白名单。它的实现和执行全部由浏览器完成,开发者只需提供配置。
指定每种资源类型可以加载执⾏的条件。
还可以防御 XSS 攻击。
也可以⽤于强迫资源使用 HTTPS 加载,降低劫持可能性。
两种方式开启 CSP:
// 通过 http 头信息
Content-Security-Policy: default-src https:
// 通过 meta 标签
缺点:
由于 CSP 标识本身存在于 HTML 标签或者 HTTP 请求头中,可以被攻击者可以直接移除掉。
规则⽐较复杂。
影响动态创建脚本的使⽤。
Subresource Integrity (SRI)
将使用 base64 编码过后的文件哈希值写入你所引用的
如果校验不成功,则不会执行对应的 script 或 link 内容。
缺点:
由于 SRI 标识 本身存在于 HTML 标签中,可以被攻击者可以直接移除掉。
影响动态创建脚本的使⽤。
校验失败时影响可⽤性。
兼容性有限,iOS Safari 不支持
劫持监控:
此方案参考了美团点评 2018 前端分享上的防治方案。
⽅案 A:在某些省份、地区⾃建监测站,定期抓取固定资源(资源太固定,监测站数量也远远不够)。
⽅案 B:业务⽅在⾃己的 HTML 中监听资源的 Error 事件(⽆法确认问题在于劫持,也可能只是普通的 JS 出错)。
⽅案 C:使⽤用第三⽅方企业服务进⾏监控(服务越多成本越⾼)。
⽅案 D:CSP、SRI(兼容性和灵活性差,⽆法进行⾃定义逻辑)。
上述方案可以看出,无论哪种方案,都有它的不足,于是搭建了下图的方案:
浏览器下载-》信息发送-》服务器下载-》信息对比
优势如下:
监控的级别是业务级甚至页面级,而不是某个固定的资源。
在业务方的 Node.js 中内置逻辑,给予了业务方自己进行降级和响应的能力。
监控层如果出现故障,不影响业务方的代码执行。
总结:
DNS 劫持是属于违法行为,已经在严厉打击,为了我们干净安全的上网浏览环境,我们也要做好一系列预防措施。