简介:CDN是通过在全球范围内分布式地部署边缘服务器将各类互联网内容缓存到靠近用户的边缘服务器上,从而降低用户访问时延并大幅减少穿越互联网核心网的流量。互联网业务使用CDN已经成为一种必然的选择。
CDN是通过在全球范围内分布式地部署边缘服务器将各类互联网内容缓存到靠近用户的边缘服务器上,从而降低用户访问时延并大幅减少穿越互联网核心网的流量。互联网业务使用CDN已经成为一种必然的选择。传统网站防护基本上都是保护源站,客户购买防火墙、WAF等产品就可以保护自己核心业务的内容不被恶意窃取。但传统防护方式并不能完全满足业务流量通过CDN分发的场景:
CDN当前承接了主站大量业务,也必然要保证业务浏览和交易体验,防止内容不被恶意窃取。越来越多的业务数据缓存在CDN的边缘服务器上,边缘安全的权重越来越高。而基于边缘云的机器流量管理应运而生,应对CDN边缘安全隐患,实现用户应用数据安全保护。
基于CDN边缘节点的机器流量管理分析及处理流程如下图所示:
互联网访问一般分为用户正常,商业搜索引擎访问,恶意爬虫访问等,机器流量管理通过在边缘提取请求报文特征,基于报文特征识别请求类型,在边缘阻断恶意爬虫访问,保护CDN上缓存资源不被恶意爬取。
机器流量管理的优势如下:
在双11业务场景,机器流量管理针对访问主站详情页的全部流量做识别,并对?Bot?流量进行细化分类。核心策略是放行搜索引擎等正规商业爬虫,限制或拦截恶意爬虫。
通过分析详情页的流量以及请求的行为特征,分析出近40%的请求都是恶意访问。在双11前,通过开启了处置策略,成功帮助主站某业务拦截了超过70%的爬虫流量。下图为开启处置前后的流量对比情况,蓝线为未开启处置策略是的流量趋势,绿线为开启处置策略后的流量趋势,拦截效果非常明显,并且不影响实际业务运行。
双11当日,基本上请求的访问特征没有变化,最终拦截数亿次恶意请求、上百万恶意IP及数千万恶意爬取商品ID。
CDN机器流量管理承担更多主站业务的防护,并且发现部分爬取主站内容的请求可以透过防护策略,即爬取的请求行为发生了变化。通过对线上突增qps分析,定位出变异爬虫主要使用的是IE的浏览器引擎,源IP大量使用秒拨代理IP,具有明显的商业爬虫特征。经上报,快速形成了应急预案,快速对异常类型进行处置。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
域名 如何进行实名认证?根据ICANN要求:域名持有者必须确保所有信息的真实、准...
TOP云(zuntop.com)科技6月8日消息 从功能方面和性能方面对Xen和KVM对比分析,...
如今,随着云时代的到来,云数据中心也变得炙手可热,相比之下,传统数据中心将...
自适应布局在实际应用中越来越普遍了,今天分享几个自适应布局的demo,主要是浮...
背景 在公司参与一个原生APP和h5混合开发的项目,本人在项目中负责h5部分,现将...
01. Infinity 字体下载 02. Banda 字体下载 03. Roll Up 字体下载 04. Movavi 字...
当在设计时设置了DataGrid 控件的 DataSource 属性后,就会用数据源的记录集来自...
Dreamweaver使用临时文件将一些未经保存的数据传输至其它应用程序中,例如用户可...
假设有这么一个初始代码: !DOCTYPE htmlhtml lang=enhead meta charset=UTF-8 me...
解决方法有两种: 一种是CSS,使用background-size:cover实现图片的拉伸效果,但...