CDN加速

产品动态 > 正文

春运抢不到票要怪它 三大“反爬”妙招看这里!

2020-01-08

临近春节,一年一度的大型纪录片《春运》即将如期上映,春运不仅被称为“全球最大规模的人口迁徙”,同时也是各类抢票大战的年底终局之役。

网宿科技:深耕云分发平台 开拓运营商市场

然而,我们都经历过,想买的票一开售就秒空,不禁要发问:“怎么一放票,票就没了?!”

朋友,你听说过“爬虫”吗?
你知道每年春运,12306被“爬虫”点成什么样子了吗?
公开数据是这么说的——

“最高峰时一天内页面浏览量达813.4亿次,1小时最高点击量59.3亿次,平均每秒164.8万次。”

在每秒164.8万次点击背后,不仅是全国人民急切的回家之心,还有黄牛带来的天量点击。

那么,黄牛是如何利用“爬虫”实现抢票的呢?

黄牛利用爬虫技术,提高查票频率和验证码辨识速度,一旦监测到余票就迅速锁定,并通过高速填写用户信息和自动识别验证码以达到抢占票源的目的。

我们今天就从登陆、查询、购票三个环节来拆解下,黄牛为什么那么快?!

普通用户VS技术党黄牛抢票实战对决

网宿科技:深耕云分发平台 开拓运营商市场

Round 1:登录
普通用户:手动输入用户名和密码,至少需要10秒。

技术党黄牛:多线程批量登录,最快能达到100毫秒。

网宿科技:深耕云分发平台 开拓运营商市场

Round 2:查询
普通用户:开始放票后手动查询目的地、日期、车次,耗费时间直接影响占票结果。

技术党黄牛:毫秒级查询速率,余票实时监控;采用大数据分析技术,预估哪些路段、哪些车次需求最旺盛,率先占票。

网宿科技:深耕云分发平台 开拓运营商市场

Round 3:购买
一些热门车票在支付时需要识别验证码,如果你碰巧遇到了,那这张车票钱暂时可以省了…

普通用户:“人眼识别技术”。有数据表明,某购票平台的验证码一次性输入正确的比例为8%,两次输入准确的比例为27%,按照热门车票“秒光”的情况计算,每输错一次验证码,就意味着当次购票成功率下降80%左右。

技术党黄牛:采用机器视觉技术自动打码,成功率可达99%。

网宿科技:深耕云分发平台 开拓运营商市场

黄牛深谙“天下武功,唯快不破”,利用爬虫这一利器自动登录账号,快速通过验证,迅速锁定目标票源,整个流程最快仅需3秒钟,而手动购票最快也要1分钟。

其实不仅仅是火车票,黄牛党也特别青睐航空票务网站,他们利用爬虫不断刷新航空票务接口,一旦出现低价的票,“爬虫”即刻利用虚假客源身份进行批量预定但不实际支付,以达到抢占低价票源的目的,最后实现该低价票的加价转售。

然而,对于航空、火车和各类代理票务网站而言,“黄牛”刷票请求会导致服务器负载飙升,轻则影响业务响应速度,重则导致系统无法正常运行,更严重的会影响票务机构的正常运营,造成相关公司对市场做出错误判断,进而影响后续一系列的决策。而正常购票者无法顺利购票,同样也会对票务机构的运营和声誉造成负面影响。

网宿Bot Guard打造“除虫”神器

如何更好的与技术党黄牛对抗,让真正的用户买到票,关键点在于如何精准识别并管理真实用户流量与爬虫流量。

网宿业务安全(Bot Guard)通过自身大数据的优势,将全网数据流量作为样本输入到大数据分析平台,能识别和区分不同爬虫程序类型,并针对性采用最合适的管理策略,从而实现对爬虫程序及业务运营带来的风险问题的管控。

Bot Guard三大“除虫”技能

网宿科技:深耕云分发平台 开拓运营商市场

技能一:采用精细化访问控制策略,除频控措施外还可基于 IP、URL、User-agent、HTTP 请求头等多个维度管理访问请求,满足不同应用场景的访问控制需求,过滤低级爬虫。

技能二:“聪明”的爬虫会通过低频访问、构建随机请求头和模拟浏览器行为等手段绕过第一道防线,而Bot Guard凭借“蜜罐”诱导、客户端特性识别、交互合法性验证等策略,可以有效识别并捕获这些高级爬虫。

**技能三:**近年来,恶意爬虫攻击不断向智能化方向发展,越来越接近人的访问行为。Bot Guard基于全网威胁情报和攻防数据不断优化爬虫管理策略,并结合机器学习形成动态变化、实时纠错的防护模型,以应对最新型的恶意爬虫攻击。