报告解读 > 正文

让你深恶痛绝的个人数据泄露,背后都藏着它的身影

2021-07-12

近日,网宿科技联合数世咨询正式发布《2020中国互联网安全报告》,《报告》显示2020年网络攻击呈倍数激增,网络安全形势愈加严峻。借此,我们推出了系列报告解读,以帮助行业客户了解网络安全趋势及制定应对策略。

随着《中华人民共和国数据安全法》正式颁布,我国迎来第一部数据安全领域的基础性法律。数据安全的话题,引起舆论持续关注和热议。

《数据安全法》要求,“任何组织、个人收集数据,应当采取合法、正当的方式,不得窃取或者以其他非法方式获取数据。”

然而,在大数据时代背景下,每个人的隐私数据已变得格外脆弱,随时可能被网络黑产窥探。你是否也遇到过这些情况:教辅机构比你还快知道你的考试成绩、电信诈骗分子可以准确地报出你刚买的航班信息、刚看完房贷款机构的电话就来了……

黑产快速大批量抓取个人数据,通常会用到一种工具——网络爬虫。爬虫程序能够模拟人的行为在互联网上进行自动化探测,对特定数据信息进行抓取,效率极高。

一些网络黑客、不合规的大数据公司,通过恶意爬虫从各大网站甚至公共服务平台上未授权、大批量爬取用户姓名、联系方式、住址、社保、公积金、履历、出行、社交、通信记录、电商消费记录等各类公民个人信息,将其打包售卖以获取非法利益。

NGB指的是什么

除了对个人信息的非法采集,恶意爬虫攻击还“活跃”各种各样的场景中,如:商家爬取竞争对手价格策略、内容社区盗用其他网站UGC内容、羊毛党抢券、黄牛抢票、水军刷评论等,影响正常的商业秩序。

那么,过去一年,恶意爬虫攻击已经发展到了什么程度,呈现出什么样的态势呢?

平均每秒发生1000余次爬虫攻击请求

NGB指的是什么

2020年的恶意爬虫攻击数量走势显示,自3月份疫情得到控制、复工复产以来,攻击数量一路飙升,并在11月份达到全年的最高峰。这其中,超过两成的恶意爬虫攻击瞄准了电子商务(12.46%)和零售行业(9.64%)。

和2020年上半年一致的是,电子制造和软件信息服务行业继续占据第一的位置,是遭受恶意爬虫攻击最严重的行业(23.79%)。紧随其后的是影视和传媒咨询(13.26%)、电子商务(12.46%)、游戏(11.05%)、零售(9.64%)和交通运输(8.98%)。

根据网宿科技联合数世咨询近日发布的《2020年中国互联网安全报告》(下简称《报告》)显示,2020年网宿安全平台共检测并拦截了358.54亿次爬虫攻击请求,平均每秒1133.81次,是2019年的3倍,呈倍增态势。

NGB指的是什么

各行业爬虫攻击的强度与行业发展程度紧密相关。与往年相比,2020年1月至4月交通运输行业爬虫攻击数量下降明显,这是由于疫情期间的返乡、旅游、出行限制使相关业务停摆所致。

而根据2020年全年的数据显示,2020年针对交通运输行业的恶意爬虫攻击次数是2019年的2.16倍,这说明自生产复工、解除交通管制后,抢票类爬虫软件迅速复苏,并且加倍活跃。

NGB指的是什么

《报告》还分析了恶意爬虫的攻击来源。网宿安全平台检测并拦截的源IP分布显示,2020年全年的恶意爬虫攻击90%以上来自于中国大陆,来源于海外的攻击仅占9.99%,相比2019年的35.28%下降了超过25个百分点。海外攻击的显著减少与新冠疫情、国际关系变化以及信息管制等多方面因素相关。

NGB指的是什么

此外,根据《报告》显示的境内数据,来自江苏省(9.92%)的爬虫攻击源IP超过了700万个,位列2至4名的浙江省(8.97%)、广东省(7.15%)和山东省(6.83%)的爬虫攻击源也均超过了500万个。

爬虫无处不在 管理刻不容缓

以上种种数据表明,恶意爬虫a攻击的爆发式增长已经对社会生活造成了显著影响。

其一,人们的个人信息、商家的商业数据还在被未授权的恶意爬虫过度爬取,非法售卖,致使个人隐私受到侵害、市场秩序也受到影响。

其二,羊毛党、黄牛党等黑产中间商通过爬虫自动化抢券、抢票、抢秒杀,速度对于人力来说是降维打击。这种行为不仅抢占了普通消费者公平竞争的机会,而且对于商家而言,促销活动带来的新客和订单大部分来自羊毛党,无疑意味着巨额营销投入打了水漂。消费者和商家都深受影响,却最终让这些黑产中间商从中获利。

其三,恶意爬虫作为一种高频操作的自动化工具,能够为网站带来大量的并发请求量,尤其当爬虫攻击与网站促销等业务高峰期并行时,常常引起服务器负荷过大,导致网站响应速度缓慢,甚至宕机,严重影响网站平台的业务运行。

好在,专业的网络安全服务商可以帮助企业解决爬虫攻击问题。

NGB指的是什么

作为网络安全产业的深耕者,网宿科技基于多年实战经验打造的爬虫管理(Bot Guard)解决方案能够为各行业客户提供有效的多场景安全防护。网宿爬虫管理(Bot Guard)产品,基于大数据、人机交互验证、机器学习等智能识别与检测技术,实时检测,分析并精准识别各类Bot流量,以保障企业业务稳定运行,保持竞争优势。(更多详情,可至网宿科技官网了解。)

接下来,我们将陆续推出此次《报告》的系列解读,敬请关注。更多数据与干货,点击阅读原文,即可查看完整报告。