8月6日消息,近日,负责支持和保护网络生活的云服务提供商Akamai发布的最新SOTI报告《侵蚀您的利润:网络爬虫程序对电商行业有何影响》显示,在针对电商网站的69亿次请求进行分析时发现,人类访问行为占据了49%,即接近一半的访问量来自真实用户,而剩余的略多于一半则是由各类机器人“爬虫”完成的。其中,高风险类别的爬虫占据了总爬虫活动的27%,它们对企业的运营构成了严重威胁,可能执行诸如撞库、数据窃取、库存恶意抓取等恶意行为。
爬虫是“Robot”(机器人)的缩写,它是一段能够模拟正常用户行为的代码。与浏览器不同,爬虫在执行任务时更为高效且针对性强,能够迅速抓取目标信息。
业内根据爬虫行为性质与影响,将爬虫分为几大类:善意的爬虫如搜索引擎,它们为信息流通与检索提供了便利;中性爬虫往往很嘈杂,尽管它们仍然是合法的;它们实际上是好机器人的一个子类别,包括不断发送请求的合作伙伴机器人和其他频繁调用程序API的机器人;而有害的爬虫,则可能从事撞库攻击、库存抓取等恶意行为,严重损害企业利益与安全。
那么,在电商环境中,不法分子如何利用爬虫技术从中获利呢?
通过爬虫技术来抢购“全网最低价”商品,进而倒卖赚取差价,是其中重要的一种获利方式。首先,爬虫会广泛搜集销售这些产品的网站数据,包括价格、库存等关键信息。随后,通过对比分析,找出价格最优、优惠力度最大的电商平台。基于这些信息,不法分子可能在另一个平台上开设店铺,以准新或全新未开封的产品进行转售,利用价格优势实现盈利。
当然,爬虫带来的问题远不止于此。对于电商网站而言,由于爬虫与真实用户的访问量相当,且爬虫通常部署在云端或高性能服务器上,其访问效率远超普通用户。这导致电商网站在处理爬虫请求时可能消耗大量资源,进而影响正常用户的访问体验,降低网站转化率。此外,爬虫还可能干扰市场营销分析工具的数据收集,导致决策依据失真。更糟糕的是,某些爬虫专注于抓取特定产品页面的深层链接,可能导致这些页面因请求量过大而无法正常服务。
本文转载自TechWeb,转载目的在于传递更多信息,并不代表本站赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请联系TechWeb通知我方删除,我方将在收到通知后第一时间删除内容!本文只提供参考并不构成任何投资及应用建议。本站拥有对此声明的最终解释权。