
不同的浏览器会用不同的用户代理字符串作为自身的标志,当搜索引擎在通过网络爬虫访问网页时,也会通过用户代理字符串来进行自身的标示,这也是为何网站统计报告能够统计浏览器信息,爬虫信息等。网站需要获取用户客户端的信息,了解网站内容在客户端的展现形式,一些网站通过判断UA来给不同的 *** 作系统,不同的浏览器发送不同的页面,不过这也可能造成某些页面无法在某个浏览器中正常显示
我们可以获取随机User-Agent与使用,用上了随机User-Agent和代理IP大部分网站就没有什么问题了,但还是会出现一些反扒措施比较厉害的网站,还需要使用爬虫代理IP来破除IP限制的。
欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)