首页>>资讯>>常见问题 > 很多企业网站搜索引擎爬虫被封禁常见原因列表

很多企业网站搜索引擎爬虫被封禁常见原因列表

资讯分类：常见问题 | 文章编辑：小马哥 | 发布日期：2020-01-19 | 浏览量：3760次

确实，通过这些原本主要是用来显示网站的服务运行 Python 脚本有点儿复杂。比如，你可能会发现网络爬虫运行时网站的加载速度变慢了。其实，在整个采集任务完成之前页面都是不会加载的（得等到所有“print”语句的输出内容都显示完）。这可能会消耗几分钟，几小时，甚至永远也完成不了，要看程序的具体情况了。虽然它最终一定能完成任务，但是可能你还想看到实时的结果，这样就需要一台真正的服务器了。

从云主机运行

虽然云计算的花费可能是无底洞，但是写这篇文章时，启动一个计算实例最便宜只要每小时 1.3 美分（亚马逊 EC2 的 micro 实例，其他实例会更贵），Google 最便宜的计算实例是每小时 4.5 美分，最少需要用 10 分钟。考虑计算能力的规模效应，从大公司买一个小型的云计算实例的费用，和自己买一台专业实体机的费用应该差不多——不过用云计算不需要雇人去维护设备。

设置好计算实例之后，你就有了新 IP 地址、用户名，以及可以通过 SSH 进行实例连接的公私密钥了。后面要做的每件事情，都应该和你在实体服务器上干的事情一样了——当然，你不需要再担心硬件维护，也不用运行复杂多余的监控工具了。

总结

爬虫被封禁常见原因列表

如果你一直被网站封杀却找不到原因，那么这里有个检查列表，可以帮你诊断一下问题出在哪里。

首先，检查 JavaScript 。如果你从网络服务器收到的页面是空白的，缺少信息，或其遇到他不符合你预期的情况（或者不是你在浏览器上看到的内容），有可能是因为网站创建页面的JavaScript 执行有问题。

检查正常浏览器提交的参数。如果你准备向网站提交表单或发出POST请求，记得检查一下页面的内容，看看你想提交的每个字段是不是都已经填好，而且格式也正确。用 Chrome 浏览器的网络面板（快捷键 F12 打开开发者控制台，然后点击“Network”即可看到）查看发送到网站的POST命令，确认你的每个参数都是正确的。

是否有合法的 Cookie？如果你已经登录网站却不能保持登录状态，或者网站上出现了其他的“登录状态”异常，请检查你的 cookie。确认在加载每个页面时 cookie 都被正确调用，而且你的 cookie 在每次发起请求时都发送到了网站上。

IP 被封禁？如果你在客户端遇到了 HTTP 错误，尤其是 403 禁止访问错误，这可能说明网站已经把你的 IP 当作机器人了，不再接受你的任何请求。你要么等待你的 IP 地址从网站黑名单里移除，要么就换个 IP 地址（可以去星巴克上网）。如果你确定自己并没有被封杀，那么再检查下面的内容。

确认你的爬虫在网站上的速度不是特别快。快速采集是一种恶习，会对网管的服务器造成沉重的负担，还会让你陷入违法境地，也是 IP 被网站列入黑名单的首要原因。给你的爬虫增加延迟，让它们在夜深人静的时候运行。切记：匆匆忙忙写程序或收集数据都是拙劣项目管理的表现；应该提前做好计划，避免临阵慌乱。

还有一件必须做的事情：修改你的请求头！有些网站会封杀任何声称自己是爬虫的访问者。如果你不确定请求头的值怎样才算合适，就用你自己浏览器的请求头吧。

确认你没有点击或访问任何人类用户通常不能点击或接入的信息。

如果你用了一大堆复杂的手段才接入网站，考虑联系一下网管吧，告诉他们你的目的。试试发邮件到 webmaster@< 域名 > 或 admin@< 域名 >，请求网管允许你使用爬虫采集数据。管理员也是人嘛！

返回首页了解更多建站资讯

资讯分类

卓商网-联系方式

东莞公司
服务热线：0769-89801111(总机)
地址：东莞市南城区莞太路60号星鹏商务大厦B座8楼

深圳公司
服务热线：400-800-2455(免长途费)
地址：深圳市龙岗区布吉街道大都汇大厦B座1605室

惠州公司
服务热线：13549397005(陈婷)
地址：惠州市惠城区麦科特大道69号达利大厦1807室

广州公司
服务热线：18607694001(马先生)
地址：广东省广州市白云区机场路汇创意产业园A4栋206室

湖南公司
服务热线：18607314008(胡先生)
地址：湖南长沙市岳麓区学士路8号含浦科教综合楼601室

—— 卓商网微信公众号 ——

关于卓商网

卓商网一直秉承专业、诚信、服务、进取的价值观，坚持优秀的商业道德，以用户价值为导向，向用户提供优质产品和优质服务，从而赢得了用户的信赖。自2009年以来公司业务范围包括广东东莞、深圳、广州、佛山、中山、惠州、珠海以及一线城市长沙、重庆、北京、上海，全国各地接受异地服务商的公司企业或者机构。卓商网络推广服务商始终以不懈的努力、更高的目标来要求自己。

我们的优势

11年专业互联网服务经验

东莞高端建站设计团队

资深行业分析策划

B2C营销型网站建设领先者

前沿视觉设计、研发能力

前端代码深度符合SEO优化

广东资深网络营销推广公司

具有完备的项目管理

完善的售后服务体系

深厚的网络运营经验

时刻新技术领先研发能力

10个网站系统软件著作权

我们的不同

致力于互联网品牌建设与网络营销，专业领域包括网站建设、电子商务、移动互联网营销、微信小程序商城及系统平台开发等，卓商网研发中心拥有一支由多名网络安全专家、软件工程和项目管理专家、网站建设策划专家，为不同类型的客户提供良好的互联网应用定制解决方案，帮助客户在新的全球化互联网环境中保持优势。

城市分站预约上门沟通：400-800-2455 免费提供上门服务

广州网站建设深圳网站建设佛山网站建设惠州网站建设中山网站建设东莞网络公司珠海网站建设

卓商网为您提供东莞网站建设,东莞网站设计,东莞营销型网站制作等服务！东莞建站总机：0769-89801111

全国服务热线：400-800-2455 | 东莞地址：东莞市南城区鸿福路星鹏商务大厦B座8楼 | 深圳地址：深圳市龙岗区布吉街道大都汇大厦B座1805

首页

网站建设

案例

方案

服务

资讯

我们

联系

IT'S A SERVICE THAT TOUCHES YOU