打开火狐浏览器右上角的设置选项,选择“选项”爬虫代理服务器怎么用选择左边选项栏中最下方的“高级”选项 爬虫代理服务器怎么用“高级”选项下拉菜单“网络”连接配置 Firefox 如何连接至国际互联网,右侧的“设置网络。

如果出现403forbidden或者页面无法打开的问题,那么就很有可能是IP已经被站点服务器所封禁,遇到这种情况就需要更换自己的IP地址,目前来说最为方便的就是使用代理IP,例如IPIDEA,可以随时更换新的IP地址来确保爬虫的工作效率。

防止被封IP可以通过 限制爬取的频率,使不会被识别为恶意爬取多节点mapreduce一下,多个IP分摊流量已经被封的放出来就看对面心情了。