博客
关于我
Python爬虫IP代理教程,让你不再为IP被封禁发愁!
阅读量:645 次
发布时间:2019-03-15

本文共 1053 字,大约阅读时间需要 3 分钟。

文章目录

本文来源没啥特别,因为没使用ip代理导致爬取boos直聘数据时,ip被封了,不过好在已解决,想看看博主的爬虫文章的可以点击下方链接,还是蛮全的。

一、免费代理ip地址推荐

芝麻代理需要注册,但注册后每天可以领取代理,还是很不错的

站大爷和快代理都有免费的开放代理
快代理也可以注册账号,在免费代理页面通过人工客服也可以领取试用独有IP

二、reuqests的ip代理

文章使用 http://httpbin.org/ip 这个测试 HTTP 请求及响应的网站

没使用ip代理之前

import requestsresponse = requests.get("http://httpbin.org/ip")print(response.text)

在这里插入图片描述

使用ip代理之后

import requestsproxy = {       'http': '171.35.171.247:9999'}response = requests.get("http://httpbin.org/ip",proxies=proxy)print(response.text)

可以看见返回的ip和代理的ip一样

在这里插入图片描述

三、selenium的ip代理

没使用代理之前

from selenium import webdriverdriver = webdriver.Chrome()driver.get("http://httpbin.org/ip")

在这里插入图片描述

使用代理之后

from selenium import webdriveroptions = webdriver.ChromeOptions()#添加IP代理options.add_argument("--proxy-server=http://183.166.149.193:20005")driver = webdriver.Chrome(chrome_options=options)driver.get("http://httpbin.org/ip")

在这里插入图片描述

四、ip代理大坑(重点)

ip代理有http和https的区别,但很多小伙伴不清楚到底有什么区别,经过博主踩坑后终于搞懂了,在线分享给大家

1.

在这里插入图片描述
在这里插入图片描述

2.

在这里插入图片描述

在这里插入图片描述

结论:如果请求的ip是https类型的,但代理的ip是只支持http的,那么还是使用本机的ip,

如果请求的ip是http类型的,那么代理的ip一定要是http的,前面不能写成https。

尾声

觉得博主写的不错的读者大大们,可以点赞关注和收藏哦,谢谢各位!

在这里插入图片描述

转载地址:http://tdolz.baihongyu.com/

你可能感兴趣的文章
Netty工作笔记0058---Netty群聊系统客户端
查看>>
Netty工作笔记0059---Netty私聊实现思路
查看>>
Netty工作笔记0060---Netty心跳机制实例
查看>>
Netty工作笔记0060---Tcp长连接和短连接_Http长连接和短连接_UDP长连接和短连接
查看>>
Netty工作笔记0061---Netty心跳处理器编写
查看>>
Netty工作笔记0062---WebSocket长连接开发
查看>>
Netty工作笔记0063---WebSocket长连接开发2
查看>>
vue样式穿透 ::v-deep的具体使用
查看>>
Netty工作笔记0065---WebSocket长连接开发4
查看>>
Netty工作笔记0066---Netty核心模块内容梳理
查看>>
Vue基本使用---vue工作笔记0002
查看>>
Netty工作笔记0068---Protobuf机制简述
查看>>
Netty工作笔记0069---Protobuf使用案例
查看>>
Netty工作笔记0070---Protobuf使用案例Codec使用
查看>>
Netty工作笔记0071---Protobuf传输多种类型
查看>>
Netty工作笔记0072---Protobuf内容小结
查看>>
Netty工作笔记0073---Neety的出站和入站机制
查看>>
Netty工作笔记0074---handler链调用机制实例1
查看>>
Netty工作笔记0075---handler链调用机制实例1
查看>>
Netty工作笔记0076---handler链调用机制实例3
查看>>