• 大小: 0.95KB
    文件类型: .py
    金币: 1
    下载: 0 次
    发布日期: 2021-01-30
  • 语言: Python
  • 标签: IP  代理  

资源简介

可以设置的ip数量爬取

运行前需要安装 bs4模块  以及 requests模块

下载地址分别为:

https://pypi.python.org/packages/10/ed/7e8b97591f6f456174139ec089c769f89a94a1a4025fe967691de971f314/bs4-0.0.1.tar.gz

https://pypi.python.org/packages/16/09/37b69de7c924d318e51ece1c4ceb679bf93be9d05973bb30c35babd596e2/requests-2.13.0.tar.gz#md5=921ec6b48f2ddafc8bb6160957baf444


下载后安装方法如下(以bs4模块为例):

1.解压bs4-0.0.1.tar.gz文件后,并 在命令行 cd到该目录,输入命令:  python setup.py install

2. 回车运行,安装完毕


资源截图

代码片段和文件信息

import re
from random import choice
import requests
import bs4

url = “http://www.xicidaili.com/“
headers = { “Accept“:“text/htmlapplication/xhtml+xmlapplication/xml;“
“Accept-Encoding“:“gzip“
“Accept-Language“:“zh-CNzh;q=0.8“
“Referer“:“http://www.xicidaili.com/“
“User-Agent“:“Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML like Gecko) Chrome/42.0.2311.90 Safari/537.36“
}
r = requests.get(urlheaders=headers)
soup = bs4.BeautifulSoup(

评论

共有 条评论