• 大小: 1.49KB
    文件类型: .py
    金币: 1
    下载: 0 次
    发布日期: 2024-05-06
  • 语言: Python
  • 标签: 爬取  爬虫  

资源简介


资源截图

代码片段和文件信息

import reurllib.request
import os
from sqlalchemy import false

index=0
headers = {‘User-Agent‘:‘Mozilla/5.0 (Windows NT 6.1; WOW64; rv:23.0) Gecko/20100101 Firefox/23.0‘}

# for i in range(2256):
for i in range(25):#2-4页
    req = urllib.request.Request(url=‘https://www.mzitu.com/page/‘+str(i)+‘/‘ headers=headers)
    request = urllib.request.urlopen(req).read()

    buf = request.decode(‘utf-8‘)
    listurl = re.findall(r‘data-original.+\.jpg‘buf)

    res=[]
    for src in listurl:
        a= re.findall(r‘data-original.+\.[jp][pn]g‘src)
        res.append(a[0])

    res1=[]
    url1=[]
    for url in res:
        url1.append(url.partition(‘ ‘)[0])

    for src in url1:
        b = re.findall(r‘https.

评论

共有 条评论