• 大小: 2.58KB
    文件类型: .rar
    金币: 1
    下载: 0 次
    发布日期: 2024-05-08
  • 语言: Python
  • 标签: 爬虫  壁纸  

资源简介

彼岸花网壁纸爬虫

资源截图

代码片段和文件信息

import time 
import re
import random
from bs4 import BeautifulSoup as bf
from  urllib.request  import urlopenurlretrieve
def get_page(url):
        html_url  = url
        html = urlopen(html_url)
        page  =  bf(html.read()‘html.parser‘)
        return page 

#读取a标签中的超链接,并筛选出图片的链接
def GetImg_href(page):
        img_href = []
        for i in  page.find_all(‘a‘):
                tupian_href  = i.get(‘href‘)
                img_search = re.search(“^\/tupian\/.*\.html$“tupian_href)
                if  img_search== None:
                        continue
                img_href.append(“http://pic.netbian.com“ + str(img_search.group()))
                #返回的列表
        return img_href
def New_GetImg_href(page):
        “““
        获取图片的url
        return:img_src;
        “““
        img_src = []
        for i in  page.find_all(‘img‘):
                tupian_href  = i.get(‘src‘)
                img_search_href = re.search(“^\/uploads/.*\.jpg$“tupian_href)
                if  img_search_href== None:
                        continue
                img_src.append(img_search_href.group())
        return img_src
def img_down_load(abc):
        ‘‘‘
         @a:已经下载的数据块 
        @b

评论

共有 条评论