• 大小: 3KB
    文件类型: .py
    金币: 1
    下载: 0 次
    发布日期: 2021-06-14
  • 语言: Python
  • 标签: 爬虫  图片  

资源简介

指定配置与车型,自动爬取车型配置信息,程序为爬取屏幕尺寸大小,可以根据自己的需求自行更改

资源截图

代码片段和文件信息


# -*- coding: utf-8 -*-
import requests
import re
import time
import sys
import os


homedir = os.getcwd()
#新能源汽车网址
car_url=“https://www.autohome.com.cn/car/0_0-0.0_0.0-0-0-0-0-4-0-0-0/“
#zg=[]
#2018年1月28 该下载N
#燃油版
#temp=[‘A‘‘B‘‘C‘‘D‘‘E‘‘F‘‘G‘‘H‘‘I‘‘J‘‘K‘‘L‘‘M‘‘N‘‘O‘‘P‘‘Q‘‘R‘‘S‘‘T‘‘V‘‘W‘‘X‘‘Y‘‘Z‘]
#纯电版
#temp=[‘B‘‘C‘‘D‘‘F‘‘G‘‘H‘‘J‘‘K‘‘L‘‘N‘‘O‘‘Q‘‘R‘‘S‘‘T‘‘W‘‘X‘‘Y‘‘Z‘]
#for i in temp:
    #print(“正在访问:“i)
    #car_url=“https://www.autohome.com.cn/grade/carhtml/“+i+“.html“
    #zg.append(car_url)
    #print(car_url)
#print(zg)

#下载器
def download(url):
    try:
        response=requests.get(url)
        #response.encoding=‘gb2312‘
        if response:
            global html
            type = sys.getfilesystemencoding()
            html=response.text
            html = html.encode(‘utf-8‘).decode(‘utf-8‘)
            return html
        #print(html)
    except Exception as e:
        print(e)
def save_carname():
    path_result=homedir+‘\\‘+‘车型.txt‘
    f1 = open(path_result‘a‘)
    f1.write(name[0]+‘\n‘)
    f1.close()
def save_num():
    path_result=homedir+‘\\‘+‘屏幕尺寸.txt‘
    f1 = open(path_result‘a‘)
    f1.write(m.group(0)+‘\n‘)
    f1.close()    
download(car_url)
html_1=html
img_url_1=re.findall(r‘href=“//car.autohome.com.cn/price/(.*?).html#pvareaid=103446“‘ html_1 )
#print(img_url_1)
#获取所有当前字母开头车型报价URL
img_url_item=list(map(lambda x: ‘https://car.autohome.com.cn/price/‘+x+‘.html#pvareaid=103446‘img_url_1))
#print(len(img_url_item))
for p in img_url_item:
    try:

评论

共有 条评论