• 大小: 3KB
    文件类型: .py
    金币: 1
    下载: 0 次
    发布日期: 2021-05-21
  • 语言: Python
  • 标签: python  

资源简介

一加云相册批量下载爬虫,脚本用python编写。使用时需要先在chrome浏览器中登录一加云相册(cloud.h2os.com)。

资源截图

代码片段和文件信息



import browsercookie
import requests
import json
import time
import random
import os.path
from requests.packages import urllib3

# 一加云服务图片批量下载爬虫
# by 镜亦

headers = {
    “User-Agent“: “Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML like Gecko) Chrome/73.0.3683.103 Safari/537.36“}
cookies = None
lastIndex = 0
cursor = “not attained“

# 消除 warning   InsecureRequestWarning
urllib3.disable_warnings()

# 获取cookie,前提是需要浏览器登陆过


def getCookies():
    global cookies
    if cookies == None:
        cookies = requests.utils.dict_from_cookiejar(browsercookie.chrome())
    mcookies = requests.utils.cookiejar_from_dict(
        cookies cookiejar=None overwrite=True)
    return mcookies


def getPhotoList():
    global lastIndex cursor cookies
    postUrl = “https://cloud.h2os.com/gallery/pc/listNormalPhotos“
    response = requests.post(postUrl generateForm(
        lastIndex cursor) cookies=getCookies() headers=headers)
    cookies = dict(
        cookies **requests.utils.dict_from_cookiejar(response.cookies))
    jResult = json.loads(response.text)
    print(“LastIndex : “+str(lastIndex)+“  Cursor : “ + str(cursor))
    try:
        print(“Result : “ + str(jResult[“errCode“]) + “ “ + jResult[‘errMsg‘])
    except Exception:
        print(“发生错误:\n“ + response.text)
        exit(1)
    lastIndex = jResult[“realPhotoIndex“]
    cursor = jResult[“lastMatchedMoment“]
    return jResult[“photos“]


def downloadImage(FullPath fileName url):
    global cookies
    nameWithPath = FullPath + “\\“ + fileName
    if os.path.exists(nameWithPath):
        print(“already exixt : “+fileName)
        return
    print(“Do

评论

共有 条评论