• 大小: 1.03M
    文件类型: .zip
    金币: 1
    下载: 0 次
    发布日期: 2021-01-30
  • 语言: Python
  • 标签: 数据  爬虫  scrapy  

资源简介

本项目利用scrapy框架实现了一个财经网站的数据爬虫,能够实现对新浪财经、网易财经等网站的数据抓取,非常适合同学们的大作业

资源截图

代码片段和文件信息

# -*- coding: utf-8 -*-

# Define here the models for your scraped items
#
# See documentation in:
# https://docs.scrapy.org/en/latest/topics/items.html

import scrapy


class Dou2Item(scrapy.Item):
    # define the fields for your item here like:
    # name = scrapy.Field()
    name = scrapy.Field()
    director = scrapy.Field()
    score = scrapy.Field()
    style = scrapy.Field()

    pass

 属性            大小     日期    时间   名称
----------- ---------  ---------- -----  ----
     目录           0  2020-05-04 00:28  python_东方财富爬取\
     目录           0  2020-05-04 00:27  python_东方财富爬取\spider\
     目录           0  2020-05-04 00:27  python_东方财富爬取\spider\.idea\
     文件       33447  2020-05-03 18:51  python_东方财富爬取\spider\stocks.txt
     文件         210  2020-03-20 19:04  python_东方财富爬取\spider\.idea\misc.xml
     文件         264  2020-04-30 11:37  python_东方财富爬取\spider\.idea\modules.xml
     文件         456  2020-03-20 19:04  python_东方财富爬取\spider\.idea\spider.iml
     文件       53847  2020-05-04 00:26  python_东方财富爬取\spider\.idea\workspace.xml
     文件           0  2019-11-07 08:35  python_东方财富爬取\spider\__init__.py
     目录           0  2020-05-04 00:27  python_东方财富爬取\spider\__pycache__\
     文件         817  2019-12-26 22:36  python_东方财富爬取\spider\__pycache__\settings.cpython-37.pyc
     文件         396  2020-03-20 20:03  python_东方财富爬取\spider\items.py
     文件        3593  2019-12-26 22:21  python_东方财富爬取\spider\middlewares.py
     文件         894  2020-03-20 20:04  python_东方财富爬取\spider\pipelines.py
     文件        1293  2020-03-20 20:04  python_东方财富爬取\spider\settings.py
     目录           0  2020-05-04 00:27  python_东方财富爬取\spider\spiders\
     文件         161  2019-11-07 08:35  python_东方财富爬取\spider\spiders\__init__.py
     文件      644615  2020-05-02 18:11  python_东方财富爬取\spider\spiders\test.html
     文件        4927  2020-05-04 00:13  python_东方财富爬取\spider\spiders\get_info.py
     文件        1240  2020-05-03 23:27  python_东方财富爬取\spider\spiders\get_stock.py
     文件         989  2020-05-03 22:50  python_东方财富爬取\spider\spiders\lists.py
     文件     1055176  2020-05-04 00:25  python_东方财富爬取\东方财富需求爬取.docx
     目录           0  2020-05-04 00:31  python_东方财富爬取\spider\.idea\inspectionProfiles\
     目录           0  2020-05-04 00:31  python_东方财富爬取\spider\spiders\__pycache__\

评论

共有 条评论