• 大小: 8KB
    文件类型: .rar
    金币: 1
    下载: 0 次
    发布日期: 2021-01-03
  • 语言: Python
  • 标签: python  scrapy  

资源简介

利用python的scrapy框架实现新华网论坛的抽取,可执行

资源截图

代码片段和文件信息

# Define here the models for your scraped items
#
# See documentation in:
# http://doc.scrapy.org/topics/items.html

from scrapy.item import Item Field

class XinhuaItem(Item):
    # define the fields for your item here like:
    # name = Field()
    #pass
    title=field()
    link=field()
    desc=field()

 属性            大小     日期    时间   名称
----------- ---------  ---------- -----  ----

     文件        310  2011-12-07 11:06  xinhua\items.py

     文件        250  2011-12-07 11:04  xinhua\pipelines.py

     文件        451  2011-12-19 13:30  xinhua\settings.py

     文件        393  2011-12-22 12:52  xinhua\settings.pyc

     文件       9905  2011-12-22 15:59  xinhua\spiders\xinhua.py

     文件       7105  2011-12-22 15:59  xinhua\spiders\xinhua.pyc

     文件        248  2011-08-11 17:14  xinhua\spiders\__init__.py

     文件        123  2011-12-07 11:36  xinhua\spiders\__init__.pyc

     文件        178  2011-08-26 10:12  xinhua\spiders\__init__.pyo

     文件          0  2011-08-11 17:14  xinhua\__init__.py

     文件        115  2011-12-07 11:36  xinhua\__init__.pyc

     文件        170  2011-08-26 10:12  xinhua\__init__.pyo

     目录          0  2011-12-22 15:59  xinhua\spiders

     目录          0  2011-12-22 15:41  xinhua

----------- ---------  ---------- -----  ----

                19248                    14


评论

共有 条评论