• 大小: 5.29KB
    文件类型: .py
    金币: 1
    下载: 0 次
    发布日期: 2021-03-27
  • 语言: 其他
  • 标签: 其他  

资源简介


Python文章抓取,可以自动抓取并保存文章到txt文件,适合的网站有CSDN,简书,各大新闻网站的文章。

资源截图

代码片段和文件信息

import wx
from newspaper import Article
from threading import *
from wx.lib.pubsub import pub
import webbrowser
url = ““


class WorkerThread(Thread):
    “““Worker Thread Class.“““
    def __init__(self notify_window):
        “““Init Worker Thread Class.“““
        Thread.__init__(self)
        self._notify_window = notify_window
        self._want_abort = 0
        self.start()

    def run(self):
        global path
        global url
        a = Article(url language=‘zh‘)  # Chinese
        a.download()
        a.parse()
        # print(a.text)
        try:
            f = open(path + “\\Article.txt“ “a+“)  # 以追加的方式
            f.write(“url: “ + a.source_url)
            f.write(“\n“ + a.title + “\n“)
            f.write(str(a.text))  # 写完通过\n进行换行
        except:
            pass
        wx.CallAfter(pub.sendMessage “title“ msg=str(a.title))
        wx.CallAfter(pub.sendMessage “text“ msg=str(a.text))


class InfoPanel(wx.frame):
    def 

评论

共有 条评论