• 大小: 802B
    文件类型: .py
    金币: 1
    下载: 0 次
    发布日期: 2021-06-01
  • 语言: Python
  • 标签: python爬虫  

资源简介

python爬虫,抓取百度贴吧中的邮箱地址,如有环境安装问题请私信我

资源截图

代码片段和文件信息

# coding=utf-8
import re
import requests
import sys
reload(sys)
sys.setdefaultencoding(‘utf-8‘)
from bs4 import BeautifulSoup

# 获取html文档
def get_html(url):
    “““get the content of the url“““
    response = requests.get(url)
    response.encoding = ‘utf-8‘
    return response.text
    
# 获取笑话
def get_certain_joke(html):
    “““get the joke of the html“““
    soup = B

评论

共有 条评论