资源简介
给定任意关键词,能够通过新浪微博搜索,爬取相关微博的博主id,微博正文,转发数,评论数,点赞数,发布时间
代码片段和文件信息
from urllib.parse import urlencode
import requests
from pyquery import PyQuery as pq
import os
import re
import xlwt
import pandas as pd
current_Path = os.path.dirname(os.path.abspath(__file__)) + ‘\\‘
base_url = ‘https://s.weibo.com/‘
headers = {
‘Host‘:‘m.weibo.cn‘
‘Refer‘:‘https://weibo.com/zzk1996?is_all=1‘
‘User-Agent‘: ‘Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML like Gecko) Chrome/80.0.3987.87 Safari/537.36 Edg/80.0.361.48‘
}
#搜索
def get_Research(research_Wordspage):
params = {
‘q‘: research_Words
‘Refer‘: ‘index‘
‘page‘: str(page)
}
url = ‘https://s.weibo.com/weibo?‘ + urlencode(params)
#print(url)
# print(urlencode(params))
try:
response = requests.get(url)
if response.status_code == 200:
return response.text
except requests.Connectionerror:
return None
def get_Information(research_Wordspage):
res = []
html = get_Research(research_Wordspage)
doc = pq(html)
#print(doc)
with open(current_Path + ‘test.txt‘‘w+‘encoding = ‘utf8‘) as f:
f.write(html)
# items = doc(“.content“).items()
items = doc(“div[class=‘card‘]“).items()
for li in items:
temp_Info_Dict = {}
###抽取昵称
info = li.find(‘div‘)(‘.name‘)
nick_Name = info.attr(‘nick-name‘)
temp_Info_Dict[‘博主id‘] = nick_Name
###抽取内容
# text = li(‘.txt‘)
text = li(“p[node-type=‘feed_list_content_full‘]>a“)
temp_Info_Dict[‘微博正文‘] = text.text()
if temp_Info_Dict[‘微博正文‘] == ‘‘:
- 上一篇:算法的python实现代码、测试数据集及结果
- 下一篇:bow python实现
相关资源
- 二级考试python试题12套(包括选择题和
- pywin32_python3.6_64位
- python+ selenium教程
- PycURL(Windows7/Win32)Python2.7安装包 P
- 英文原版-Scientific Computing with Python
- 7.图像风格迁移 基于深度学习 pyt
- 基于Python的学生管理系统
- A Byte of Python(简明Python教程)(第
- Python实例174946
- Python 人脸识别
- Python 人事管理系统
- 一个多线程智能爬虫,爬取网站小说
- 基于python-flask的个人博客系统
- 计算机视觉应用开发流程
- python 调用sftp断点续传文件
- python socket游戏
- 基于Python爬虫爬取天气预报信息
- python函数编程和讲解
- 顶点小说单本书爬虫.py
- Python开发的个人博客
- 基于python的三层神经网络模型搭建
- python实现自动操作windows应用
- python人脸识别(opencv)
- python 绘图(方形、线条、圆形)
- python疫情卡UN管控
- python 连连看小游戏源码
- 基于PyQt5的视频播放器设计
- 一个简单的python爬虫
- csv文件行列转换python实现代码
- Python操作Mysql教程手册
评论
共有 条评论