• 大小: 1KB
    文件类型: .py
    金币: 2
    下载: 1 次
    发布日期: 2021-06-05
  • 语言: Python
  • 标签:

资源简介

python_爬取网上资源存入数据库中 轻松实现小爬虫 关键:绝对能跑的代码

资源截图

代码片段和文件信息

# _*_ coding:utf-8 _*_

from urllib import request
from bs4 import BeautifulSoup  #爬虫的一种插件,自己下载
import pymysql

db_config ={
    ‘host‘:‘XX.XX.XX.XX‘ #数据库服务器IP地址
    ‘port‘:3306 #数据库服务器端口号,一般是3306
    ‘user‘:‘root‘ #数据库用户名
    ‘password‘:‘xxxx‘ #数据库密码
    ‘db‘:‘test_spider‘ #数据库表名称
    ‘charset‘:‘utf8‘ #数据字符类型
}
connection = pymysql.connect(**db_config)
url = r‘http://www.jianshu.com/‘
headers = {‘User-Agent‘:‘Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML like Gecko) Chrome/55

评论

共有 条评论