• 大小: 9KB
    文件类型: .rar
    金币: 1
    下载: 0 次
    发布日期: 2021-01-10
  • 语言: Python
  • 标签: 爬虫  

资源简介

使用python,mysql爬去百度百科的代码,并利用neo4j展示

资源截图

代码片段和文件信息

# -*- coding: utf-8 -*-
# author:wxm

import pandas as pd
import pymysql
from py2neo import GraphNodeRelationship
import csv

## 加上字符集参数,防止中文乱码
def get_items_from_database():
    #链接数据库
    dbconn = pymysql.connect(
    host=“192.168.1.24“
    database=“baike_science“
    user=“root“
    password=“root“
    port=3306
    charset=‘utf8‘
    use_unicode=True
    )

    # # sql语句
    # sqlcmd = “SELECT idtitleurl FROM webpage WHERE time_stamp < ‘2017-12-21 00:00:00‘ “
    #
    # # 利用pandas 模块导入mysql数据
    # data= pd.read_sql(sqlcmd dbconn) #python pandas.core.frame.Dataframe类型

    #链接neo4j
    test_graph = Graph(
        “http://localhost:7474“
        username=“neo4j“
        password=“780961“
    )
    #清空数据库
    test_graph.delete_all()

 

 属性            大小     日期    时间   名称
----------- ---------  ---------- -----  ----

     文件       1950  2017-12-21 20:41  BaiDuBaiKei\baike_science.sql

     文件       7485  2017-12-26 10:49  BaiDuBaiKei\DatatoNeo4j.py

     文件       3006  2017-12-20 21:19  BaiDuBaiKei\data_storager.py

     文件      16974  2017-12-21 20:37  BaiDuBaiKei\Spider.py

     文件       2315  2017-12-20 20:46  BaiDuBaiKei\wipe_off_html_tag.py

     文件          0  2017-12-21 20:37  BaiDuBaiKei\__init__.py

     目录          0  2017-12-26 10:48  BaiDuBaiKei

----------- ---------  ---------- -----  ----

                31730                    7


评论

共有 条评论