• 大小: 944KB
    文件类型: .zip
    金币: 1
    下载: 0 次
    发布日期: 2021-01-07
  • 语言: Python
  • 标签: 源代码  文档  

资源简介

运用所学的数据挖掘应用知识,基于Python编程环境,设计文档内容包括:数据预处理、模型构建、代码实现、结果分析。包括源代码和设计文档

资源截图

代码片段和文件信息

#-*- coding: utf-8 -*-
#层次聚类算法
import pandas as pd

#参数初始化
standardizedfile = ‘../tmp/standardized2.xls‘ #标准化后的数据文件
k = 3 #聚类数
data = pd.read_excel(standardizedfile index_col = u‘基站编号‘) #读取数据

from sklearn.cluster import AgglomerativeClustering #导入sklearn的层次聚类函数
#model = AgglomerativeClustering(n_clusters = k linkage = ‘ward‘)
model = AgglomerativeClustering(n_clusters = k linkage = ‘average‘)
model.fit(data) #训练模型

#详细输出原始数据及其类别
r = pd.concat([data pd.Series(model.labels_ index = data.index)] axis = 1)  #详细输出每个样本对应的类别
r.columns = list(data.columns) + [u‘聚类类别‘] #重命名表头
print(r.groupby(u‘聚类类别‘).head())
import matplotlib.pyplot as plt
plt.rcParams[‘font.sans-serif‘] = [‘SimHei‘] #用来正常显示中文标签
plt.rcParams[‘axes.unicode_minus‘] = False #用来正常显示负号

style = [‘bo-‘ ‘mo-‘

 属性            大小     日期    时间   名称
----------- ---------  ---------- -----  ----
     目录           0  2019-12-25 10:12  数据挖掘大作业基站\
     目录           0  2019-06-26 22:22  数据挖掘大作业基站\data_test\
     目录           0  2019-06-12 23:46  数据挖掘大作业基站\data_test\.idea\
     文件         408  2019-06-12 23:20  数据挖掘大作业基站\data_test\.idea\data_test.iml
     文件         277  2019-06-12 23:20  数据挖掘大作业基站\data_test\.idea\modules.xml
     文件       13201  2019-06-12 23:46  数据挖掘大作业基站\data_test\.idea\workspace.xml
     目录           0  2019-06-28 13:32  数据挖掘大作业基站\data_test\code\
     目录           0  2019-06-28 13:38  数据挖掘大作业基站\data_test\code\.idea\
     文件         408  2019-06-28 12:19  数据挖掘大作业基站\data_test\code\.idea\code.iml
     文件         267  2019-06-28 12:16  数据挖掘大作业基站\data_test\code\.idea\modules.xml
     文件        7928  2019-06-28 13:38  数据挖掘大作业基站\data_test\code\.idea\workspace.xml
     文件        1651  2019-06-12 23:42  数据挖掘大作业基站\data_test\code\hierarchical_clustering.py
     文件        1612  2019-06-28 12:42  数据挖掘大作业基站\data_test\code\hierarchical_clustering_pic.py
     文件         632  2019-06-28 13:32  数据挖掘大作业基站\data_test\code\standardization.py
     目录           0  2019-06-11 13:41  数据挖掘大作业基站\data_test\data\
     文件       49152  2015-12-05 21:22  数据挖掘大作业基站\data_test\data\business_circle.xls
     文件       72192  2015-12-05 21:22  数据挖掘大作业基站\data_test\data\standardized.xls
     目录           0  2019-06-12 23:36  数据挖掘大作业基站\data_test\tmp\
     文件       49734  2019-06-12 23:40  数据挖掘大作业基站\data_test\tmp\0type_1.png
     文件       23910  2019-06-12 23:40  数据挖掘大作业基站\data_test\tmp\0type_2.png
     文件       44486  2019-06-12 23:40  数据挖掘大作业基站\data_test\tmp\0type_3.png
     文件       50688  2019-06-12 23:39  数据挖掘大作业基站\data_test\tmp\standardized2.xls
     文件       49734  2019-06-12 23:42  数据挖掘大作业基站\data_test\tmp\type_1.png
     文件       59545  2019-06-12 23:42  数据挖掘大作业基站\data_test\tmp\type_2.png
     文件       44486  2019-06-12 23:42  数据挖掘大作业基站\data_test\tmp\type_3.png
     文件      649414  2019-06-28 13:32  数据挖掘大作业基站\数据挖掘设计.docx

评论

共有 条评论