资源简介

KMeans Python 代码的实现,还包括scikit-learn-kMeans Python 代码的实现,数据文件为txt , 代码包括读取txt文件数据到python中

资源截图

代码片段和文件信息

#!/usr/bin/python
# coding=utf-8
from numpy import *
# 加载数据
import numpy as np


def loadDataSet(fileName):   # 解析文件,按tab分割字段,得到一个浮点数字类型的矩阵
    dataMat = []              # 文件的最后一个字段是类别标签
    fr = open(fileName)
    for line in fr.readlines():
        curLine = line.strip().split(‘\t‘)
        # fltLine = map(float curLine)    # 将每个元素转成float类型
        curLine = line.rstrip()
        curLine = [float(x) for x in curLine.split()]
        dataMat.append(curLine)
    return dataMat

# 计算欧几里得距离
def distEclud(vecA vecB):
    return sqrt(sum(power(vecA - vecB 2))) # 求两个向量之间的距离

# 构建聚簇中心,取k个(此例中为4)随机质心
def randCent(dataSet k):
    n = shape(dataSet)[1]
    centroids = mat(zeros((k n)))   # 每个质心有n个坐标值,总共要k个质心
    for j in range(n):
        minJ = float(min(dataSet[: 

 属性            大小     日期    时间   名称
----------- ---------  ---------- -----  ----
     文件        3330  2018-04-15 21:26  kMeans\kMeans.py
     文件         408  2018-04-15 15:18  kMeans\kMeans.txt
     文件        1619  2018-04-15 21:14  kMeans\scikit-learn-kMeans.py
     目录           0  2018-04-15 21:32  kMeans\

评论

共有 条评论