• 大小: 0.01M
    文件类型: .py
    金币: 1
    下载: 0 次
    发布日期: 2021-03-28
  • 语言: 其他
  • 标签: 其他  

资源简介


python实现apriori 算法并进行关联规则挖掘,内涵详细注释,帮助理解

资源截图

代码片段和文件信息

# coding=utf8
# python3.5
# http://www.cnblogs.com/90zeng/p/apriori.html

def loadDataSet():
    ‘‘‘‘‘创建一个用于测试的简单的数据集‘‘‘
    return [[1 3 4 5] [2 3 5] [1 2 3 4 5] [2 3 4 5]]


def createC1(dataSet):
    ‘‘‘‘‘
        构建初始候选项集的列表,即所有候选项集只包含一个元素,
        C1是大小为1的所有候选项集的集合
    ‘‘‘
    C1 = []
    for transaction in dataSet:
        for item in transaction:
            if [item] not in C1:
                C1.append([item])
    C1.sort()
    # return map( frozenset C1 )
    # return [var for var in map(frozensetC1)]
    return [frozenset(var) for var in C1]


def scanD(D Ck minSupport):
    ‘‘‘‘‘
        计算Ck中的项集在数据集合D(记录或者transactions)中的支持度
        返回满足最小支持度的项集的集合,和所有项集支持度信息的字典。
    ‘‘‘
    ssCnt = {}
    for tid in D:  # 对于每一条transaction
        for can in Ck:  # 对于每一个候选项集can,检查是否是transaction的一部分 # 即该候选can是否得到transaction的支持
            if can.issubset(tid):
                ssCnt[can] = ssCnt.get(can 0) + 1
    numItems = float(len(D))
    retList = []
    supportData 

评论

共有 条评论