资源简介
针对K-means聚类算法受初始类中心影响,聚类结果容易陷入局部最优导致聚类准确率较低的问题,提出了一种基于自适应布谷鸟搜索的K-means聚类改进算法,并利用MapReduce编程模型实现了改进算法的并行化。通过搭建的Hadoop分布式计算平台对不同样本数据集分别进行10次准确性实验和效率实验,结果表明:a)聚类的平均准确率在实验所采用的四种UCI标准数据集上,相比原始K-means聚类算法和基于粒子群优化算法改进的K-means聚类算法都有所提高;b)聚类的平均运行效率在实验所采用的五种大小递增的随机数据集上,当数据量较大时,显著优于原始K-means串行算法,稍好于粒子群优化算法改进的并行K-means聚类算法。可以得出结论,在大数据情景下,应用该算法的聚类效果较好。
代码片段和文件信息
- 上一篇:基于ZEMAX的手机照相镜头的光学设计
- 下一篇:讯代理模块
相关资源
- 基于hadoopp平台的推荐系统
- Hadoop与Spark安装配置手册
- 大数据培训视频网盘 永久有效
- HadoopHA高可用配置文件
- IT十八掌徐培成HADOOP笔记
- hadoop框架复习思维导图
- 从零开始学习Hadoop
- hadoop2.7.2windows10编译后的bin目录文件
- hadoop伪分布式搭建centos6.5+hadoop2.7
- hadoop-2.7.1.tar.gz-百度网盘链接
- hadoop.dll & winutils.exe For hadoop-2.8.0
- 双十一淘宝数据分析
- 大数据真实案例分析《HadoopSpark企业应
- 多易教育大数据全套视频
- hadoop2.8版对应的64位winutils.exe
- Ambari及集群安装指导
- Hadoop部署和配置Kerberos安全认证
- 32位hadoop2.6.4
- hadooponwindows.zip
- 决战大数据升级版:大数据的关键思
- 2019大数据尚硅谷 最新资料
- ODPS参考手册
- 林子雨大数据实验答案(包含截图)
- Hadoop大数据实战手册
- hadoop.dll winutils.exe hadoop2.6\\2.7\\2.8\\3
- Hadoop源码分析 完整版 共55章
- CDH版本升级操作手册
- kudu cm安装方式文档
- 大数据从入门到精通视频教学
- 基于大数据技术之电视收视率企业项
评论
共有 条评论