资源简介
常用内部(Sil,CH,DBI,KL)、外部评价指标(Rand等4个),用自带样本集“leuk72_3k.txt”测试可用!

代码片段和文件信息
function result = daisy(xvtypemetric)
%DAISY returns a matrix containing all the pairwise dissimilarities
%(distances) between observations in the dataset. The original
%variables may be of mixed types.
%
%The calculation of dissimilarities is explained in:
% Kaufman L. and Rousseeuw P.J. (1990)
% “Finding groups in data: An introduction to cluster analysis“
% Wiley-Interscience: New York (Series in Applied Probability and
% Statistics) ISBN 0-471-87876-6.
%
% Required input arguments:
% x : Data matrix (rows = observations columns = variables)
% vtype : Variable type vector (length equals number of variables)
% Possible values are 1 Asymmetric binary variable (0/1)
% 2 Nominal variable (includes symmetric binary)
% 3 Ordinal variable
% 4 Interval variable
%
% Optional input arguments:
% metric : Metric to be used (default euclidian (eucli) or mixed (mixed))
% Possible values are ‘eucli‘ Euclidian (all interval variables)
% ‘manha‘ Manhattan
% ‘mixed‘ Mixed (not all interval variables)
%
% I/O:
% result=daisy(xvtype‘eucli‘)
%
% Example (subtracted from the referenced book)
% load flower.mat
% result=daisy(flower[2 2 1 2 3 3 4]);
%
% The output of DAISY is a structure containing:
% result.disv : dissimilarities (read row by row from the
% lower dissimilarity matrix)
% result.metric : used metric
% result.number : number of observations
%
% This function is part of LIBRA: the Matlab Library for Robust Analysis
% available at:
% http://wis.kuleuven.be/stat/robust.html
%
% Written by Guy Brys and Wai Yan Kong (May 2006)
%Checking and filling in the inputs
if (nargin<2)
error(‘Two input arguments required‘)
elseif (nargin<3)
if (sum(vtype)~=4*size(x2))
metric = ‘mixed‘;
metr = 0;
else
metric = ‘eucli‘;
metr = 1;
end
elseif (nargin==3)
if strcmp(metric‘eucli‘)
metr=1;
elseif strcmp(metric‘manha‘)
metr=2;
elseif strcmp(metric‘mixed‘)
metr=0;
end
end
%Standardizing in case of mixed metric
if (sum(vtype)~=4*size(x2))
colmin = min(x);
colextr = max(x)-colmin;
x = (x - repmat(colminsize(x1)1))./repmat(colextrsize(x1)1);
end
%Replacement of missing values
jtmd = repmat(11size(x2))-2*(sum(isnan(x))>0);
valmisdat = min(min(x))-0.5;
x(isnan(x)) = valmisdat;
valmd = repmat(valmisdat1size(x2));
%Actual calculations
disv=daisyc(size(x1)size(x2)xvalmdjtmdvtypemetr);
%Putting things together
result = struct(‘disv‘disv‘metric‘metric‘number‘size(x1));
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
文件 20688 2018-10-28 19:36 聚类有效性指标(4内4外)\11.txt
文件 5106 2018-10-28 13:36 聚类有效性指标(4内4外)\2016grade_z.txt
文件 2831 2006-09-19 17:13 聚类有效性指标(4内4外)\daisy.m
文件 8704 2006-05-09 10:18 聚类有效性指标(4内4外)\daisyc.dll
文件 227 2007-04-05 09:11 聚类有效性指标(4内4外)\ind2cluster.m
文件 20832 2006-12-11 16:40 聚类有效性指标(4内4外)\leuk72_3k.txt
文件 1337 2009-07-08 23:42 聚类有效性指标(4内4外)\license.txt
文件 3883 2018-10-28 20:44 聚类有效性指标(4内4外)\mainClusterValidationNC.m
文件 723 2009-07-07 17:42 聚类有效性指标(4内4外)\Notice_contributedFiles.txt
文件 8288 2006-10-24 23:01 聚类有效性指标(4内4外)\pam.m
文件 12800 2006-05-09 10:22 聚类有效性指标(4内4外)\pamc.dll
文件 3863 2009-07-01 11:03 聚类有效性指标(4内4外)\ReadmeChinese.txt
文件 5259 2009-07-01 11:03 聚类有效性指标(4内4外)\ReadmeEnglish.txt
文件 514 2006-12-18 15:46 聚类有效性指标(4内4外)\similarity_euclid.m
文件 479 2007-03-11 10:35 聚类有效性指标(4内4外)\similarity_pearson.m
文件 556 2007-03-10 22:25 聚类有效性指标(4内4外)\similarity_pearsonC.m
文件 304 2006-12-18 15:52 聚类有效性指标(4内4外)\standarz.m
文件 1936 2007-06-14 20:53 聚类有效性指标(4内4外)\validity_Index.m
文件 961 2007-02-10 14:49 聚类有效性指标(4内4外)\valid_clusterIndex.m
文件 780 2007-04-05 09:32 聚类有效性指标(4内4外)\valid_errorate.m
文件 621 2007-03-10 23:02 聚类有效性指标(4内4外)\valid_findk.m
文件 823 2007-03-15 08:59 聚类有效性指标(4内4外)\valid_index_plot.m
文件 881 2007-03-15 09:10 聚类有效性指标(4内4外)\valid_internal_deviation.m
文件 1201 2007-03-15 10:05 聚类有效性指标(4内4外)\valid_internal_intra.m
文件 1258 2007-03-10 22:28 聚类有效性指标(4内4外)\valid_intrainter.m
文件 1718 2006-10-24 20:49 聚类有效性指标(4内4外)\valid_RandIndex.m
文件 889 2007-03-10 21:49 聚类有效性指标(4内4外)\valid_sumpearson.m
文件 1375 2007-03-10 21:47 聚类有效性指标(4内4外)\valid_sumsqures.m
文件 1429 2004-07-31 17:28 聚类有效性指标(4内4外)\xlim2.m
文件 1405 2018-10-28 13:39 聚类有效性指标(4内4外)\yourdata.txt
............此处省略4个文件信息
相关资源
- ppt 机器学习.ppt
- Logistic回归总结非常好的机器学习总结
- Convex Analysis and Optimization (Bertsekas
- 机器学习个人笔记完整版v5.2-A4打印版
- JUNIOR:粒子物理学中无监督机器学习
- 语料库.zip
- 中国科学技术大学 研究生课程 机器学
- 遗传算法越野小车unity5.5
- 吴恩达机器学习编程题
- shape_predictor_68_face_landmarks.dat.bz2 68个标
- 机器学习实战高清pdf,中文版+英文版
- 李宏毅-机器学习(视频2017完整)
- 机器学习深度学习 PPT
- 麻省理工:深度学习介绍PPT-1
- Wikipedia机器学习迷你电子书之四《D
- Learning From Data Yaser S. Abu-Mostafa
- 北大林宙辰:机器学习一阶算法的优
- 李宏毅深度学习ppt
- 机器学习方法R实现-用决策树、神经网
- 数字金融反欺诈白皮书
- 机器学习班PPT原件全邹博
- 机器学习实战(源码和数据样本)
- 计算广告含有目录 刘鹏版
- 数据挖掘导论完整版PPT及课后习题答
- kaggle信用卡欺诈数据
- 机器学习技法原始讲义和课程笔记
- 机器学习数学 陈希孺《 概率论与数理
- 概率论与数理统计陈希孺
- 哈尔滨工业大学深圳 机器学习 2017 考
- [概率论与数理统计]陈希孺带目录
评论
共有 条评论