• 大小: 37KB
    文件类型: .zip
    金币: 1
    下载: 0 次
    发布日期: 2021-06-06
  • 语言: Matlab
  • 标签: 聚类  有效性  

资源简介

包含外部有效性指标和内部有效性指标,Rand index、 Adjusted Rand index、 Mirkin index、Hubert indexSilhouette、 Davies-Bouldin、Calinski-Harabasz、Krzanowski-Lai、Hartigan、weighted inter- to intra-cluster ratio、Homogeneity Separation

资源截图

代码片段和文件信息

function result = daisy(xvtypemetric)

%DAISY returns a matrix containing all the pairwise dissimilarities
%(distances) between observations in the dataset.  The original
%variables may be of mixed types.
%
%The calculation of dissimilarities is explained in:
%   Kaufman L. and Rousseeuw P.J. (1990)
%   “Finding groups in data: An introduction to cluster analysis“
%   Wiley-Interscience: New York (Series in Applied Probability and
%   Statistics) ISBN 0-471-87876-6.
%
% Required input arguments:
%   x : Data matrix (rows = observations columns = variables)
%   vtype : Variable type vector (length equals number of variables)
%       Possible values are 1  Asymmetric binary variable (0/1)
%                           2  Nominal variable (includes symmetric binary)
%                           3  Ordinal variable
%                           4  Interval variable
%
% Optional input arguments:
%   metric : Metric to be used (default euclidian (eucli) or mixed (mixed))
%       Possible values are ‘eucli‘ Euclidian (all interval variables)
%                           ‘manha‘ Manhattan
%                           ‘mixed‘ Mixed (not all interval variables)
%
% I/O:
%   result=daisy(xvtype‘eucli‘)
%
% Example (subtracted from the referenced book)
%   load flower.mat
%   result=daisy(flower[2 2 1 2 3 3 4]);
%
% The output of DAISY is a structure containing:
%   result.disv       : dissimilarities (read row by row from the
%                       lower dissimilarity matrix)
%   result.metric     : used metric
%   result.number     : number of observations
%
% This function is part of LIBRA: the Matlab Library for Robust Analysis
% available at:
%              http://wis.kuleuven.be/stat/robust.html
%
% Written by Guy Brys and Wai Yan Kong (May 2006)

%Checking and filling in the inputs
if (nargin<2)
    error(‘Two input arguments required‘)
elseif (nargin<3)
    if (sum(vtype)~=4*size(x2))
        metric = ‘mixed‘;
        metr = 0;
    else
        metric = ‘eucli‘;
        metr = 1;
    end
elseif (nargin==3)
    if strcmp(metric‘eucli‘)
        metr=1;
    elseif strcmp(metric‘manha‘)
        metr=2;
    elseif strcmp(metric‘mixed‘)
        metr=0;
    end
end

%Standardizing in case of mixed metric
if (sum(vtype)~=4*size(x2))
    colmin = min(x);
    colextr = max(x)-colmin;
    x = (x - repmat(colminsize(x1)1))./repmat(colextrsize(x1)1);
end

%Replacement of missing values
jtmd = repmat(11size(x2))-2*(sum(isnan(x))>0);
valmisdat = min(min(x))-0.5;
x(isnan(x)) = valmisdat;
valmd = repmat(valmisdat1size(x2));

%Actual calculations
disv=daisyc(size(x1)size(x2)xvalmdjtmdvtypemetr);

%Putting things together
result = struct(‘disv‘disv‘metric‘metric‘number‘size(x1));



 属性            大小     日期    时间   名称
----------- ---------  ---------- -----  ----
     文件         723  2009-07-07 21:42  Notice_contributedFiles.txt
     文件        3863  2009-07-01 15:03  ReadmeChinese.txt
     文件        5259  2009-07-01 15:03  ReadmeEnglish.txt
     文件        2831  2006-09-19 21:13  daisy.m
     文件        8704  2006-05-09 14:18  daisyc.dll
     文件         227  2007-04-05 13:11  ind2cluster.m
     文件       20832  2006-12-11 21:40  leuk72_3k.txt
     文件        1337  2009-07-09 03:42  license.txt
     文件        3877  2009-07-01 15:06  mainClusterValidationNC.m
     文件        8288  2006-10-25 03:01  pam.m
     文件       12800  2006-05-09 14:22  pamc.dll
     文件         514  2006-12-18 20:46  similarity_euclid.m
     文件         479  2007-03-11 14:35  similarity_pearson.m
     文件         556  2007-03-11 03:25  similarity_pearsonC.m
     文件         304  2006-12-18 20:52  standarz.m
     文件        1718  2006-10-25 00:49  valid_RandIndex.m
     文件         961  2007-02-10 19:49  valid_clusterIndex.m
     文件         780  2007-04-05 13:32  valid_errorate.m
     文件         621  2007-03-11 04:02  valid_findk.m
     文件         823  2007-03-15 12:59  valid_index_plot.m
     文件         881  2007-03-15 13:10  valid_internal_deviation.m
     文件        1201  2007-03-15 14:05  valid_internal_intra.m
     文件        1258  2007-03-11 03:28  valid_intrainter.m
     文件         889  2007-03-11 02:49  valid_sumpearson.m
     文件        1375  2007-03-11 02:47  valid_sumsqures.m
     文件        1936  2007-06-15 00:53  validity_Index.m
     文件        1429  2004-07-31 21:28  xlim2.m

评论

共有 条评论