资源简介

在聚类分析、机器学习、数据挖掘中常用到的数据集,包括:UCI的数据集wine,yeast,iris等,还有USPS数据集,4k2_far,leuk72_3k数据集等。

资源截图

代码片段和文件信息

clear all;
clc;
load(‘USPStrainingdata.mat‘);%读入训练样本数据库
[charNumbersdimension]=size(traindata);%获得样本数据库中样本中个数charNumbers和每个字符向量维数dimension
image=zeros(1616);%初始化归一化图像
P=mat2gray(traindata);%转换为灰度图像
fid = fopen(‘usps.bin‘‘wb‘);
startx=0;
overx=0;
len=0;
for k=1:50
    class=find(traintarg(k:)==1)-1;%获取当前字符的类别
    for i=1:16
        for j=1:16
            image(ij)=P(k(i-1)*16+j);
        end
    end
    th= graythresh(image);%求灰度图像的阈值th
    I=im2bw(imageth);%二值化字符图像
    I=~I;
    %      g=bwmorph(I‘thin‘1);%细化二值化图形
    %      subplot(510k)imshow(~I);%显示字符图像
    fwrite(fidclass‘uchar‘); %记录字符图像的类别
    fwrite(fid255‘uchar‘); %记录字符图像的类别
    fwrite(fid255‘uchar‘); %记录字符图像的类别
    for i=1:16
        for j=1:16
            pixel=I(ij);
            if (~startx & ~overx & pixel==0)
                beginx = j-1;
                beginy = i-1;
                startx = 1;
            end
            %遇到第一个白色像素
            if (~overx & startx && pixel==1)

                endx = j-1;
                overx = 1;
            end
            %已经到了行尾
            if (~overx & startx & pixel==0 && j==16)

                endx = j-1;
                overx = 1;
            end
            if (startx==1 && overx==1)
                length = endx - beginx;
                startx = 0;
                overx = 0;
                fwrite(fidbeginx‘uchar‘); %写入图象的宽度和高度
                fwrite(fidbeginy‘uchar‘); %写入图象的宽度和高度
                fwrite(fidlength‘uchar‘); %写入图象的宽度和高度
                length=0;
                found=1;
            end
        end
    end
    %写入结束标志
    if (found==1)
        fwrite(fid0‘uchar‘); %写入图象的宽度和高度
        fwrite(fid0‘uchar‘); %写入图象的宽度和高度
        fwrite(fid0‘uchar‘); %写入图象的宽度和高度
    end
end
fclose(fid);








 属性            大小     日期    时间   名称
----------- ---------  ---------- -----  ----

     文件       4698  2014-03-19 19:49  Iris.txt

     文件      20832  2006-12-11 16:40  leuk72_3k.txt

     文件       1203  2014-03-19 19:47  Wine Description.txt

     文件      10958  2014-03-19 19:47  wine.txt

     文件      96458  2014-03-19 20:36  yeast.txt

     文件       2216  2004-05-23 17:29  UCI_arff\accuracy.txt

     文件     143336  1999-04-07 14:33  UCI_arff\arff\anneal.arff

     文件     129637  2004-05-23 12:20  UCI_arff\arff\artificial.arff

     文件      45903  1999-04-07 14:33  UCI_arff\arff\audiology.arff

     文件      13356  2004-05-22 17:16  UCI_arff\arff\auto-mpg.arff

     文件      30676  1999-03-11 08:31  UCI_arff\arff\autos.arff

     文件       8714  1999-04-07 14:34  UCI_arff\arff\balance-scale.arff

     文件       3412  2004-05-22 17:42  UCI_arff\arff\balloons.arff

     文件      29418  1999-04-07 14:34  UCI_arff\arff\breast-cancer.arff

     文件      19167  1999-03-11 08:31  UCI_arff\arff\breast-w.arff

     文件      11330  2004-05-23 14:52  UCI_arff\arff\bridges2.arff

     文件     322654  2004-05-22 23:06  UCI_arff\arff\clean1.arff

     文件      63983  1999-04-07 14:35  UCI_arff\arff\colic.arff

     文件    5971512  2004-05-23 14:29  UCI_arff\arff\connect-4.arff

     文件      34315  1999-03-11 08:31  UCI_arff\arff\credit-a.arff

     文件     162249  1999-03-11 08:31  UCI_arff\arff\credit-g.arff

     文件      37419  1999-03-11 08:31  UCI_arff\arff\diabetes.arff

     文件       9964  2004-05-23 12:39  UCI_arff\arff\echocardiogram.arff

     文件      17325  2004-05-23 14:32  UCI_arff\arff\flag.arff

     文件      17823  1999-03-11 08:31  UCI_arff\arff\glass.arff

     文件       8231  2004-05-22 18:36  UCI_arff\arff\hayes-roth.arff

     文件      35596  1999-04-07 14:37  UCI_arff\arff\heart-c.arff

     文件      31259  1999-04-07 14:38  UCI_arff\arff\heart-h.arff

     文件      13151  1999-03-11 08:31  UCI_arff\arff\heart-statlog.arff

     文件      17135  1999-03-11 08:31  UCI_arff\arff\hepatitis.arff

............此处省略38个文件信息

评论

共有 条评论