• 大小: 9.51MB
    文件类型: .zip
    金币: 1
    下载: 0 次
    发布日期: 2023-10-17
  • 语言: Java
  • 标签: vsm  java  源码  

资源简介

vsm向量空间模型java实现(源码) 已经测试了,可以直接导入eclipse使用。

资源截图

代码片段和文件信息

/**
 * @author Orisun
 * 打印输出微量空间模型中每个特征项出现的顺序
 */
import java.io.BufferedReader;
import java.io.BufferedWriter;
import java.io.File;
import java.io.FileReader;
import java.io.FileWriter;
import java.io.IOException;
import java.util.HashMap;

public class OutFeatureHash {
    final int vec_len = 1000;
    public static HashMap features = new HashMap();// 存放最终选择的特征词

    // 从文件中读入特征项。参数文件存储经过特征选择后剩下的特征项。
    public void initFeatures(File file) {
        features.clear();
        try {
            FileReader fr = new FileReader(file);
            BufferedReader br = new BufferedReader(fr);
            String line = null;
            int i = 0;
            while ((line = br.readLine()) != null && i++ < vec_len) {
                String[] words = line.split(“\\s+“);
                features.put(words[0] Double.valueOf(words[1]));
            }
        } catch (Exception e) {
            e.printStackTrace();
        }
    }
    public static void main(String[] args){
        OutFeatureHash inst=new OutFeatureHash();
        inst.initFeatures(new File(“/home/orisun/master/fudan_corpus/4000_features“));
        object[] feature_array = features.keySet().toArray();
        File seqfile=new File(“/home/orisun/master/fudan_corpus/vsm_termsequence_1000“);
        try {
            if(!seqfile.exists())
                seqfile.createNewFile();
            FileWriter fw=new FileWriter(seqfile);
            BufferedWriter bw=new BufferedWriter(fw);
            for (int i = 0; i < feature_array.length; i++) {
                String feat = feature_array[i].toString();
                bw.write(feat+“ “);        //用一个空格隔开
            }    
            bw.flush();
            bw.close();
        } catch (IOException e) {
            // TODO Auto-generated catch block
            e.printStackTrace();
        }
    }
}

 属性            大小     日期    时间   名称
----------- ---------  ---------- -----  ----
     目录           0  2015-12-24 10:41  vsm向量空间模型java实现\
     目录           0  2015-12-24 10:40  vsm向量空间模型java实现\ifidf\
     文件         301  2015-12-23 13:53  vsm向量空间模型java实现\ifidf\.classpath
     文件         381  2015-12-23 13:53  vsm向量空间模型java实现\ifidf\.project
     目录           0  2015-12-24 10:40  vsm向量空间模型java实现\ifidf\.settings\
     文件         598  2015-12-23 13:53  vsm向量空间模型java实现\ifidf\.settings\org.eclipse.jdt.core.prefs
     目录           0  2015-12-24 10:40  vsm向量空间模型java实现\ifidf\bin\
     目录           0  2015-12-24 10:31  vsm向量空间模型java实现\ifidf\bin\algorithm\
     文件       28966  2015-12-15 15:30  vsm向量空间模型java实现\ifidf\bin\article.txt
     目录           0  2015-12-24 10:40  vsm向量空间模型java实现\ifidf\bin\com\
     目录           0  2015-12-24 10:40  vsm向量空间模型java实现\ifidf\bin\com\baseframework\
     目录           0  2015-12-24 10:40  vsm向量空间模型java实现\ifidf\bin\com\baseframework\sort\
     文件        4742  2015-12-24 10:28  vsm向量空间模型java实现\ifidf\bin\com\baseframework\sort\VsmMain.class
     文件     1212694  2012-09-06 16:56  vsm向量空间模型java实现\ifidf\bin\IKAnalyzer-2012.jar
     文件     1398580  2012-09-06 16:57  vsm向量空间模型java实现\ifidf\bin\lucene-core-3.4.0.jar
     目录           0  2015-12-24 10:40  vsm向量空间模型java实现\ifidf\bin\org\
     目录           0  2015-12-24 10:40  vsm向量空间模型java实现\ifidf\bin\org\wltea\
     目录           0  2015-12-24 10:40  vsm向量空间模型java实现\ifidf\bin\org\wltea\analyzer\
     目录           0  2015-12-24 10:40  vsm向量空间模型java实现\ifidf\bin\org\wltea\analyzer\core\
     文件     1212694  2015-12-23 13:57  vsm向量空间模型java实现\ifidf\bin\org\wltea\analyzer\core\IKAnalyzer-2012.jar
     文件     1398580  2015-12-23 13:57  vsm向量空间模型java实现\ifidf\bin\org\wltea\analyzer\core\lucene-core-3.4.0.jar
     文件        2860  2015-12-24 10:18  vsm向量空间模型java实现\ifidf\bin\OutFeatureHash.class
     文件       17768  2015-12-15 15:26  vsm向量空间模型java实现\ifidf\bin\sort.txt
     目录           0  2015-12-24 10:40  vsm向量空间模型java实现\ifidf\src\
     目录           0  2015-12-24 10:31  vsm向量空间模型java实现\ifidf\src\algorithm\
     目录           0  2015-12-24 10:40  vsm向量空间模型java实现\ifidf\src\com\
     目录           0  2015-12-24 10:40  vsm向量空间模型java实现\ifidf\src\com\baseframework\
     目录           0  2015-12-24 10:40  vsm向量空间模型java实现\ifidf\src\com\baseframework\sort\
     文件        3469  2015-12-24 10:28  vsm向量空间模型java实现\ifidf\src\com\baseframework\sort\VsmMain.java
     文件     1212694  2012-09-06 16:56  vsm向量空间模型java实现\ifidf\src\IKAnalyzer-2012.jar
     文件     1398580  2012-09-06 16:57  vsm向量空间模型java实现\ifidf\src\lucene-core-3.4.0.jar
............此处省略11个文件信息

评论

共有 条评论