• 大小: 2.63MB
    文件类型: .zip
    金币: 1
    下载: 0 次
    发布日期: 2023-10-26
  • 语言: Java
  • 标签: JAVA  

资源简介

向量空间模型(VSM)的JAVA实现,从文档表示到相似度计算,使用两种相似度计算方式:cos和tf-idf算法,对错误进行修改

资源截图

代码片段和文件信息

import java.util.*;

public class Doc {
int length;  //该文章term个数
Vector termVec; //该文章term集合
public Doc() { 
length = 0;
termVec = new Vector();
}
public String toString()
{
String s=“\nThe length is :“+this.length;
for(String t:termVec)
{
s+=t+“\n“;
}
return s;
}
}

 属性            大小     日期    时间   名称
----------- ---------  ---------- -----  ----
     目录           0  2014-06-19 11:17  src\
     文件        3680  2014-06-19 09:35  src\ChineseStopWords.txt
     文件         344  2014-06-19 09:37  src\Doc.java
     文件         164  2014-06-19 09:38  src\DocSimilarity.java
     文件     8221775  2014-06-19 09:50  src\edited1988.txt
     文件       11950  2014-06-19 13:53  src\edited2014.txt
     文件       11648  2014-06-19 13:51  src\Similarity.java
     文件         536  2014-06-19 09:38  src\Term.java

评论

共有 条评论