• 大小: 1.87MB
    文件类型: .rar
    金币: 1
    下载: 0 次
    发布日期: 2023-08-31
  • 语言: Java
  • 标签: VSM  JAVA  

资源简介

向量空间模型(VSM)的JAVA实现,从文档表示到相似度计算,使用两种相似度计算方式:cos和tf-idf算法

资源截图

代码片段和文件信息

import java.util.*;

public class Doc {
int length;  //该文章term个数
Vector termVec; //该文章term集合
public Doc() { 
length = 0;
termVec = new Vector();
}
public String toString()
{
String s=“\nThe length is :“+this.length;
for(String t:termVec)
{
s+=t+“\n“;
}
return s;
}
}

 属性            大小     日期    时间   名称
----------- ---------  ---------- -----  ----

     文件       2794  2012-04-21 15:07  src\ChineseStopWords.txt

     文件        334  2012-04-21 14:49  src\Doc.java

     文件        164  2012-04-21 11:25  src\DocSimilarity.java

     文件    6380920  2012-04-21 11:32  src\edited1988.txt

     文件      11543  2012-04-21 17:52  src\Similarity.java

     文件        509  2012-04-21 13:11  src\Term.java

     目录          0  2012-04-21 11:42  src

----------- ---------  ---------- -----  ----

              6396264                    7


评论

共有 条评论