• 大小: 10KB
    文件类型: .rar
    金币: 1
    下载: 0 次
    发布日期: 2021-06-07
  • 语言: Java
  • 标签: JAVA  TFIDF计算  

资源简介

使用JAVA编写的,分词、TFIDF相似度计算,K临近法聚类

资源截图

代码片段和文件信息

package textcluster;

import java.util.List;



 /// 
    /// 分词器接口
    /// 

    public interface ITokeniser
    {
        List partition(String input);
    }

 属性            大小     日期    时间   名称
----------- ---------  ---------- -----  ----

     文件        606  2009-05-07 10:45  wenbenjulei\input1.txt

     文件        606  2009-05-07 10:45  wenbenjulei\input2.txt

     文件        606  2009-05-07 10:45  wenbenjulei\wenbenjulei\input.txt

     文件        204  2009-05-07 11:02  wenbenjulei\wenbenjulei\ITokeniser.java

     文件       3474  2009-05-08 07:55  wenbenjulei\wenbenjulei\Program.java

     文件       1152  2009-05-07 22:02  wenbenjulei\wenbenjulei\StopWordsHandler.java

     文件       1392  2009-05-07 11:04  wenbenjulei\wenbenjulei\TermVector.java

     文件       6930  2009-05-08 10:27  wenbenjulei\wenbenjulei\TFIDFMeasure.java

     文件       1487  2009-05-07 21:58  wenbenjulei\wenbenjulei\Tokeniser.java

     文件       1510  2009-05-08 07:30  wenbenjulei\wenbenjulei\WawaCluster.java

     文件       5669  2009-05-08 07:57  wenbenjulei\wenbenjulei\WawaKMeans.java

     目录          0  2009-05-08 16:55  wenbenjulei\wenbenjulei

     目录          0  2016-03-29 19:03  wenbenjulei

----------- ---------  ---------- -----  ----

                23636                    13


评论

共有 条评论