• 大小: 14KB
    文件类型: .rar
    金币: 1
    下载: 0 次
    发布日期: 2021-01-02
  • 语言: Java
  • 标签: vertebi  

资源简介

用java实现了维特比算法,用于词性标注。 备注:这里并不包括训练集与测试集

资源截图

代码片段和文件信息

import java.io.*;
import java.util.ArrayList;
import java.util.HashMap;
import java.util.Iterator;


public class MTpre 
{
public int tranCountSum =0; //记录转移的总次数
public HashMap  posContext = new HashMap();
//pos part of speech词性,后面也是这样
public HashMap > wordInfo= new HashMap >();
public HashMap  posSum = new HashMap();
//存储词性出现的总次数

public void preprocess(File corpus) throws IOException
/*
* 预处理
* 输入为文件夹
* 输出为一个序列化之后的两个文件
* 文件transfer存储的是词性的转移次数
* 文件wordInfo 存储的是词以及对应出现的词性和次数
*/
{
if(!corpus.isDirectory())
{
System.out.println(“corpus不是文件夹,检查格式“);
return;
}
for(int k=0; k

 属性            大小     日期    时间   名称
----------- ---------  ---------- -----  ----

     文件        301  2010-11-25 09:07  MT\.classpath

     文件        378  2010-11-25 09:07  MT\.project

     文件        629  2010-11-25 09:07  MT\.settings\org.eclipse.jdt.core.prefs

     文件       4068  2010-12-07 14:24  MT\bin\MTpre.class

     文件       7063  2010-12-09 21:15  MT\bin\MTtest.class

     文件       2822  2010-12-06 14:53  MT\bin\MTtrain.class

     文件       5896  2010-12-07 14:24  MT\src\MTpre.java

     文件       7064  2010-12-09 21:15  MT\src\MTtest.java

     文件       2577  2010-12-06 14:53  MT\src\MTtrain.java

     目录          0  2011-02-22 15:41  MT\.settings

     目录          0  2011-02-22 15:41  MT\bin

     目录          0  2011-02-22 15:41  MT\src

     目录          0  2011-02-22 15:41  MT

----------- ---------  ---------- -----  ----

                30798                    13


评论

共有 条评论

相关资源