• 大小: 6.09MB
    文件类型: .zip
    金币: 1
    下载: 0 次
    发布日期: 2023-11-01
  • 语言: Python
  • 标签: 中文  英文  分词  

资源简介

结巴分词,很不错的分词工具,python写的,亲身试用,不管英文还是中文分得很准!

资源截图

代码片段和文件信息

from distutils.core import setup  
setup(name=‘jieba‘  
      version=‘0.32‘  
      description=‘Chinese Words Segementation Utilities‘  
      author=‘Sun Junyi‘  
      author_email=‘ccnusjy@gmail.com‘  
      url=‘http://github.com/fxsjy‘  
      packages=[‘jieba‘]  
      package_dir={‘jieba‘:‘jieba‘}
      package_data={‘jieba‘:[‘*.*‘‘finalseg/*‘‘analyse/*‘‘posseg/*‘]}
)  

 属性            大小     日期    时间   名称
----------- ---------  ---------- -----  ----
     文件         247  2014-02-07 15:33  jieba-0.32\PKG-INFO
     文件         405  2014-02-07 15:00  jieba-0.32\setup.py
     文件     5420898  2014-02-07 14:34  jieba-0.32\jieba\dict.txt
     文件       12779  2013-12-05 13:35  jieba-0.32\jieba\__init__.py
     文件        1461  2013-12-05 13:35  jieba-0.32\jieba\analyse\analyzer.py
     文件     6471088  2013-12-05 13:24  jieba-0.32\jieba\analyse\idf.txt
     文件        1212  2013-12-05 13:35  jieba-0.32\jieba\analyse\__init__.py
     文件      598842  2013-12-05 13:24  jieba-0.32\jieba\finalseg\prob_emit.p
     文件     1392139  2013-12-05 13:35  jieba-0.32\jieba\finalseg\prob_emit.py
     文件          62  2013-12-05 13:24  jieba-0.32\jieba\finalseg\prob_start.p
     文件          97  2013-12-05 13:24  jieba-0.32\jieba\finalseg\prob_start.py
     文件         146  2013-12-05 13:24  jieba-0.32\jieba\finalseg\prob_trans.p
     文件         245  2013-12-05 13:24  jieba-0.32\jieba\finalseg\prob_trans.py
     文件        2950  2013-12-05 13:35  jieba-0.32\jieba\finalseg\__init__.py
     文件     1078947  2013-12-05 13:24  jieba-0.32\jieba\posseg\char_state_tab.p
     文件     1685707  2014-01-28 13:04  jieba-0.32\jieba\posseg\char_state_tab.py
     文件     1522393  2013-12-05 13:24  jieba-0.32\jieba\posseg\prob_emit.p
     文件     4165709  2013-12-05 13:35  jieba-0.32\jieba\posseg\prob_emit.py
     文件        6321  2013-12-05 13:24  jieba-0.32\jieba\posseg\prob_start.p
     文件        7460  2013-12-05 13:24  jieba-0.32\jieba\posseg\prob_start.py
     文件      129695  2013-12-05 13:24  jieba-0.32\jieba\posseg\prob_trans.p
     文件      252619  2013-12-05 13:24  jieba-0.32\jieba\posseg\prob_trans.py
     文件        1581  2014-01-28 12:52  jieba-0.32\jieba\posseg\viterbi.py
     文件        7675  2014-01-28 13:48  jieba-0.32\jieba\posseg\__init__.py
     文件        5072  2013-12-05 13:35  jieba-0.32\test\test.py
     文件         169  2014-01-28 10:44  jieba-0.32\test\test_bug.py
     文件         860  2013-12-05 13:35  jieba-0.32\test\test_change_dictpath.py
     文件        4853  2013-12-05 13:35  jieba-0.32\test\test_cutall.py
     文件        4851  2013-12-05 13:35  jieba-0.32\test\test_cut_for_search.py
     文件         413  2013-12-05 13:35  jieba-0.32\test\test_file.py
     文件         856  2013-12-05 13:35  jieba-0.32\test\test_multithread.py
............此处省略10个文件信息

评论

共有 条评论