资源简介
在使用TF-IDF算法进行自然语言处理时,大家在处理文本时会首先进行切割,生成包含所有词的词典,但此时往往会有许多重复的词,这些词可能是经常使用的词,比如”的“,这样的词语太多会影响处理效果,因此需要去掉这些停用词在进行处理,在此提供停用词表!
代码片段和文件信息
相关资源
- 台湾大学NTUSD简体中文情感词典+知网
- tf-idf算法.zip
- NLPIR分词、去停用词
- jieba分词词典和停用词
- 内涵词云、jieba自定义字典、停用词、
- 文本分类所需停用词表
- 中文文本分类语料由复旦大学李荣陆
- 中文敏感词库、各种停用词表以及各
- 复旦完整版语料库+停用词+精选10类每
- 情感分析字典,停用词,情感字典,
- 百度停用词表
- 文本分析---哈工大,百度等停用词集
- 文本分析--停用词集合结合哈工大停用
- 中文停用词表共2694个
- 各种版本的停用词表集合
- 2018最新停用词词典
- 中文英文标点符号都包括的停用词
- 超级全面的完整停用词表
- 中文最全停用词
- 中文文本停用词表
- 用来测试tf-idf的4个新闻
- 多种中文分词停用词表
- 中文常见的停用词表 TXT文档
- 文本分类时所用的中英文停用词表
- 整理的停用词库
- 常见停用词词典
- 中文最全停用词表,个人整理1704个
- 自然语言处理-中文停用词表1893个
- 最新中文停用词表1208个
- 中文停用词库 chineseStopWords.txt
评论
共有 条评论