• 大小: 108.12MB
    文件类型: .zip
    金币: 2
    下载: 1 次
    发布日期: 2022-09-23
  • 语言: 其他
  • 标签: NLP  语料  中文语料  

资源简介

本次提供的中文汉语语料syj_trainCorpus_utf8.txt全网免费,转载需要注明出处,语料是作者通过爬取的短文本和网络上的预料处理、合并生成的。整个语料大小264M,包含1116903条数据,数据用空格隔开,可以用来训练分词模型。

资源截图

代码片段和文件信息

评论

共有 条评论