• 大小: 234B
    文件类型: .zip
    金币: 2
    下载: 0 次
    发布日期: 2024-01-05
  • 语言: Python
  • 标签: wiki中文  

资源简介

中文维基百科语料库,将其转换为文本文件后,进行繁体字转换为简体字,字符集转换,分词,然后训练得到模型以及向量。由于文件上传的大小限制是60MB,而训练后的所有文件大小有1G以上,所以这里只提供了下载链接,地址在网盘中。使用python中的gensim包进行训练得到的,运行时间较长,纯粹的维基百科中文语料训练后的结果,拿去可以直接使用。

资源截图

代码片段和文件信息

 属性            大小     日期    时间   名称
----------- ---------  ---------- -----  ----
     文件          52  2017-02-23 10:35  wiki.zh.text.vector_url

评论

共有 条评论

相关资源