• 大小: 3.40MB
    文件类型: .pdf
    金币: 1
    下载: 0 次
    发布日期: 2021-04-01
  • 语言: 其他
  • 标签:

资源简介

COCA 20000高频词汇。 COCA=Corpus of Contemporary American English (COCA) 这是英语国家使用频率最高的词汇集合。 从众多语料库(corpus)中提取。用大数据的方法从各种文体中自动生成一个词频表。这是当今最准确的词频表:美国当代语料库 coca 中的前20000个单词。 简单的说,coca就是把1990-2012年美国最有代表性的报纸,杂志,小说,学术,口语(口语可能是用的电视剧或者脱口秀之类的节目转录的)汇集起来,每部分各占1/5,生成4.5亿单词量语料库。

资源截图

代码片段和文件信息

评论

共有 条评论

相关资源