• 大小: 742KB
    文件类型: .rar
    金币: 1
    下载: 0 次
    发布日期: 2021-05-14
  • 语言: 其他
  • 标签: 6类实体  

资源简介

该数据集是用于命名实体识别训练模型的数据集,该数据集中包含6中标签,分别是人名、地名、时间、组织机构名、公司名、产品名。遵循BIO编码。里面有三个文件,分别是训练集,测试集,验证集。样例如下: 以 O 及 O 以 O 康 B-COMPANY_NAME 宽 I-COMPANY_NAME 为 O 代 O 表 O 的 O 国 O 外 O 专 O 利 O 产 O 品 O 低 O 毒 O 杀 O 虫 O 剂 O 吡 B-PRODUCT_NAME 虫 I-PRODUCT_NAME 啉 I-PRODUCT_NAME 和 O 生 O 物 O 农 O 药 O 阿 B-PRODUCT_NAME 维 I-PRODU

资源截图

代码片段和文件信息

 属性            大小     日期    时间   名称
----------- ---------  ---------- -----  ----

     文件     463204  2020-10-26 15:03  命名实体识别数据集\dev.txt

     文件     465339  2020-10-26 15:03  命名实体识别数据集\test.txt

     文件    3533573  2020-10-26 14:14  命名实体识别数据集\train.txt

     目录          0  2020-11-03 11:01  命名实体识别数据集

----------- ---------  ---------- -----  ----

              4462116                    4


评论

共有 条评论