• 大小: 4KB
    文件类型: .py
    金币: 1
    下载: 0 次
    发布日期: 2021-01-03
  • 语言: Python
  • 标签:

资源简介

最新的词语相似度计算方法;基于词林和知网的词语相似度计算;版权归原作者所有,仅供学习交流使用;

资源截图

代码片段和文件信息

# -*- coding: utf-8 -*-
‘‘‘
@author: yaleimeng@sina.com
@license: (C) Copyright 2017
@desc: 混合采用词林和知网的相似度计算方法。得到更加符合人们感觉的相似度数值。
@DateTime: Created on 2018/1/25 at 上午 08:59 by PyCharm ‘‘‘

from hownet.howNet import How_Similarity
from cilin.ciLin import CilinSimilarity


class HybridSim():
    ‘‘‘
    混合相似度计算策略。使用了词林与知网词汇量的并集。扩大了词汇覆盖范围。
    ‘‘‘
    ci_lin = CilinSimilarity()  # 实例化词林相似度计算对象
    how_net = How_Similarity()  # 实例化知网相似度计算对象
    Common = ci_lin.vocab & how_net.vocab
    A = how_net.vocab - ci_lin.vocab
    B = ci_lin.vocab - how_net.vocab

    @classmethod
    def get_Final_sim(cls w1 w2):
        lin = cls.ci_lin.sim2016(w1 w2) if w1 in cls.ci_lin.vocab and w2 in cls.ci_lin.vocab else 0
        how = cls.how_net.calc(w1 w2) if w1 in cls.how_net.voca

评论

共有 条评论

相关资源