排序方式: 共有54条查询结果,搜索用时 0 毫秒
41.
文本特征是文本的固有属性,进行合理使用,对后期文本处理有着非常大的影响.针对广泛使用的基于统计的表示方法无法表达文本的深层语义信息,文章引入商空间粒度合成理论,提出了一种新的文本表示方法.该方法将文本的不同特征作为不同的观察角度,构成各个粒度世界,将文本映射到各个粒度世界中,获得文本在各个观察角度的描述;然后使用商空间粒度合成理论将它们组织起来,以期获得对文本的更全面的表示.实验结果表明该模型能够更准确的表达文本信息. 相似文献
42.
针对传统的基于义原同现频率的汉语词义排歧方法存在“盲目性”的不足,笔者根据《知网》中对概念定义的描述,分别计算多义词的每个义项与特征词的第一独立义原、其他独立义原、关系义原、符号义原之间的相关系数;最后通过比较多义词的每个义项与特征词之间的相关系数来决定多义词的义项.经过实验验证,该方法进一步提高了词义排歧的效果. 相似文献
43.
李国佳 《智能计算机与应用》2015,(3):49-52
针对中文词语相似度计算的问题,根据信息论中两个事物相似度计算的思想,提出一种基于知网义原信息量和义原及其角色关系的中文词语相似度计算方法,利用知网分类体系计算出词语义原信息量,根据义原信息量计算出词语概念间主类义原的相似度,结合词语概念中义原及其角色关系相似度及义原结点相似度来综合计算词语的相似度,与刘群、知网在线的方法及人工判断的相似度值进行了比较,实验结果显示该方法与人的判断更接近。 相似文献
44.
针对当前基于《知网》的词汇语义相似度计算方法没有充分考虑知识库描述语言对概念描述的线性特征的情况,提出一种改进的词汇语义相似度计算方法。首先,充分考虑概念描述式中各义原之间的线性关系,提出一种位置相关的权重分配策略;然后,将所提出的策略结合二部图最大权匹配进行概念相似度计算。实验结果表明,采用改进方法得到的聚类结果F值较对比方法平均提高了5%,从而验证了改进方法的合理性和有效性。 相似文献
45.
提出了一种简单有效的词语语义相似度的计算方法,该方法利用《知网》中提取的1500多个义原,首先定义义原的距离,考虑到义原的深度、密度及参数对相似度的影响因素,定义了词语相似度。通过实例分析,该方法是行之有效地。 相似文献
46.
47.
48.
49.
50.