首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 62 毫秒
1.
词义消歧是自然语言处理领域的基本任务.在词语词向量表示的基础上,计算获得多义词语上下文窗口的向量表示.利用统计的多义词及词义个数,基于K-means算法聚类文本语料集中多义词的上下文窗口表示,在原始文本语料集中对多义词语根据聚类类别进行标记.在标记的文本语料集上,训练获得多义词语每个词义的向量表示.对句子中的多义词语,给出了一种基于多义词向量表示的词义消歧方法,实验结果显示该方法有效可行.  相似文献   

2.
李迎凯  徐小良 《电子科技》2012,25(7):69-71,75
针对基于词项的句子相似度计算存在信息冗余干扰和局部最优的缺陷,提出一种改进的基于知网的句子相似度计算方法。该方法通过增加筛选候选语句以降低冗余信息对准确度造成的干扰,同时在分词和词性标注的基础上,采用改进的带权最大二分图匹配算法获得全局最优匹配。实验结果表明,文中提出的方法有效地提高了句子相似度计算的准确度。  相似文献   

3.
目前计算机辅助翻译在相似度计算方面存在很大的局限性,精度较低。针对特定领域,收集领域相关的训练语料,采用Google的word2vec进行英语和汉语的词向量模型构建,设计并实现汉语句子的相似度计算方法,提出基于词向量Jaccard相似度与基于词向量依存句法相结合的相似度计算方法,实验结果显示其效果比传统方法有较大提升。最后,将相关英汉句子相似度算法以接口的形式封装,作为商品化软件华建IAT系统的相似度计算模块投入实际应用。  相似文献   

4.
词语相似度的计算在机器翻译、信息检索等多个领域有重要作用。该文以概念层次网络理论的概念基元符号系统为语义资源,在共性与差异性对比思想下,提出一个涵盖层次性、网络性、对比对偶特性、挂靠特性及五元组信息的多维度词语相似度计算方法;在节点深度和节点距离度量上,引入权重以增加不同层次间的区分程度。在人工打分的测试集上进行实验,结果表明该方法计算的相似度与人工判断的符合程度较好,兼容度、相关系数和序对符合度分别达到0.812, 0.786和0.775;同时,相关性检验的结果也显示该方法的计算值与人工打分显著相关。  相似文献   

5.
针对中文词语相似度计算的问题,根据信息论中两个事物相似度计算的思想,提出一种基于知网义原信息量和义原及其角色关系的中文词语相似度计算方法,利用知网分类体系计算出词语义原信息量,根据义原信息量计算出词语概念间主类义原的相似度,结合词语概念中义原及其角色关系相似度及义原结点相似度来综合计算词语的相似度,与刘群、知网在线的方法及人工判断的相似度值进行了比较,实验结果显示该方法与人的判断更接近。  相似文献   

6.
近年来,基于基因本体比较基因之间的功能相似度成为一个研究热点.当前,基因功能相似度计算方法可以分为2种类型:逐对(pair-wise)比较法和成组(group-wise)比较法.然而,由于基因本体注释数据的丰度问题,造成大量的基因具有相同的本体注释数据,从而导致基因功能相似度计算方法的结果存在偏差.本文提出一种改进的基因功能相似度计算方法,对注释集合的语义信息量进行归一化,达到准确度量基因之间的功能相似度的目的.实验结果表明:本文提出的方法可以消除相同注释对基因功能相似度计算方法的影响,且在测试平台上获得非常优秀的结果.  相似文献   

7.
一种改进的基于加权模型的概念相似度计算方法   总被引:1,自引:0,他引:1  
分析了目前主流的概念相似度的运算形式,对概念相似度计算模型提出了改进.该计算模型在计算初始主流概念相似度的基础上,不仅引入了深度、密度因子,还考虑了有向边类型权重因子在计算相似度中所起的作用,完善了计算方法.通过试验结果可以看出,该方法对概念相似度的计算更准确地体现出了概念间的相似程度.  相似文献   

8.
句子相似计算技术能够得到两个句子的相似关系,在敏感数据检测领域具有广阔的应用前景.因此,提出了一种融合依存句法和Word Rotator's Distance语义距离的句子相似计算方法.通过依存句法分析句子结构并提取各种依存关系词集,计算对应依存关系词集间的Word Rotator's Distance语义距离,并最终...  相似文献   

9.
人工智能与知识工程知网在词语相似度计算方面的应用   总被引:6,自引:0,他引:6  
本论文讨论利用知网从中文语义的角度计算词语相似度。计算文档之间的相关性已经成为解决信息处理问题的根本之道。分析待处理的文档和用户信息需求的语义,从语义的层面上,计算它们之间的相关性.为实现更深层次的信息处理做准备。因此从词义的角度对词语相似度的计算就成了首先要解决的问题。可以说词语相似度的计算是实现数据挖掘、信息过滤、信息分类、信息检索等信息处理的前提。  相似文献   

10.
费丽娟 《电子世界》2013,(12):205-206
在信息检索领域,概念间的相似度计算是实现高效率、高命中率搜索的前提。本文针对现有相似度计算方法的不足,提出一种综合的计算本体间概念相似度的方法。该方法分别计算两个概念的名称相似度、属性相似度和结构相似度,最后综合得到两个概念间的相似度,实验结果证明该方法有效。  相似文献   

11.
句子相似度的计算在自然语言处理的各个领域有很广泛的应用,但跨语言的句子相似度计算方法却非常少。文中提出一种基于互译特征词对匹配,构建老-汉双语句子相似度计算方法,改进了传统的依赖于词形词序通过计算相同词个数和共有单词的位置信息的相似度计算方法,充分考虑了老挝语和汉语句子中的词汇互译信息、相似概率,避免了由于特征词位置导致的精度丢失。此方法用来最终识别相似度较高的老-汉双语平行句对,依据相似度对源句子和目标句子进行对齐,在老-汉双语平行语料库的建设中使用。实验结果表明,此方法在一定程度上提高了老-汉双语句子相似度计算的准确率。  相似文献   

12.
在图像处理领域中任意两幅图像都有一定的相似度,它往往是用图像的信噪比来衡量的,但是实验结果表明存在代表同一内容的两幅图像的信噪比却低于代表不同内容的两幅图像的信噪比的情况,这是不合理的,文中通过统计分析待求信噪比的两幅图像的有关特性,自动生成一个系数,对结果图像的每一个像素都乘以该系数,可以提高两幅图像的相似度,且绝对不会降低任意两幅的相似度,实验结果和理论分析说明了文中方法的有效性。  相似文献   

13.
立体图像质量评价已成为国内外的研究热点。结构相似度算法虽简单高效,但不能较好地评价噪声与模糊立体图像的质量。文中将结构相似度函数引入频域,并使用空间位置影响系数计算平均结构相似度,对立体图像质量做出评价,结合绝对差值图对立体感做出评价。实验结果表明,该方法的评价结果与主观评价结果相关性较强。  相似文献   

14.
Coding method for vector representation of engineering drawings   总被引:1,自引:0,他引:1  
Many engineering drawings exist today that are still subject to change yet do not have the benefit of computer-aided design and drafting because of the cost and difficulties associated with placing them into automated graphics systems. This paper describes a new efficient vector coding method which extracts vector information in real time from raster data acquired by optically scanning and digitizing. The resultant representation of the engineering drawing can be displayed on a CRT terminal or on a plotter as a hard copy, can be rapidly edited or revised to reflect future changes and facilitates fast transfer of drawings over telephone lines to other locations enabling remote viewing and changing. Experimental results in terms of data compaction are presented for a variety of engineering drawings, including one of the CCITT standard test documents.  相似文献   

15.
为进一步强化航道安全,解决海事CCTV人工值守、非自动化问题,提出了基于稀疏表示的船体检测方法。利用稀疏表示实现对船体的检测时,首先构建样本特征矩阵,然后利用K-SVD算法对样本特征矩阵进行学习,得到冗余字典,最后对测试样本进行重构,根据马氏距离判断测试样本属性。通过与传统方法的试验比较,实验结果表明,该算法实时性好、检测准确率高,可以很好地对CCTV视频监控的船体进行检测与跟踪,解决CCTV人工值守、非自动化问题,节省大量人力资源。  相似文献   

16.
在Web行为挖掘中,序列模式聚类是一个很重要的课题,其首要问题就是web序列模式间的相似性度量.以往的多数方法都仅仅针对序列本身进行度量,而忽略了系统中资源本身所存在的关联关系以及用户对资源访问的时间因素.针对该问题,提出了一种基于考虑资源相似性的web访问序列模式的相似度量方法,并且考虑了用户访问资源的时间因素.经过检验,证明能够有效真实地反映实际情况.  相似文献   

17.
李争光  宋利 《信息技术》2012,(5):82-87,91
复杂网络中往往存在着社团结构,通过发现网络中的社团结构,可以以社团为单位研究网络的特性和隐藏的规律,从而降低了研究大型复杂网络的难度。文中提出了一种基于结点相似性的层次化社团发现算法,设计了方法选取最佳的边权重阈值,首先得到局部核心树结构,并经过两次扩散步骤,得到网络的社团划分结果。仿真实验表明,提出的算法在较低的时间复杂度下能够取得较高的社团发现准确度。  相似文献   

18.
针对传统短语对齐方法依赖外部资源,且较少涉及平行句对内在特征的问题,提出了融入双语词向量的韩汉名词短语对齐方法.利用平行语料,分别训练单语词向量再进行跨语言映射得到双语词向量,并构建了基于短语构成规律的短语抽取和融入双语词向量、短语长度和词性相似度的短语对齐模型.实验结果证明,融入韩汉双语词向量,能更有效地提取短语特征从而实现短语对齐.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号