首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
基于相似度分析的拼写校正器   总被引:4,自引:0,他引:4  
吴炜  周闻钧  王力生 《计算机科学》2004,31(Z2):304-305
1引言 本文尝试通过分析单词之间的相似度确定用户输入的单词的正确形式.目前,拼写检查器一般是通过单词匹配来检索正确的单词,这样往往造成把属于同一词根的单词因为时态不同而认为是两个完全不同的单词.本文通过相似度来聚类属于同一词根的单词,只要适当地调整相似度的最小阈值就可以把属于同一词根而因时态变化造成的"异形"词聚类在同一类,然后在同一类中按相似性从大到小排列,返回前三个单词作为候选单词供用户参考.  相似文献   

2.
马远 《计算机应用研究》2021,38(6):1753-1758
方面级别的文本情感分析旨在针对一个句子中具体的方面单词来判断其情感极性.针对方面单词可能由多个单词组成、平均化所有单词的词向量容易导致语义错误或混乱,不同的文本单词对于方面单词的情感极性判断具有不同的影响力的问题,提出一种融合左右的双边注意力机制的方面级别的文本情感分析模型.首先,设计内部注意力机制来处理方面单词,并根据方面单词和上下文单词设计了双边交互注意力机制,最后将双边交互注意力的处理结果与方面单词处理值三个部分级联起来进行分类.模型在SemEval 2014中两个数据集上进行了实验,分别实现了81.33%和74.22%的准确率,相比较于机器学习和结合注意力机制的各种模型取得了更好的效果.  相似文献   

3.
基于X结构的词义选择利用单词所在的X结构,并与词典的用法部分的X结构相比较,通过比较结构及结构中其它词的相似性来决定单词的含义,单词间的相似性利用WordNet来实现.这一方法只要较少的学习例子,可以避免传统的基于单词同现的方法中需要大量的语料库及数据稀少等问题。  相似文献   

4.
大家还记得金山词霸的模糊查询通配符*和?的使用方法吧:*号可以代替零到多个字母,?号仅代表一个字母。当忘记一个单词中的某个字母可以用?来代替进行查询,如果仅记起单词的开头或结尾的几个字母,那么可以用*号代替另外的字母来进行模糊查询。通配符很大程度上解决了我们记单词不准确的问题。可是如果只记得单词  相似文献   

5.
研究了单词语义相似性计算方法,其中基于知识的方法和基于语料的方法是两种主要方法。这两种方法及其融合方法都把单词看成一个整体,主要利用单词外部信息进行语义相似性计算。近些年,出现了一些利用单词内部信息进行单词语义相似性计算的工作,它们使用汉字、部首、词根、词缀等来计算单词语义相似性。利用单词的内部结构解析,解决从细粒度到粗粒度的语义相似性推导,最终计算出单词间的语义相似性是单词语义相似性计算的必然阶段。当从外部信息转向内部信息时,可以改善已有单词语义相似性计算的性能,尤其是为低频词或未登录词的准确语义相似性计算提供了可能性。  相似文献   

6.
为优化文本聚类效果,提出一种基于单词超团理论的文本聚类方法.利用文档中单词的关联模式来评估文档间的相似度,将单词超团作为文档向量辅助信息,以图划分的方式进行聚类分析.对不同聚类方法的结果进行比较,证明基于单词超团的文本聚类方法能提高文本聚类的准确性.  相似文献   

7.
基于语境的语义排歧方法   总被引:8,自引:2,他引:6  
本文针对英汉机器翻译系统(ECMT)中的语义排歧问题,提出了一种根据单词与语境之间的关系以消除单词语义歧义的模型。该模型利用反映单词之间语义共现关系的知识库词典,对有歧义的单词作出排歧。为提高知识库的覆盖率,本模型在对大量语料进行分析的基础上建立起单词语义分类之间的相关程度矩阵,同时采用动态链表来表示和维护语境,给出了寻找歧义单词的最可能的语义的排歧算法。开放测试的实验结果表明本方法使语义排歧的正确率提高约10%。  相似文献   

8.
在英文TTS(text to speech)系统中,需要根据文本中每一个单词的发音来合成语音.由于在真实文本的处理中,无论词典规模如何大,都不可能包括文本中的每一个单词,所以需要使用某种算法来预测词典中未登录单词的发音.介绍了一种基于实例学习的方法,并在一个大规模的英语词典上进行了性能评测.结果表明,这种方法的单词发音正确率可以达到70.1%,显著地超过以往报导的其他自动预测方法.  相似文献   

9.
王宇 《电脑学习》2009,(5):101-102
本文介绍了Agent控件的特点、安装方法。并以一个使用Agent朗读英语文本的“有声词典”实例说明了如何在WEB中使用Agent控件来辅助小学生记忆单词.希望通过多媒体计算机形象直观的优势来提高小学生记忆单词的效率。  相似文献   

10.
一种基于视觉单词的图像检索方法   总被引:1,自引:0,他引:1  
刁蒙蒙  张菁  卓力  隋磊 《测控技术》2012,31(5):17-20
基于内容的图像检索技术最主要的问题是图像的低层特征和高层语义之间存在着"语义鸿沟"。受文本内容分析的启发,有研究学者借鉴传统词典中用文本单词组合解释术语的思路,将图像视为视觉单词的组合,利用一系列视觉单词的组合来描述图像的语义内容。为此,利用SIFT进行图像的视觉单词特征提取,然后构建视觉单词库,最后实现了一个基于视觉单词的图像检索系统。实验结果表明,该方法在一定程度上提高了图像检索的查准率。  相似文献   

11.
为了实现Web图像检索结果的聚类,提出了一种Web图像的图聚类方法.首先定义了两种类型关联:单词与图像结点之间的异构链接以及单词结点之间的同构链接.为了克服传统的TF-IDF方法不能直接反映单词与图像之间的语义关联局限性,提出并定义了单词可见度(visibility)这一属性,并将其集成到传统的tf-idf模型中以挖掘单词-图像之间关联的权重.根据LDA(latent Dirichlet allocation)模型,单词-单词之间关联权重通过一个定义的主题相关度函数来计算.最后,应用复杂图聚类和二部图协同谱聚类等算法验证了在图模型上引入两种相关性关联的有效性,达到了改进了Web图像聚类性能的目的.  相似文献   

12.
图像-文本相关性挖掘的Web图像聚类方法   总被引:1,自引:0,他引:1  
吴飞  韩亚洪  庄越挺  邵健 《软件学报》2010,21(7):1561-1575
为了实现Web图像检索结果的聚类,提出了一种Web图像的图聚类方法.首先定义了两种类型关联:单词与图像结点之间的异构链接以及单词结点之间的同构链接.为了克服传统的TF-IDF方法不能直接反映单词与图像之间的语义关联局限性,提出并定义了单词可见度(visibility)这一属性,并将其集成到传统的tf-idf模型中以挖掘单词-图像之间关联的权重.根据LDA(latent Dirichlet allocation)模型,单词-单词之间关联权重通过一个定义的主题相关度函数来计算.最后,应用复杂图聚类和二部图协同谱聚类等算法验证了在图模型上引入两种相关性关联的有效性,达到了改进了Web图像聚类性能的目的.  相似文献   

13.
谢飞  龚声蓉  刘纯平  季怡 《计算机科学》2015,42(11):293-298
基于视觉单词的人物行为识别由于在特征中加入了中层语义信息,因此提高了识别的准确性。然而,视觉单词提取时由于前景和背景存在相互干扰,使得视觉单词的表达能力受到影响。提出一种结合局部和全局特征的视觉单词生成方法。该方法首先用显著图检测出前景人物区域,采用提出的动态阈值矩阵对人物区域用不同的阈值来分别检测时空兴趣点,并计算周围的3D-SIFT特征来描述局部信息。在此基础上,采用光流直方图特征描述行为的全局运动信息。通过谱聚类将局部和全局特征融合成视觉单词。实验证明,相对于流行的局部特征视觉单词生成方法,所提出的方法在简单背景的KTH数据集上的识别率比平均识别率提高了6.4%,在复杂背景的UCF数据集上的识别率比平均识别率提高了6.5%。  相似文献   

14.
“英语句子听说大师”是一款英语学习辅助工具,软件中所有的情景对话都是以可爱的卡通人物相互对话形式进行朗读,并配有英语900句的真人语音库,以纯正的美式英语朗读。软件内置新概念英语生词库,对不熟悉的单词可以自己加入生词库来记忆单词。单词和句子学习都可通过大量练习以达到熟练掌握。  相似文献   

15.
词语相似度的计算是人工智能领域的一个基础性的研究课题,它在自然语言处理,QA平台的搭建、语义消歧、文本的聚类和分类这些问题有着很广泛的应用.提出一种基于同义词词林的中文单词相似度计算方法,通过两个单词在词林树中相距的路径长,以及所在分支词义密度来计算两个中文单词间的相似度,并通过观察计算相似性的结果和人主观感觉的相似性的结果的皮尔逊线性相关系数来评价该方法.  相似文献   

16.
本文叙述了将非限制性手写体文本行分隔成若干个单词的技术途径。在书写风格不受约束的情况下、识别单词的各字母可能非常困难,所以、在应用识别算法之前,必须把字母组合成单词。本系统采用传统算法来确定珩中各个字母章的距离,并检测全部标点符号。  相似文献   

17.
学习英语的最大障碍是记单词,用电脑帮助记单词有独到的便利之处。现在有不少背单词的软件,但一般都是按字母顺序排列的,背单词如同背字典,枯燥乏味,效率不高。有没有更好的办法呢?有的,那就是通过阅读来记忆单词。现在互联网上的英文阅读材料可谓浩如烟海,取之不尽,可问题是碰到的生词如  相似文献   

18.
《轻轻松松背单词》是根据人们的记忆曲线设计的辅助教学软件,界面友好生动,用它背起单词来速度快、效果好。它提供了很多书目,可以满足不同层次的需要,但有时使用起来仍觉有不便之处。例如:笔者在背《电脑专业英语》单词时,书中有些单词已很熟悉了,在单词初记、复习测验中还需要一遍遍的重复,不能把重点放在记忆不熟悉的单词上。虽然软件中有装入新词、浏览修改的选项,但使用起来比较麻烦,难以做大幅度的调整。为了解决这个问题,笔者通过对词库结  相似文献   

19.
基于维基百科社区挖掘的词语语义相似度计算   总被引:1,自引:0,他引:1  
词语语义相似度计算在自然语言处理如词义消歧、语义信息检索、文本自动分类中有着广泛的应用。不同于传统的方法,提出的是一种基于维基百科社区挖掘的词语语义相似度计算方法。本方法不考虑单词页面文本内容,而是利用维基百科庞大的带有类别标签的单词页面网信息,将基于主题的社区发现算法HITS应用到该页面网,获取单词页面的社区。在获取社区的基础上,从3个方面来考虑两个单词间的语义相似度:(1)单词页面语义关系;(2)单词页面社区语义关系;(3)单词页面社区所属类别的语义关系。最后,在标准数据集WordSimilarity-353上的实验结果显示,该算法具有可行性且略优于目前的一些经典算法;在最好的情况下,其Spearman相关系数达到0.58。  相似文献   

20.
现在很多朋友的电脑里都安装了《金山词霸2005》来辅助学习英语,下面笔者就教大家如何利用金山词霸生词本和打印机快速制作“生词卡片”。首先在金山词霸2005的安装目录中找到并双击“NewWord.exe”文件,启动金山词霸生词本。Step1:添加新单词。选择工具条中“添加”按钮,调出“单词编辑”对话框,然后将要制作成卡片的单词一一输入。在这里我们只需要输入单词,生词本会自动将音标、中文含义添加进来。Step2:选中单词(至少5个),再单击左侧工具条中的“卡片”按钮,就能预览到制作后的卡片效果了(如图)。可以双击它进行编辑,例如改变单词的位置,设置字体等。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号