首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 234 毫秒
1.
传统的语义信息检索是基于检索词语义的匹配,无法满足检索不确定的、不完整的信息以及对检索结果进行聚类处理,因此,提出将模糊本体引入语义信息检索方法。该方法以本体技术先建立领域语义模型,各概念的隶属度加到语义建模的过程中,并提供语义标注;以模糊推理方式对概念、公理等本体进一步处理,从而便于计算机计算处理。能够提高在语义信息检索中对模糊信息进行检索的查准率、查全率,采用聚类技术对检索结果进行聚类,以达到智能化检索的目的。  相似文献   

2.
针对中文环境下的模式冲突问题,提出了一种利用元数据的模式匹配方法.该方法从数据字典中为模式提取特征向量,并采用聚类技术对其进行聚类,将语义相近的模式划分到相同聚簇中;对于同一聚簇中的不同模式,借助辅助词典计算属性间的语义相似度,并采用多种选择策略相结合的方法对结果进行过滤,为每个属性生成候选匹配集合.实验结果表明,该方法不仅可以提高模式匹配效率,而且具有较高的准确度.  相似文献   

3.
针对现有工程信息检索中文档语义理解和关联不足的问题,根据工程环境下信息检索的特点,提出一个异质工程文档的检索方法,包括内容分析、语义建模、多维关联、语义推理与扩展以及查询处理等过程.采用基于本体的理解标注多源异质工程文档,获取工程语义信息,建立语义标注库,实现异质文档内容的统一表达.采用以文档为中心的多维关联机制,在文档内容语义理解的基础上,将基于本体的内在关联扩展为融合文档及内容的多重关联.结果表明,多维关联机制能够启发式地关联产品生命周期中的文档,增强查询的导航能力,为语义推理和检索扩展提供服务.  相似文献   

4.
中文主观题自动批改中相似句子检索算法   总被引:2,自引:0,他引:2  
学生答案与标准答案语义匹配程度的计算是基于中文文字类主观题自动批改中的关键问题。提出了学生答案与标准答案匹配程度的计算分两步进行:候选相似语句的检索和基于语义依存的句子相似度计算。利用动态规划法实现候选语句检索,确定数量不多但有可能与标准答案相似的候选句子,然后对标准答案中的句子与少量的候选句子进行深层的句法分析,找出依存关系,并在依存分析结果的基础上进行语义相似度计算,得出最终的结果。该方法可以提高主观题自动批改的效率及准确性,具有一定的实用价值。  相似文献   

5.
针对大规模图像数据库的特点,用基于高斯混合模型的期望值最大(EM)算法对图像数据库进行聚类划分,为每个聚类建立索引项,且它所包含的原始特征数据在磁盘上连续存储.查询时,对于用户的查询范例首先确定最可能的候选聚类,然后在候选聚类范围内查询翔实图像.试验结果表明,该方法可提高图像检索速度.  相似文献   

6.
传统的信息检索方法一般都采用对文本内容的词频进行分析的统计方法,这种索引方法仅仅考虑词语在文本中的出现率,因此不能抽取出表达文本语义的索引词。为了解决这个问题,本文提出了一种新的信息检索方法,即基于概念的权重索引方法。本方法引入了概念类的概念,并且提出了用概念之间存在的关系来表示文档中的词汇和概念的语义重要度。本方法比单纯的词汇信息更能体现文本的概念特征,提高信息检索的性能;同时还能降低文本向量的维数,减少计算量,提高检索效率。  相似文献   

7.
结合本体论和统计方法的跨语言信息检索模型   总被引:1,自引:0,他引:1  
为了更有效地提高跨语言信息检索的性能,结合本体论和统计方法的特性,提出一种混合的跨语言信息检索模型.在该语言模型的结构上,提出一种本体描述框架,构造了一个形式化的语言本体知识表示,通过典型语料学习,融合了语法、语义、句法等多元信息,建立了源语言本体知识库.在跨语言信息检索的实际应用中,利用本体表示,获得初始的检索文档集,再基于源语言本体知识库,对全部候选文档重新排序,以提高TopN排列的精确度.利用NTCIR-3Workshop中的中英文跨语言信息检索数据集对该语言模型进行了评价,相关实验结果表明,该方法取得了较满意的实验效果.  相似文献   

8.
提出了一种基于加权特征的图像自动标注方法.该方法首先采用加权特征聚类算法对图像区域进行语义聚类,这种聚类算法根据图像特征的统计分布来计算特征与类别的相关度,增加相关度高的特征的权重,避免聚类算法被弱相关或不相关的特征所支配;然后,根据训练集中样本图像的标注情况建立图像区域与语义关键字的关联;最后,在未标注图像区域给定时,计算每个语义关键字的条件概率,将条件概率最大的语义概念作为图像的标注. 在Corel图像库的数据集上验证了新方法的有效性.  相似文献   

9.
针对多媒体信息检索中的"语义鸿沟"问题,提出了矩阵分裂方法的定义及其基本运算准则,描述了适用于多种多媒体信息的高层语义框架,利用该框架对多媒体信息进行高层语义检索,解决了检索多媒体信息的"语义鸿沟"问题.针对该框架提出了基于每次用户检索结果的部分优先算法,利用用户每次检索结果对高层语义分支权重进行自适应调整,从而达到提...  相似文献   

10.
针对传统P2P系统大多采用关键字匹配实现信息检索且不支持语义的问题,提出了一个基于本体的P2P语义检索框架。该框架采用超级节点拓扑结构,利用本体进行信息集成,将支持相似概念的节点聚类到同一语义对等组,组内节点依据本体定义使用语义链来连接,组之间语义关联则通过超级节点的组语义链来实现;同时增加语义快捷链实现不同语义组之间的节点连接。  相似文献   

11.
为辅助维护用于程序理解的代码片段模版(Plan)库,提出了基于后缀树的Plan自动提取方法.通过词法/语法分析将源代码转换成Token串,然后对Token串生成后缀树,遍历后缀树得到候选代码Plan集,过滤后生成更小、更准确的Plan集.采用动态模式匹配合并合适的Plan和给Plan命名,最后生成可用于程序理解的Plan.由于后缀树的线性增长特性,该方法可以应用于大规模软件的程序理解.将方法应用于多个不同规模的软件,测试结果表明,该方法可以从源码中提取有效的Plan.  相似文献   

12.
基于语义的数字水印算法研究是当前数字音频内容管理领域的热点问题,该文设计基于统一内容定位技术的音频语义标引框架,建立数字音频语义水印模型。提出了基于RBF神经网络的双重语义水印算法,该算法用RBF神经网络自适应选择水印嵌入的最佳音频片段,用小波变换提取所选音频片段的近似分量和细节分量,分别在两种分量中嵌入不同的语义信息,形成双重语义水印,实现语义信息和原始音频信号的一体化传输。根据语义水印信息的不同属性描述,实现音频资源的有效检测与监督。实验结果表明,当嵌入信息量较大的语义水印时,该算法仍有较好的鲁棒性和不可听性。  相似文献   

13.
为了解决代码覆盖反馈指标无法有效解决程序状态覆盖的问题,提出一种以源码中特定代码结构的状态覆盖率作为反馈指标的模糊测试方法,引入了目标结构状态覆盖分布的概念.通过对特定结构进行插桩,统计目标结构状态分布,依据结构状态分布筛选种子并进行能量调度,以实现程序状态覆盖均匀化.该方法实现了原型系统SFL,并与现存的代码覆盖导向...  相似文献   

14.
为减少星载软件在轨更新过程对测控资源的需求量,缩短更新上注时间,提出了一种无需操作系统支持、上注数据量低、版本可灵活控制的语句级软件更新方法。该方法首先利用预编译命令进行程序空间优化,使得不同模块的代码在编译后存储于不同的段中,减少代码修改对加载文件的影响;其次通过逐段求解参考段与更新段之间匹配路径,并基于此进行各段的差异内容提取,大大降低差异补丁规模;然后通过版本引导程序设计,实现对卫星软件版本的灵活控制;最后通过对文件和程序进行可靠性设计,保证整个更新过程的安全性。结果表明:该方法在ZDPS-3A卫星平台进行了充分的测试,所提出的更新方法可应用于无操作系统的星载计算机,支持软件状态可回滚且更新过程可靠,同时相比传统的差异内容提取方法,补丁文件的规模降低量均值超过50.00%,可显著缩短更新上注时间。本方法能够充分满足星载软件低数据量更新的需求,可推广应用至包括微小卫星在内的多种航天器。  相似文献   

15.
与文本无关的说话人识别方法是当前说话人识别技术的研究重点。基于矢量量化的说话人识别,因其运算过程简单等特点,在说话人识别领域有着广泛的应用。本文对矢量量化的码书形成算法进行了改进,并基于改进算法进行了与文本无关的说话人识别。经实验结果证明,本文的方法改善了码本的性能,提高了说话人识别的识别率。  相似文献   

16.
分析了目前常用的不良倾向文本识别方法存在的困难和不足,设计了一种基于语义分析的不良倾向文本识别算法。该算法以语句为基本处理单元,采用依存句法获得句子的语义结构,结合How Net词汇褒贬倾向性判别,识别不良信息。实验结果表明,此算法能够较好地提高不良文本识别效率和准确率。  相似文献   

17.
数据迷惑是代码迷惑中重要的一类迷惑变换,在软件保护领域中应用广泛,常被用于防止攻击者对程序进行数据流分析、程序切片等逆向工程攻击。从语义的角度,给出了一种基于抽象解释的数据迷惑正确性的分析方法。首先使用抽象解释理论,从程序语义的角度,对数据迷惑进行形式化描述,用一种语义变换形式化地描述数据迷惑。然后在形式化描述的基础上,由语义变换和语法变换之间的关系,构造得到数据迷惑算法。最后在基于抽象解释的数据迷惑的形式化描述的基础上,对数据迷惑变换的正确性进行分析和讨论。  相似文献   

18.
为了提高软件的开发效率,目前已出现应用人工智能技术进行智能化开发的趋势,如何理解程序语义是智能化开发中需要重点解决的问题.针对该问题,出现了一系列程序表示学习的研究,程序表示学习可以自动地从程序中学习有用的特征,将特征表示为低维稠密向量,高效地提取程序语义并使用于相应的下游任务.对程序表示学习的研究工作进行综述,介绍了主流的程序表示学习模型,包括基于图结构和基于token序列的程序表示学习框架.展示了程序表示学习技术在缺陷检测、缺陷定位、代码补全等任务上的应用,总结了程序表示学习的常用工具集和测试集.分析了程序表示学习未来需要应对的挑战.  相似文献   

19.
为改善零样本图像分类中相似度度量方法的鲁棒性,引入了一种用于零样本分类的度量学习方法.该方法由自编码构成,能在特征对齐后的语义嵌入空间中学习到最优的度量函数,用于计算测试样本特征和类标签的语义特征的相似度;然后利用近邻思想预测类别标签,进而避免产生不合适距离函数导致的分类错误.实验结果表明,与传统距离度量的算法相比,所提出的方法降低了识别错误率,在公开数据集AWA、CUB和ImNet-2上的分类准确率分别达到94.7%、63.7%和28.59%;同时表明了语义-视觉的映射方向比相反方向的识别准确率高出2.5%~10.1%.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号