首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 171 毫秒
1.
在信息检索中,用户习惯用尽可能少的关键字来检索信息,这必然会导致检索结果与用户需求存在较大偏差.针对这一问题,我们提出了基于互信息的语义扩展模型(QSE_BMI)[2],结合用户兴趣模型,对用户输入的查询问句进行语义扩展.本文在QSE_BMI基础上,利用互信息与本体互补性,建立基于互信息和本体的协同检索模型,从而提高了信息检索的查全率与查准率.  相似文献   

2.
基于Ontology的Web信息检索系统研究   总被引:3,自引:0,他引:3  
传统的信息检索技术以关键字匹配为主,缺乏语义推理能力,对用户的查询请求没有提供语义制导,因此造成信息的误检、漏检.将Ontology用于Web信息检索,分析了Ontology的语义表达能力,提出了基于Ontology的信息检索系统模型(MIRSO).MIRSO能够对用户提供语义制导,将用户的查询条件映射为领域Ontology的概念和关系,使用户的需求表达和信息内容精确匹配.实验结果表明,该方法能够提高信息检索系统的查准率.  相似文献   

3.
为解决基于翻译机制的知识图谱补全模型在处理复杂关系时的性能局限,该文提出一种ATREC(algorithm based on transitional relation embedding via CNN)算法,将三元组的实体和关系映射至低维向量空间,并将不同的关系特征与头/尾实体融合,将原始三元组和融合三元组的嵌入表...  相似文献   

4.
5.
在问答系统中,只通过问题中所包含的词汇表达查询意图,难以从数据源中获得理想的答案。为此,针对基于知识图谱的问答系统,提出一种语义查询扩展方法。利用WordNet对问题三元组中的查询术语从同义词、上义词和下义词3个语义角度进行扩展,采用Microsoft Concept Graph对查询术语从上义词和下义词2个角度进行扩展。针对每种语义角度的扩展结果,设计不同的过滤策略进行筛选,根据查询术语的语义扩展结果实现对问题三元组的扩展。实验结果表明,该方法平均准确率大于83%,对问题三元组的多语义角度的扩展效果较好。  相似文献   

6.
1引言 概念格(Concept Lattice)首先由德国的教授Wille R于1982年提出[1],它是根据二元关系提出的一种概念层次结构,是数据分析和规则提取的一种有效工具.作为概念分析的一种形式化工具,概念格已经广泛地应用于软件工程,知识工程等领域.  相似文献   

7.
目前广泛采用的基于关键字的全文检索无法满足用户对于查准率的要求,本文结合使用了本体技术和传统的向量空间模型,提出了一种基于本体的面向概念信息检索模型.利用领域本体良好的逻辑推理结构,引入级联查询和概念标注的方法,提高了信息检索的性能,并在一定程度上实现了用户查询的语意理解.  相似文献   

8.
为了提高空间数据库系统的查询效率,基于传统的拓扑关系查询方法,将内部最大矩形IR引入到R*树索引结构中,提出了基于MBR&IR的拓扑关系查询处理方法.该方法的基本思想是通过增加IR这一约束条件,在过滤步骤判断出满足查询条件的数据对象,排除不符合查询条件的数据对象,提高了过滤步骤的性能,减少了提纯步骤的系统消耗,从而提高了查询效率.实验结果表明,该方法在查询效率上优于传统的拓扑关系查询方法.  相似文献   

9.
针对当前智能手机应用安全知识等信息的共享及复用问题,采用本体技术实现了智能手机应用本体APPO (ApplicationOntology)的建模。首先,利用本体描述语言OWL(Web Ontology Language)对APPO中的概念及概念之间的关系进行知识表示,建立了一个语义表达准确的领域本体。其次,利用本体查询语言SPARQL实现基于RDF三元组的各类相关查询。最后,在此基础上,借助本体推理机制进行了推理研究,并结合实例,验证了研究内容的可行性和实用价值。  相似文献   

10.
属性渐增式的决策规则挖掘算法   总被引:1,自引:0,他引:1  
黄兆华 《计算机科学》2004,31(Z2):192-194
1引言 在数据挖掘(Data Mining)中,决策规则的挖掘是一个重要的目标,其描述了个体的属性之间的一种依赖关系[1].A.Skowron和C.Rausser在Rough集理论[1]的基础上提出了分明矩阵(Discernibilitymatrix)和分明函数(Discernibility function)的概念之后[2],基于Rough集理论的数据挖掘的研究方法大多是遵循这两个概念的,诸如:信息系统中属性依赖关系的挖掘[3],决策规则的生成[4],数据浓缩[5],属性的约简(Reduciton)[4,6]等.  相似文献   

11.
多准则决策理论与方法的应用能否达到预期的经济效益与社会效益,逐步成为该研究领域关注的核心议题。近年来,基于概率语言术语集(Probabilistic Language Term Set,PLTS)的决策理论与方法受到广泛关注,PLTS既能够反映决策者对方案或准则的犹豫模糊语言评价或比较偏好,又能体现各语言术语的概率信息,较为贴近决策者的思维认知过程,已广泛应用于投资项目风险评估、模式识别、医疗诊断等领域,产生了良好的应用效果。从PLTS的信息融合理论、测度理论、偏好关系理论、基于PLTS的多准则决策方法这四方面系统回顾PLTS的研究现状,分析现有研究存在的不足,指出采用概率不确定语言术语集(Probabilistic Uncertain Linguistic Term Set,PULTS)即能更为高效、精准地反映定性决策信息的模糊不确定性。阐述该领域后续研究应当重点关注PULTS的信息融合、测度理论框架、偏好关系的一致性-共识达成过程、多准则群决策方法及其应用研究等核心问题,并给出相应的研究思路,为该领域后续研究提供可行性借鉴。  相似文献   

12.
System Identification becomes very crucial in the field of nonlinear and dynamic systems or practical systems. As most practical systems don’t have prior information about the system behaviour thus, mathematical modelling is required. The authors have proposed a stacked Bidirectional Long-Short Term Memory (Bi-LSTM) model to handle the problem of nonlinear dynamic system identification in this paper. The proposed model has the ability of faster learning and accurate modelling as it can be trained in both forward and backward directions. The main advantage of Bi-LSTM over other algorithms is that it processes inputs in two ways: one from the past to the future, and the other from the future to the past. In this proposed model a backward-running Long-Short Term Memory (LSTM) can store information from the future along with application of two hidden states together allows for storing information from the past and future at any moment in time. The proposed model is tested with a recorded speech signal to prove its superiority with the performance being evaluated through Mean Square Error (MSE) and Root Means Square Error (RMSE). The RMSE and MSE performances obtained by the proposed model are found to be 0.0218 and 0.0162 respectively for 500 Epochs. The comparison of results and further analysis illustrates that the proposed model achieves better performance over other models and can obtain higher prediction accuracy along with faster convergence speed.  相似文献   

13.
基于信息增益与信息熵的TFIDF算法   总被引:1,自引:0,他引:1       下载免费PDF全文
传统的特征词权重算法TFIDF忽略了特征词在类内、类间的分布对其权重的影响。针对该问题,引入信息熵的概念,对基于信息增益的TFIDF算法(TFIDFIG)进行改进,提出一种基于信息增益与信息熵的TFIDF算法(TFIDFIGE)。实验结果表明,与传统的TFIDF算法和TFIDFIG算法相比,TFIDFIGE算法的查准率和查全率较高。  相似文献   

14.
文本分类是信息检索和文本挖掘的重要基础,朴素贝叶斯是一种简单而高效的分类算法,可以应用于文本分类.但是其属性独立性和属性重要性相等的假设并不符合客观实际,这也影响了它的分类效果.如何克服这种假设,进一步提高其分类效果是朴素贝叶斯文本分类算法的一个难题.根据文本分类的特点,基于文本互信息的相关理论,提出了基于互信息的特征项加权朴素贝叶斯文本分类方法,该方法使用互信息对不同类别中的特征项进行分别赋权,部分消除了假设对分类效果的影响.通过在UCIKDD数据集上的仿真实验,验证了该方法的有效性.  相似文献   

15.
We have built a database that provides term vector information for large numbers of pages (hundreds of millions). The basic operation of the database is to take URLs and return term vectors. Compared to computing vectors by downloading pages via HTTP, the Term Vector Database is several orders of magnitude faster, enabling a large class of applications that would be impractical without such a database. This paper describes the Term Vector Database in detail. It also reports on two applications built on top of the database. The first application is an optimization of connectivity-based topic distillation. The second application is a Web page classifier used to annotate results returned by a Web search engine.  相似文献   

16.
基于关键词语的文本特征选择及权重计算方案   总被引:2,自引:3,他引:2  
文本的形式化表示一直是文本分类的重要难题.在被广泛采用的向量空间模型中,文本的每一维特征的权重就是其TFIDF值,这种方法难以突出对文本内容起到关键性作用的特征。提出一种基于关键词语的特征选择及权重计算方案,它利用了文本的结构信息同时运用互信息理论提取出对文本内容起到关键性作用的词语;权重计算则综合了词语位置、词语关系和词语频率等信息,突出了文本中关键词语的贡献,弥补了TFIDF的缺陷。通过采用支持向量机(SVM)分类器进行实验,结果显示提出的Score权重计算法比传统TFIDF法的平均分类准确率要高5%左右。  相似文献   

17.
术语抽取从非结构化文本中自动抽取专业术语。该工作在中文分词、信息抽取、知识库构建中发挥着重要的作用。当前术语抽取方法很大程度上依赖于词的统计信息,由于基础教育学科中术语具有极强的长尾特性,导致基于统计的术语抽取方法很难抽取出处于尾端的术语。该文结合基础教育的学科特点,提出了DRTE: 一种利用术语定义与术语关系挖掘,综合构词规则与边界检测的术语抽取方法。该文以初高中的数学课本为数据源进行术语抽取,实验结果表明我们的术语抽取方法F1值达到82.7%,相比目前的方法提高了40.8%,能够有效地在中文基础教育领域进行自动化的术语抽取。  相似文献   

18.
Multimedia Tools and Applications - Term mismatch is a serious problem effecting the performance of information retrieval systems. The problem is more severe in biomedical domain where lot of term...  相似文献   

19.
We present a formalism called Addressed Term Rewriting Systems, which can be used to define the operational semantics of programming languages, especially those involving sharing, recursive computations and cyclic data structures. Addressed Term Rewriting Systems are therefore well suited for describing object-based languages, as for instance the family of languages called , involving both functional and object-based features.  相似文献   

20.
张纯青  陈超  邵正荣  俞能海 《计算机仿真》2008,25(1):134-137,239
在信息检索领域,相似度评价模型是一个重要的研究课题.基本的评价模型有布尔模型,向量空间模型和概率模型.后两种模型在许多的信息检索系统中被采用,但是它们都没有考虑查询词在文档中的位置信息对相似性度量起到的作用.一些研究考虑了诸如HTML标签之类的信息,但是确定加权系数的方案不是太理想.针对这些问题,文中提出了一种基于加权词频的相似度评价模型(Weighted Term Frequency Model,WTFM),而引入的权重系数可以通过模拟退火算法学习得到.实验结果表明,权重系数的引入提高了系统的相关度评价质量.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号