共查询到20条相似文献,搜索用时 171 毫秒
1.
在信息检索中,用户习惯用尽可能少的关键字来检索信息,这必然会导致检索结果与用户需求存在较大偏差.针对这一问题,我们提出了基于互信息的语义扩展模型(QSE_BMI)[2],结合用户兴趣模型,对用户输入的查询问句进行语义扩展.本文在QSE_BMI基础上,利用互信息与本体互补性,建立基于互信息和本体的协同检索模型,从而提高了信息检索的查全率与查准率. 相似文献
2.
基于Ontology的Web信息检索系统研究 总被引:3,自引:0,他引:3
传统的信息检索技术以关键字匹配为主,缺乏语义推理能力,对用户的查询请求没有提供语义制导,因此造成信息的误检、漏检.将Ontology用于Web信息检索,分析了Ontology的语义表达能力,提出了基于Ontology的信息检索系统模型(MIRSO).MIRSO能够对用户提供语义制导,将用户的查询条件映射为领域Ontology的概念和关系,使用户的需求表达和信息内容精确匹配.实验结果表明,该方法能够提高信息检索系统的查准率. 相似文献
3.
4.
5.
6.
7.
目前广泛采用的基于关键字的全文检索无法满足用户对于查准率的要求,本文结合使用了本体技术和传统的向量空间模型,提出了一种基于本体的面向概念信息检索模型.利用领域本体良好的逻辑推理结构,引入级联查询和概念标注的方法,提高了信息检索的性能,并在一定程度上实现了用户查询的语意理解. 相似文献
8.
为了提高空间数据库系统的查询效率,基于传统的拓扑关系查询方法,将内部最大矩形IR引入到R*树索引结构中,提出了基于MBR&IR的拓扑关系查询处理方法.该方法的基本思想是通过增加IR这一约束条件,在过滤步骤判断出满足查询条件的数据对象,排除不符合查询条件的数据对象,提高了过滤步骤的性能,减少了提纯步骤的系统消耗,从而提高了查询效率.实验结果表明,该方法在查询效率上优于传统的拓扑关系查询方法. 相似文献
9.
针对当前智能手机应用安全知识等信息的共享及复用问题,采用本体技术实现了智能手机应用本体APPO (ApplicationOntology)的建模。首先,利用本体描述语言OWL(Web Ontology Language)对APPO中的概念及概念之间的关系进行知识表示,建立了一个语义表达准确的领域本体。其次,利用本体查询语言SPARQL实现基于RDF三元组的各类相关查询。最后,在此基础上,借助本体推理机制进行了推理研究,并结合实例,验证了研究内容的可行性和实用价值。 相似文献
10.
属性渐增式的决策规则挖掘算法 总被引:1,自引:0,他引:1
1引言
在数据挖掘(Data Mining)中,决策规则的挖掘是一个重要的目标,其描述了个体的属性之间的一种依赖关系[1].A.Skowron和C.Rausser在Rough集理论[1]的基础上提出了分明矩阵(Discernibilitymatrix)和分明函数(Discernibility function)的概念之后[2],基于Rough集理论的数据挖掘的研究方法大多是遵循这两个概念的,诸如:信息系统中属性依赖关系的挖掘[3],决策规则的生成[4],数据浓缩[5],属性的约简(Reduciton)[4,6]等. 相似文献
11.
韩二东 《计算机工程与应用》2020,56(10):27-35
多准则决策理论与方法的应用能否达到预期的经济效益与社会效益,逐步成为该研究领域关注的核心议题。近年来,基于概率语言术语集(Probabilistic Language Term Set,PLTS)的决策理论与方法受到广泛关注,PLTS既能够反映决策者对方案或准则的犹豫模糊语言评价或比较偏好,又能体现各语言术语的概率信息,较为贴近决策者的思维认知过程,已广泛应用于投资项目风险评估、模式识别、医疗诊断等领域,产生了良好的应用效果。从PLTS的信息融合理论、测度理论、偏好关系理论、基于PLTS的多准则决策方法这四方面系统回顾PLTS的研究现状,分析现有研究存在的不足,指出采用概率不确定语言术语集(Probabilistic Uncertain Linguistic Term Set,PULTS)即能更为高效、精准地反映定性决策信息的模糊不确定性。阐述该领域后续研究应当重点关注PULTS的信息融合、测度理论框架、偏好关系的一致性-共识达成过程、多准则群决策方法及其应用研究等核心问题,并给出相应的研究思路,为该领域后续研究提供可行性借鉴。 相似文献
12.
Rakesh Kumar Pattanaik Mihir N. Mohanty Srikanta Ku. Mohapatra Binod Ku. Pattanayak 《计算机系统科学与工程》2023,46(1):195-208
System Identification becomes very crucial in the field of nonlinear and dynamic systems or practical systems. As most practical systems don’t have prior information about the system behaviour thus, mathematical modelling is required. The authors have proposed a stacked Bidirectional Long-Short Term Memory (Bi-LSTM) model to handle the problem of nonlinear dynamic system identification in this paper. The proposed model has the ability of faster learning and accurate modelling as it can be trained in both forward and backward directions. The main advantage of Bi-LSTM over other algorithms is that it processes inputs in two ways: one from the past to the future, and the other from the future to the past. In this proposed model a backward-running Long-Short Term Memory (LSTM) can store information from the future along with application of two hidden states together allows for storing information from the past and future at any moment in time. The proposed model is tested with a recorded speech signal to prove its superiority with the performance being evaluated through Mean Square Error (MSE) and Root Means Square Error (RMSE). The RMSE and MSE performances obtained by the proposed model are found to be 0.0218 and 0.0162 respectively for 500 Epochs. The comparison of results and further analysis illustrates that the proposed model achieves better performance over other models and can obtain higher prediction accuracy along with faster convergence speed. 相似文献
13.
14.
文本分类是信息检索和文本挖掘的重要基础,朴素贝叶斯是一种简单而高效的分类算法,可以应用于文本分类.但是其属性独立性和属性重要性相等的假设并不符合客观实际,这也影响了它的分类效果.如何克服这种假设,进一步提高其分类效果是朴素贝叶斯文本分类算法的一个难题.根据文本分类的特点,基于文本互信息的相关理论,提出了基于互信息的特征项加权朴素贝叶斯文本分类方法,该方法使用互信息对不同类别中的特征项进行分别赋权,部分消除了假设对分类效果的影响.通过在UCIKDD数据集上的仿真实验,验证了该方法的有效性. 相似文献
15.
We have built a database that provides term vector information for large numbers of pages (hundreds of millions). The basic operation of the database is to take URLs and return term vectors. Compared to computing vectors by downloading pages via HTTP, the Term Vector Database is several orders of magnitude faster, enabling a large class of applications that would be impractical without such a database. This paper describes the Term Vector Database in detail. It also reports on two applications built on top of the database. The first application is an optimization of connectivity-based topic distillation. The second application is a Web page classifier used to annotate results returned by a Web search engine. 相似文献
16.
基于关键词语的文本特征选择及权重计算方案 总被引:2,自引:3,他引:2
文本的形式化表示一直是文本分类的重要难题.在被广泛采用的向量空间模型中,文本的每一维特征的权重就是其TFIDF值,这种方法难以突出对文本内容起到关键性作用的特征。提出一种基于关键词语的特征选择及权重计算方案,它利用了文本的结构信息同时运用互信息理论提取出对文本内容起到关键性作用的词语;权重计算则综合了词语位置、词语关系和词语频率等信息,突出了文本中关键词语的贡献,弥补了TFIDF的缺陷。通过采用支持向量机(SVM)分类器进行实验,结果显示提出的Score权重计算法比传统TFIDF法的平均分类准确率要高5%左右。 相似文献
17.
术语抽取从非结构化文本中自动抽取专业术语。该工作在中文分词、信息抽取、知识库构建中发挥着重要的作用。当前术语抽取方法很大程度上依赖于词的统计信息,由于基础教育学科中术语具有极强的长尾特性,导致基于统计的术语抽取方法很难抽取出处于尾端的术语。该文结合基础教育的学科特点,提出了DRTE: 一种利用术语定义与术语关系挖掘,综合构词规则与边界检测的术语抽取方法。该文以初高中的数学课本为数据源进行术语抽取,实验结果表明我们的术语抽取方法F1值达到82.7%,相比目前的方法提高了40.8%,能够有效地在中文基础教育领域进行自动化的术语抽取。 相似文献
18.
Wasim Muhammad Asim Muhammad Nabeel Ghani Muhammad Usman Rehman Zahoor Ur Rho Seungmin Mehmood Irfan 《Multimedia Tools and Applications》2019,78(21):29681-29712
Multimedia Tools and Applications - Term mismatch is a serious problem effecting the performance of information retrieval systems. The problem is more severe in biomedical domain where lot of term... 相似文献
19.
Dan Dougherty Pierre Lescanne Luigi Liquori Frdric Lang 《Electronic Notes in Theoretical Computer Science》2005,127(5):57
We present a formalism called Addressed Term Rewriting Systems, which can be used to define the operational semantics of programming languages, especially those involving sharing, recursive computations and cyclic data structures. Addressed Term Rewriting Systems are therefore well suited for describing object-based languages, as for instance the family of languages called , involving both functional and object-based features. 相似文献
20.
在信息检索领域,相似度评价模型是一个重要的研究课题.基本的评价模型有布尔模型,向量空间模型和概率模型.后两种模型在许多的信息检索系统中被采用,但是它们都没有考虑查询词在文档中的位置信息对相似性度量起到的作用.一些研究考虑了诸如HTML标签之类的信息,但是确定加权系数的方案不是太理想.针对这些问题,文中提出了一种基于加权词频的相似度评价模型(Weighted Term Frequency Model,WTFM),而引入的权重系数可以通过模拟退火算法学习得到.实验结果表明,权重系数的引入提高了系统的相关度评价质量. 相似文献