首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 156 毫秒
1.
针对传统的采用关键词的信息检索方式在个性化方面的不足,提出了一种根据领域本体的个性化信息检索模型.首先获取用户的特征信息,接着利用用户的特征信息构建基于本体的用户兴趣模型,在检索过程中通过领域本体概念和用户兴趣模型对检索请求进行分析并对其进行扩展,获得符合检索意图的结果,在此基础上按兴趣度大小处理后将最终个性化信息检索结果反馈给用户.通过搭建关于本体的个性化检索原型系统,仿真结果验证了改进模型的有效性.  相似文献   

2.
针对当前主流web搜索引擎存在信息检索个性化效果差和信息检索的精确率低等缺点,通过对已有方法的技术改进,介绍了一种基于用户历史兴趣网页和历史查询词相结合的个性化查询扩展方法。当用户在搜索引擎上输入查询词时,能根据学习到的当前用户兴趣模型动态判定用户潜在兴趣和计算词间相关度,并将恰当的扩展查询词组提交给搜索引擎,从而实现不同用户输入同一查询词能返回不同检索结果的目的。实验验证了算法的有效性,检索精确率也比原方法有明显提高。  相似文献   

3.
网络信息检索个性化服务的研究与设计   总被引:1,自引:0,他引:1  
针对目前网络信息检索个性化服务不够周全的缺点,提出并实现了一个提高服务质量的信息检索个性化服务模型。该模型主要通过用户兴趣模型的建立、多维权值排序算法MWRA的优化、自由方式推送用户信息模型的建立三大模块来实现。最后给出传统信息检索模式与新模式的实验结果。  相似文献   

4.
提出一个深层次的问句语义分析算法,实现问句从文字空间到语义空间的映射。在问句语义分析算法的基础上,提出面向海量问答数据的检索模型,该模型采用搜索引擎的检索技术,利用问句语义分析的结果,将问句相似度计算结合到信息检索过程中,既保证了检索的效率又保证了检索的精度。  相似文献   

5.
个性化搜索引擎中用户模型智能调整算法的研究   总被引:11,自引:0,他引:11  
个性化信息服务越来越成为信息检索领域中研究的热点。针对用户模型构造问题,文章结合手工定制建模与自动分析建模技术,利用空间向量模型表示法,提出了一种用户模型智能调整算法。模拟实验表明,该结构和算法能够有效地提高检索结果的准确度,并且具有良好的可适应性。  相似文献   

6.
在基于向量空间模型的信息检索系统中,TF2IDF 算法被广泛的应用在基于关键字的信息检索中。然而,对于网页独特的超链接结构,需要有一种技术在表示网页内容的同时将与它相邻链接的网页内容考虑进去。本文分析了向量空间模型的实质,并找出了其精度低的原因,在传统模型基础上提出了一种基于网页超链接结构的向量空间模型改进算法。实验分析表明改进后的算法与原算法相比检索精确度提高了10 % ,在一定程度上改善了检索效果。  相似文献   

7.
将语词抽取、负关联规则挖掘和查询扩展技术应用于信息检索,提出一种基于语词抽取与负关联规则挖掘融合的信息检索系统模型及其算法.详细论述模型的设计思想、各模块的功能,以及模型的理论分析和检索算法.该模型能够将语词抽取、负关联规则挖掘和查询扩展三种技术融合,对初检文档集进行有效地处理,得到高质量的与原查询词相关的扩展词,和原查询组合成新查询,再进行二次检索,有效地解决了词不匹配的问题.实验结果表明,该模型有效,能改善和提高信息检索性能  相似文献   

8.
高效检索是数字图书馆的核心业务之一,其中排序是高效信息检索的核心问题。给定一系列的书目列表,利用排序模型生成目标书目的排序列表。将学习排序算法应用于信息检索领域时,常用方法是通过最小化pairwise损失函数值来优化排序模型。然而,已有结论表明,pairwise损失值最小化不一定能得到listwise算法的最佳排序性能。并且将在线学习排序算法与listwise算法相结合也非常困难。提出了一种基于listwise的在线学习排序算法,旨在保证listwise算法性能优势的前提下,实现在线学习排序算法,从而降低检索复杂度。首先解决将在线学习排序算法与listwise算法相结合的问题;然后通过最小化基于预测列表和真实列表定义的损失函数来优化排序模型;最后提出基于online-listwise算法的自适应学习率。实验结果表明,所提出算法具有较好的检索性能和检索速度。  相似文献   

9.
基于用户浏览行为的用户模型调整算法研究   总被引:1,自引:0,他引:1  
余强  周良  丁秋林 《计算机与数字工程》2010,38(11):122-126,144
个性化信息服务越来越成为信息检索领域中研究的热点。针对用户模型构造问题,文章结合手工定制建模与自动分析建模技术;并改进文档特征向量的权重计算方式,提高特征向量表示文档的能力;并结合用户浏览行为的页面反馈度计算,提出了一种用户模型智能调整算法。模拟实验表明,该结构和算法能够有效地提高检索结果的准确度,并且具有良好的可适应性。  相似文献   

10.
Web搜索引擎是Internet上非常有用的信息检索工具.但是,目前搜索引擎检索出的信息量庞大.如何能够快速和精确地在这种海洋信息中检索到用户所需信息已成为重要的研究课题.提出基于元搜索引擎理论上的专业课程信息搜索系统,着重研究结果页面信息的提取技术和向量空间模型算法.  相似文献   

11.
一种改进的文本网页分类特征选择方法   总被引:6,自引:0,他引:6  
李粤  李星  刘辉  许静芳 《计算机应用》2004,24(7):119-121
网页分类是网络信息检索研究的关键技术之一。文中针对分类技术中的特征选择方法展开研究。在分析、比较常用的文本分类特征选择方法基础上,提出了一种联合特征选择方法。该方法将已有的X^2统计方法和互信息方法综合起来,在标准文本网贞数据集分类实验中,综合查全率和查准率得到明显的提高。该选择方法已应用于“网络指南针”系统大规模文本网页分类中。  相似文献   

12.
Web image indexing by using associated texts   总被引:1,自引:0,他引:1  
In order to index Web images, the whole associated texts are partitioned into a sequence of text blocks, then the local relevance of a term to the corresponding image is calculated with respect to both its local occurrence in the block and the distance of the block to the image. Thus, the overall relevance of a term is determined as the sum of all its local weight values multiplied by the corresponding distance factors of the text blocks. In the present approach, the associated text of a Web image is firstly partitioned into three parts, including a page-oriented text (TM), a link-oriented text (LT), and a caption-oriented text (BT). Since the big size and semantic divergence, the caption-oriented text is further partitioned into finer blocks based on the tree structure of the tag elements within the BT text. During the processing, all heading nodes are pulled up in order to correlate with their semantic scopes, and a collapse algorithm is also exploited to remove the empty blocks. In our system, the relevant factors of the text blocks are determined by using a greedy Two-Way-Merging algorithm. Zhiguo Gong is an associate Professor in the Department of Computer and Information Science, Faculty of Science and Technology, University of Macau, Macao, China. He received his BS, MS, and PhD from the Hebei Normal University, Peking University, and the Chinese Academy of Science in 1983, 1988, and 1998, respectively. His research interests include Distributed Database, Multimedia Database, Digital Library, Web Information Retrieval, and Web Mining. Leong Hou U is currently a Master Candidate in the Department of Computer and Information Science, Faculty of Science and Technology, University of Macau, Macao, China. He received his BS from National Chi Nan University, Taiwan in 2003. His research interests include Web Information Retrieval and Web Mining. Chan Wa Cheang is currently a Master Candidate in the Department of Computer and Information Science, Faculty of Science and Technology, University of Macau, Macao, China. He received his BS from the National Taiwan University, Taiwan in 2003. His research interests include Web Information Retrieval and Web Mining.  相似文献   

13.
文本检索会议简介   总被引:3,自引:0,他引:3  
文本检索简介随着互联网的发展和存贮技术的提高,计算机可读的文本信息也越来越多。据估计,截止到1999年,互联网上已约有5TB的信息容量,其中文字信息约为6TB。然而,要有效地开发利用如此丰富的信息资源并不是轻而易举的事情,因为许多信息往往是规模巨大,实时性强,而且存贮分散;语言混杂,内容广泛;图文并茂,格式灵活,有时还含有一定的拼写错误或传输错误。而对于特定的用户而言,所需要的信息往往只占其中极小的一部分。要从如此规模的网络信息中抽取有用的信息资源,对信息处理的速度和精度将提出极为严格的要求,因而迫切需要对这种形式的混合语料进行更快速高效的处理。在这种情况下,人们越来越多地依靠文本检索工具来寻找自己所需要的信息。文本检索指的是给定文本方式的检索需求,在电子文档库中查找出与指定表达式相匹配的文本,并将出现和包含这些文本的原文作为检索结果返回给用户。  相似文献   

14.
By associating meaning with content, the Semantic Web will facilitate search, interoperability, and the composition of complex applications. The paper discusses the Semantic Content Organization and Retrieval Engine (SCORE, see vvww.voquette.com), which is based on research transferred from the University of Georgia's Large Scale Distributed Information Systems. SCORE belongs to a new generation of technologies for the emerging Semantic Web. It provides facilities to define ontological components that software agents can maintain. These agents use regular expression based rules in conjunction with various semantic techniques to extract ontology-driven metadata from structured and semistructured content. Automatic classification and information-extraction techniques augment these results and also let the system deal with unstructured text.  相似文献   

15.
本文在语义网本体模型基础上,设计了一个新的信息检索系统。该系统将语义概念检索的向量空间模型和关键词检索相结合进行检索。在结合语义重合度等因素的基础上,将语义概念模型中的本体概念分成上下位和非上下位关系进行相似度计算。同时引入了信息增益,有效地控制语义扩展过程。实验结果证明,该系统有效利用了本体中概念的语义信息,得到的结果也比较合理。  相似文献   

16.
基于XML的Web数据挖掘的研究   总被引:4,自引:1,他引:4  
1.引言传统的数据挖掘方法一般是针对数据库或数据仓库中的结构化数据进行的,但在现实世界中,人们面对的数据绝大部分是属于非结构化或半结构化的,例如Web页面。我们知道,Web的数据量目前至少可以用数百兆兆字节计算,且仍在迅速增长。这些数据一方面为数据挖掘提供了丰富的资源,另一方面也对数据挖掘技术提出了严峻的挑战。与传统的数据挖掘相比,实现Web数据挖掘的主要困难表现在以下三个方面:第一,Web页面缺乏统一的结构,Web上的每一个站点就  相似文献   

17.
在信息时代,信息安全是非常重要的。信息安全主要分为传输加密和存储加密两方面。本文主要介绍了传输加密的三种方式:链路加密、节点加密和端到端加密。以及常用的信息加密算法:DES、AES、RSA、ECC。并对常用的信息加密算法进行比较。  相似文献   

18.
The information-intensive nature of the tourism and travel industry suggests an important role for Web technology in the promotion and marketing of tourist destinations. The rapid development of the Internet and WWW is having profound impacts on the industry. In fact, according to Tourism Australia, travel and tourism has become the single largest category of products sold over the Internet (Tourism White Paper, Destinations online: approaches for regional tourism organisations, Centre for Regional Tourism Research, Southern Cross University, 2007). With reports of travel purchases being one of the fastest growing segments of the Internet community it is no surprise that the number of tourism operators on the Web has increased considerably over the past few years. This paper presents the results of a longitudinal study that seeks to determine if and to what extent, Regional Tourism Organisations (RTOs) in Australia are leveraging the benefits of Web technology for destination marketing and eCommerce. The study was undertaken over an eight year period from 2000 to 2008, using the Extended Model of Internet Commerce Adoption (eMICA) (Burgess and Cooper, International conference on telecommunications and electronic commerce, Dallas, November, 2000). A significant finding of this study is that despite assertions that the Tourism industry is leading the field in terms of eCommerce adoption (Buhalis and Law, Information and communication technologies in tourism, Ljubljana, Springer, Berlin, 2007), and this may hold true with some providers in the sector (for example, hotels and airlines) it does not appear to be the case with Australian RTOs who have been slow to embrace eCommerce. The results of the study also add support to the premise of eMICA, that is, in developing commercial websites, businesses (particularly, SMEs) in this industry sector typically start simply by establishing a presence on the Web and build on functionality over time, as their experience with and expertise in the use of Internet and Web technologies increases and they become more aware of the benefits the Web has to offer.  相似文献   

19.
网络信息搜寻技术与发展   总被引:7,自引:0,他引:7       下载免费PDF全文
信息搜寻是网络技术的新课题。本文介绍了在因特网上进行信息搜寻采用的算法、策略和现有检索工具的工作原理以及网络信息搜寻技术的新发展。  相似文献   

20.
基于构件的分布式计算模型发展迅速,成为在Internet环境下构造对象Web的主流技术。论文提出了基于CORBA/Java技术的WebGIS模型构想:VIQS构件模型,并且给出了使用这一模型开发流域信息查询系统的实现方案,为开发水利行业的WebGIS应用做了一点研究和尝试。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号