首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 234 毫秒
1.
基于模糊概念图的文档聚类及其在Web中的应用   总被引:12,自引:0,他引:12  
陈宁  陈安  周龙骧  贾维嘉  罗三定 《软件学报》2002,13(8):1598-1605
随着World Wide Web上数据量的日益庞大,现有的搜索引擎已经不能满足用户日益增长的需求.利用数据挖掘技术,提高搜索效率,实现了查询的用户化.首先提出了模糊概念图的模型来描述词语间的关系,然后在聚类过程中引入概念知识,提出了基于模糊概念图的文档聚类算法,通过分析用户的浏览行为发现兴趣模式.在上述技术的基础上,给出了一种用户化的智能搜索系统的实现策略,通过分析概念间的关系和用户的兴趣模式,评价超链/文档和查询的相关程度,从而帮助用户得到更准确的信息.  相似文献   

2.
针对用户利用常用搜索引擎查询信息时,搜索引擎返回海量杂乱、无序的网页,用户难以从中快速、准确地获得真正关心的信息的现状,从Internet用户的兴趣度出发,设计了一种基于近似网页聚类算法的智能搜索系统。该系统在用户利用常用搜索引擎系统进行信息检索时,消除搜索引擎返回的重复页,对剩余页面进行聚类,返回给用户聚类后的网页簇,这样用户就可以选择浏览自己感兴趣的页面,从而大大提高了信息检索的查准率;实验证明该系统在保证查全率和查准率的基础上大大提高了搜索效率。  相似文献   

3.
基于网络资源与用户行为信息的领域术语提取   总被引:1,自引:0,他引:1  
领域术语是反映领域特征的词语.领域术语自动抽取是自然语言处理中的一项重要任务,可以应用在领域本体抽取、专业搜索、文本分类、类语言建模等诸多研究领域,利用互联网上大规模的特定领域语料来构建领域词典成为一项既有挑战性又有实际价值的工作.当前,领域术语提取工作所利用的网络语料主要是网页对应的正文,但是由于网页正文信息抽取所面临的难题会影响领域术语抽取的效果,那么利用网页的锚文本和查询文本替代网页正文进行领域术语抽取,则可以避免网页正文信息抽取所面临的难题.针对锚文本和查询文本所存在的文本长度过短、语义信息不足等缺点,提出一种适用于各种类型网络数据及网络用户行为数据的领域数据提取方法,并使用该方法基于提取到的网页正文数据、网页锚文本数据、用户查询信息数据、用户浏览信息数据等开展了领域术语提取工作,重点考察不同类型网络资源和用户行为信息对领域术语提取工作的效果差异.在海量规模真实网络数据上的实验结果表明,基于用户查询信息和用户浏览过的锚文本信息比基于网页正文提取技术得到的正文取得了更好的领域术语提取效果.  相似文献   

4.
搜索引擎中的聚类浏览技术   总被引:1,自引:0,他引:1  
搜索引擎大多以文档列表的形式将搜索结果显示给用户,随着Web文档数量的剧增,使得用户查找相关信息变得越来越困难,一种解决方法是对搜索结果进行聚类提高其可浏览性。搜索引擎的聚类浏览技术能使用户在更高的主题层次上查看搜索结果,方便地找到感兴趣的信息。本文介绍了搜索引擎的聚类浏览技术对聚类算法的基本要求及其分类方法,研究分析了主要聚类算法及其改进方法的特点,讨论了对聚类质量的评价,最后指出了聚类浏览技术的发展趋势。  相似文献   

5.
袁金萍 《数码世界》2005,4(4A):33-33
网络搜索如今已成为最普遍使用的互联网服务之一,据可靠信息调查显示,80%以上的用户对企业、服务行业等信息进行查询时均首选网络搜索引擎。但是用户如果想要搜索某个特定地方的信息时,总是很难有合适的方式查找这类信息。  相似文献   

6.
基于聚类和用户兴趣分析结合的个性化元搜索   总被引:1,自引:1,他引:0  
随着Web信息的快速增长,搜索引擎已成为用户信息检索的主要工具。元搜索引擎综合了多个搜索引擎的搜索结果,提高了搜索的覆盖率,但是返回的结果往往数目庞大,并且很多结果与用户查询并不相关,这直接影响了用户检索的质量并增加了用户检索的代价。本文提出一种基于聚类的个性化元搜索引擎模型,系统通过对用户建立兴趣模型,对此模型进行聚类形成不同用户群,并对检索到的结果进行聚类处理,与用户模型聚类相结合返回给用户个性化的搜索结果。  相似文献   

7.
从小偷踩点获取藏金信息中受到启发,提出了一种互联网信息智能搜索新方法。能够从已经分好类的特定领域网站中,准确高效地搜索出隐藏于其内部的目标网页。把所有的搜索网页根据检索信息分成两类:一类是信息点,一类是信息路径。采用信息路径特征与信息点信息量特征描述有机结合而形成的一种新的搜索知识表示方法。基于这种知识表示方法,智能搜索方法不仅能够对网站中网页进行深度优先的智能搜索,而且还能够通过对其搜索过程和结果的自学习来获取更多更好的搜索知识。  相似文献   

8.
一种语义对等网模型   总被引:4,自引:0,他引:4  
对等网络是一个由应用推动的技术领域.为了改善结构化覆盖网对等网络搜索结果,使搜索过程及结果更加智能化、更接近用户查找目的,提出一种使用语义网技术的语义对等网络模型,使用语义网技术对查询注释,而不直接对网页资源注释,并根据规则聚类原则抽象结点知识仓库对结点进行聚类.分析了该模型的实现过程.  相似文献   

9.
随着互联网的迅速发展.网络上的信息量呈现出迅猛增长趋势,为了查询所需知识,搜索引擎已成为知识搜索和知识发现的必备工具。该工具是综合了数据库技术、数据挖掘技术、人工智能知识等多种技术,利用数据检索策略进行知识发现的过程。但目前搜索引擎还存在一些缺陷,尤其是针对个性化的查询请求往往不能达到满意效果。所以将数据挖掘技术应用到搜索引擎领域,从而产生智能搜索引擎,将会给用户提供一个高效、准确的Web检索工具。 本文针对目前搜索引擎在检索准确率和全面性方面存在的不足,设计并实现了一种智能化搜索引擎模型,同时提出了一种改进的聚类算法和关联分析方法,并在此基础上实现了一个基于数据挖掘的搜索模型。  相似文献   

10.
网络搜索如今已成为最普遍使用的互联网服务之一,据可靠信息调查显示, 80%以上的用户对企业、服务行业等信息进行查询时均首选网络搜索引擎。但是用户如果想要搜索某个特定地方的信息时,总是很难有合适的方式查找这类信息。  相似文献   

11.
针对Internet信息资源的特点和信息检索系统的现状,提出一个应用智能协作信息技术进行Internet信息检索的完整的解决方案,该智能信息检索系统应用了三类智能主体,即用户接口主体、信息处理主体和信息搜索主体,分别实现个性化的智能游览器、网上信息(主要是文档)的分析处理以及信息的搜索。分析了系统的基本结构作主要工作原理,并对系统实现进行了初步的讨论。  相似文献   

12.
基于Agent的个性化信息服务技术的研究   总被引:25,自引:0,他引:25       下载免费PDF全文
随着网络资源的不断丰富和网络信息量的不断膨胀,现有搜索引擎技术已难以满足人们查找信息的需求。如何为用户提供更为满意的、符合其个性化的信息服务,已成为一个重要的研究课题。本文针对这一情况,提出了基于Agent的个性化信息服务技术,并对其基本原理进行了阐述,构建了一个多Agent的模型系统。最后,对当前存在的问题进行了总结。  相似文献   

13.
田莉霞 《软件》2020,(4):67-71
随着信息化社会的来临,各种互联网技术应运而生,数字信息已然成为当今社会中商家必争的宝贵财富资源。众多数字信息中,怎样帮助用户精准筛选出有效信息是当前搜索引擎所面临的巨大挑战。传统的互联网搜索仅仅是基于本文的链接,搜索时仅单纯的给出包含搜索词的网页,让用户去网页中寻找答案,这种检索方法耗时耗力,还不能准确给出用户想要的答案。由此谷歌率先提出以知识图谱(Knowledge Graph)为技术基础的的搜索引擎,这是搜索引擎界的一次重大变革。它以图的形式表现客观世界中的概念和实体及其之间关系,现如今广泛应用于语义搜索、智能问答、决策支持等智能服务领域。本文针对什么是知识图谱、如何表示构建知识图谱及知识图谱的主要应用作了详细阐述,希望更多的读者可以了解知识图谱及其对人工智能发展的巨大贡献。  相似文献   

14.
Web智能搜索多Agent系统结构及相关技术   总被引:7,自引:0,他引:7  
提出了一种多Agent系统结构,由用户界面Agent、过滤查找Agent、反馈更新Agent、操作Agent、搜索Agent、搜索Agent和中心索引库6个部分组成。该多Agent结构适用于Internet上的智能搜索系统,能够完成信息主动搜索、中心索引、信息过滤查找以及用户反馈更新等功能。详细描述了多Agent系统的分工以及相关实现技术的研究。  相似文献   

15.
基于元搜索引擎的专业式智能网络信息检索系统   总被引:11,自引:3,他引:11  
随着网络信息资源的迅速增加和实时更新,如何及时准确地获取自己所需的有用信息是现代网络信息检索技术需要解决的主要问题。介绍了一种基于元搜索引擎的新型专业式智能网络信息检索系统。该系统建立专业词库和用户知识库,结合人工智能的Agent技术,能够很好地对用户的兴趣进行自适应学习,以实现个性化的信息检索,既保证了查全率,又提高了检索结果的查准率。  相似文献   

16.
李存永 《微计算机信息》2007,23(15):120-122
计算机技术和Internet的迅速发展,网络的信息量与访问量成几何级数增长,网络拥塞和服务超载日益成为网络及其服务器必须面对的严峻问题。为解决不同领域复杂科学计算与海量信息服务问题,出现了许多以网络互连为基础的不同的网格,它们解决的问题类型等方面各不相同。本文首先概括介绍了网格信息检索结构的基本分类和功能,提出并设计了一个基于中间件法的网格信息检索体系结构的理论模型,并对该理论模型进行了简单的分析和设计说明。  相似文献   

17.
基于本体的法律信息语义检索   总被引:3,自引:0,他引:3       下载免费PDF全文
网络中海量的法律信息及其多义性为准确、高效的查询检索提出了难题,进而也桎梏着司法判案、决策的方法。为了较好地解决司法信息检索中存在的问题,通过对国内外领域本体方法、语义Web技术的研究,借助本体的概念构建了面向案例的法律信息语义检索原型,为法律领域的知识管理和信息检索提供了可借鉴的参考。  相似文献   

18.
近几十年来,互联网技术的飞速发展加快了信息流通的速度,现代社会已经进入到信息时代。能够利用互联网技术进行信息搜索,已经成为现代人必备的基本素质和能力。手机、平板电脑、互动电视等多媒体技术的发展,使得多媒体互联网搜索技术在社会各行各业中广泛应用,极大地改变了社会的信息流通状况。目前人们越来越多地利用互联网信息资源来满足自身信息的需求,因此,互联网信息检索日益发展成为社会的主流。主要介绍互联网信息搜索引擎的共组原理以及多媒体互联网的信息搜索技术,为相关研究人员提供参考。  相似文献   

19.
With the advancement of Web 2.0 applications, this study aims to advocate that social bookmarking (SB) applications could support mutual exchange of finding information in a manner of collective information searching (CIS). A social bookmarking system, namely ‘WeShare,’ was developed, and conducted with 127 junior high school students for performing the given assignment in this study. The participants’ activities of collecting and reviewing relevant information were traced by log data for later analysis. To initially unveil the participants’ behaviors in the use of social bookmarking for co-exploring the Internet resources, this study proposed some quantitative indicators to represent students’ personal contributions (‘Bookmarks from the Internet,’ ‘Bookmarks from WeShare,’ ‘Annotations on personal bookmarks,’ ‘Comments on others’ bookmarks’) and peer feedback (‘The number of bookmarks collected by peers,’ ‘The number of bookmarks commented on by peers,’ ‘The number of comments from peers’). By the method of cluster analysis, some behavioral patterns regarding how participants collectively search the Internet by use of WeShare were identified. Furthermore, the findings suggest that personal contributions to citing and commenting on peers’ bookmarks are important to the advancement of collective information searching activities for finding quality information on the Internet.  相似文献   

20.
一种互联网信息智能搜索新方法   总被引:10,自引:1,他引:9  
提出了一种互联网信息智能搜索新方法。该方法能够从组织结构和内容描述类似的同类网站中,准确有效搜索出隐藏于其内部的目标网页。为此它采用了将网页间相互关联特征与网页内容特征描述有机结合而形成的一种新的搜索知识表示方法。基于这种知识表示方法及其所表示的知识;该智能搜索方法不仅能够对风站中网页进行深度优先的智能搜索,而且还能够通过对其搜索过程和结果的自学习来获取更多更好的搜索知识。初步实验结果表明,这种智能搜索新方法在对同类型网站的目标网页搜索中具有很强的深度网页搜索能力。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号