首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 265 毫秒
1.
针对根据目前网络信息检索存在的查全率和查准率低的特点,提出一种个性化的局部上下文分析方法,以提高Web信息检索的性能.该方法通过设计一种客户端的用户兴趣挖掘模型,同时将用户兴趣模型与局部上下文分析方法相结合,克服了局部上下文分析的缺陷.实验结果显示该方法能有效提高Web信息检索的查全率与查准率.  相似文献   

2.
将文本分类技术应用于林业Web黄页的分类,实现了林业Web黄页信息的高效应用和管理。讨论了林业Web黄页多层次分类体系,并给出了分类系统的设计方案和关键技术,详细介绍了类别区分词特征选择算法。实验结果具有较好的准确率和查全率。  相似文献   

3.
基于子树匹配的交互式Web数据抽取方法   总被引:4,自引:0,他引:4  
查询相关的Web页面中的数据记录之间具有极高的代码结构相似性。Web数据记录对应的DOM子树之间自然也就具有很高的结构相似性。针对查询相关的Web页面的特点,提出了一种基于DOM子树匹配的交互式Web数据抽取方法,实验证明,该方法能保证很高的数据抽取查全率和准确率。  相似文献   

4.
基于数据区域发现的信息抽取规则生成方法   总被引:2,自引:2,他引:0       下载免费PDF全文
提出一种自动检测网页中数据记录结构特点并生成Web信息抽取规则的方法,以网页DOM树为基础,自动发现和分离Web数据区域所对应的DOM子树,将其分解为数据记录子树集合,综合数据记录子树的结构特点生成抽取规则。实验结果显示,该方法具有较高的抽取准确率和查全率。  相似文献   

5.
利业鞑  庞雄文 《计算机应用》2009,29(7):1981-1984
在语义数据集成中本体映射是关键,手工设置映射关系消耗时间并且不准确,需要使用本体映射工具自动发现这种映射关系。在现有本体映射方法的基础上提出了基于领域学习的映射方法,可以发现本体中概念之间的映射关系,可以从领域知识中发现复杂映射的规则、增加映射时的实例数据,提高映射发现的查全率和准确率。实验结果验证了算法的有效性。  相似文献   

6.
基于本体的Web服务发现方法研究   总被引:3,自引:1,他引:2  
针对传统Web服务发现准确率低下的问题,提出一种基于本体的服务发现方法.该方法首先基于领域本体构建了Web服务描述模型,并应用OWL-S描述Web服务增强了Web服务的语义信息,然后从基本信息语义相似度、功能语义相似度等方面综合计算Web服务相似度,最后基于Web服务相似度进行请求服务与目标服务的匹配.给出了基于本体的服务发现相关算法,并设计了基于三层架构的服务发现原型系统.实验结果表明,该方法可提高Web服务发现的查全率及查准率.  相似文献   

7.
基于用户兴趣的查询扩展语义模型   总被引:1,自引:0,他引:1  
自然语言中词的同义现象和歧义现象一直是降低信息检索查全率和查准率的关键,在Web搜索引擎上显得更加突出。提出了一种基于用户兴趣的查询扩展语义模型,通过构建基于Yahoo的语义ontology知识库消除同义现象,设计客户端的用户兴趣挖掘模型消除歧义现象。实验结果显示该方法能有效提高Web信息检索的查全率与查准率。  相似文献   

8.
随着WWW的迅速发展和网络用户的急剧增加,准确预测Web用户的访问行为对减小用户的感知延时,实现个性化推荐等具有重要的作用.无论是Markov模型还是其任何一种变种,高阶模型具有较好的预测性能.然而,高阶模型通常有较高的状态空间复杂度.提出了一种新的混合阶Markov模型(HMPM),将前缀相同的序列共享存储,降低了状态空间复杂度.仿真实验结果表明,该模型在一定程度上提高了预测准确率,查全率也有所提升.  相似文献   

9.
搜索引擎是互联网普及的标志,目前搜索引擎在查全率和准确率上是不能让用户满意的,如何使用户获得有用的信息已成为信息检索系统急需解决的问题.文章主要对用户个性化搜索引擎系统进行了研究,提出了一种基于用户兴趣的搜索引擎信息处理方法.首先对系统各模块的功能进行了详细的研究和介绍.然后具体介绍了输入信息处理方法流程及相关技术的研究.实验结果表明,通过对输入信息进行了关键词处理后,可以有效的提高对用户所需信息的理解的准确率,从而提高搜索引擎的查全率和准确率,具有一定的理论价值和应用价值.  相似文献   

10.
一种关于语义Web服务匹配的策略和实现   总被引:7,自引:0,他引:7  
Web服务的迅速发展使得Web服务的匹配和查找问题成为研究热点。引用领域本体对Web服务进行语义描述,再进行语义层上的匹配,是Web服务匹配研究领域的一个重要研究方向。本文从Web服务的输入、输出参数的语义描述出发,把Web服务的匹配问题转化为领域本体库中概念间语义距离的计算,并根据服务请求者对Web服务的需求,提出了用不同的方法来计算Web服务输入、输出概念间的语义距离,其中处理Web服务输出概念时着重提高Web服务查找的查准率,而处理Web服务输入概念时则注重提高Web服务查找的查全率。实验结果显示了该方法较别的服务查找方法在查准率特别是查全率上得到了提高。  相似文献   

11.
Mining Web informative structures and contents based on entropy analysis   总被引:3,自引:0,他引:3  
We study the problem of mining the informative structure of a news Web site that consists of thousands of hyperlinked documents. We define the informative structure of a news Web site as a set of index pages (or referred to as TOC, i.e., table of contents, pages) and a set of article pages linked by these TOC pages. Based on the Hyperlink Induced Topics Search (HITS) algorithm, we propose an entropy-based analysis (LAMIS) mechanism for analyzing the entropy of anchor texts and links to eliminate the redundancy of the hyperlinked structure so that the complex structure of a Web site can be distilled. However, to increase the value and the accessibility of pages, most of the content sites tend to publish their pages with intrasite redundant information, such as navigation panels, advertisements, copy announcements, etc. To further eliminate such redundancy, we propose another mechanism, called InfoDiscoverer, which applies the distilled structure to identify sets of article pages. InfoDiscoverer also employs the entropy information to analyze the information measures of article sets and to extract informative content blocks from these sets. Our result is useful for search engines, information agents, and crawlers to index, extract, and navigate significant information from a Web site. Experiments on several real news Web sites show that the precision and the recall of our approaches are much superior to those obtained by conventional methods in mining the informative structures of news Web sites. On the average, the augmented LAMIS leads to prominent performance improvement and increases the precision by a factor ranging from 122 to 257 percent when the desired recall falls between 0.5 and 1. In comparison with manual heuristics, the precision and the recall of InfoDiscoverer are greater than 0.956.  相似文献   

12.
为提高Web服务匹配的灵活性、查全率和查准率,提出了一种基于领域本体的综合服务匹配方法。首先,该方法以领域本体为描述语言提出了Web服务和服务请求的描述形式;然后以此为基础提出了“三层次”服务匹配模型来提高服务匹配的灵活性;同时指出了每层次的相似函数,这些函数综合考虑了影响服务匹配查全率和查准率的各种因素,并在算法中加以体现;最后用实验证明提出的匹配方法是可行和有效的。  相似文献   

13.
Web users often post queries through form-based interfaces on the Web to retrieve data from the Web; however, answers to these queries are mostly computed according to keywords entered into different fields specified in a query interface, and their precision and recall could be low. The precision and recall ratios in answering this type of query can be improved by considering closely related previous queries submitted through the same interface, along with their answers. In this paper, we present an approach for enhancing the retrieval of relevant answers to a form-based Web query by adopting the data-mining approach using previous, relevant queries and their answers. Experimental results on a randomly selected set of 3,800 documents retrieved from various Web sites show that our data-mining, query-rewriting approach achieves average precision and true positive ratios on rewritten queries in the upper 80% range, whereas the average false positive ratio is less than 2.0%. Work partially done during a visit to BYU and partially supported by National Natural Science Foundation of China No. 60503036 and Fok YingTong Education Foundation No. 104027.  相似文献   

14.
15.
当前的对象级排序算法或是忽略对象的Web特征,或是忽略与用户查询的相关度,效果都不太理想。针对这些不足,综合考虑对象的Web特征以及与查询词的相关度等因素,给出改进的H—PopRank算法。实验表明,该算法可以提高查全率级平均查准率和用户满意度。  相似文献   

16.
刘苏祺  白光伟  沈航 《计算机科学》2016,43(7):224-229, 239
模式层知识对于语义万维网的发展非常重要,然而当前开放链接数据(LOD)中模式层知识的数量十分有限,为突破这一局限,提出一种基于社交网络中用户自描述标签的层次分类体系构建方法。该方法首先设计基于搜索引擎的标签分块算法,将描述相同话题的标签划分到同一标签块中,然后采用基于半监督学习的标签传播算法挖掘相同标签块中标签间的上下位关系,最后运用基于启发式规则的贪心算法来构建层次分类体系,从而在社交站点中构建出大规模且高质量的层次分类体系。实验结果表明,该构建方法与现有相关工作相比在准确率、召回率以及F值上均有明显提高。  相似文献   

17.
随着Web服务的广泛应用和迅速发展,服务的种类和数量越来越多,要在众多的Web服务中高效地发现满意的服务成为一个关键的问题。目前的Web服务发现方法大多是采用基于关键字匹配的机制,查全率和查准率不高,难以满足用户的需要。针对这个问题将OWL-S引入服务发现,为Web服务添加语义信息,运用本体推理技术,文中提出一种基于OWL-S的语义相似度匹配度计算的Web服务发现方法,并设计了服务发现原型系统。实验结果表明提出的服务发现方法能够获得较好的服务发现效果。  相似文献   

18.
In recent years, the intelligent management and decision of Web services have attracted more and more attention due to the wide applications in various aspects of the real world. With the increase of Web services in an organization, the desired on-line services should be located rapidly requiring not only the syntactic but also the semantic techniques. In addition, aiming at fulfilling complex applications by discovering and composing available services automatically and precisely, it is indispensable to develop an underlying model and the corresponding measure for semantic associations among given Web services. In this paper, by mining the historical invocations of component services, we first construct a semantic model to describe their behavior rules based on the qualitative probabilistic network. Further, we propose a distance measure and the approach to discovering semantic associations among Web services. Preliminary experiments and performance studies show that our methods are feasible. Moreover, high recall and precision can be achieved when our methods are applied to Web service search.  相似文献   

19.
一种基于容错粗糙集的Web文档分类方法   总被引:2,自引:0,他引:2  
为了充分利用Web这一宝贵资源,需要一种高效准确的Web分类方法.应用机器学习技术,如K-邻近法、贝叶斯概率模型等已经实现了Web文档半自动和自动分类,但是,大多数Web分类方法共同的特点是把类作为互斥的概念,很少考虑类与类之间存在一定的交叉概念.其实,一个Web文档有时可属于几个类别,说明web文档的类之间存在不确定的关系.粗糙集理论-l982年Pawlak提出的,它在不确定关系表示有显著优点.由近似关系产生的分类方法分类精度更高.在web文档常用向量模型基础上,利用特征词协同出现的价值,本文采用一种广义粗糙集……容错关系(tolerance relation)来表示文档,丰富特征词对Web文档的描述,实验结果表明它更适合表示Web文档,有利于提高Web分类的准确性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号