共查询到20条相似文献,搜索用时 62 毫秒
1.
有效组织节点共享文档,是提高对等网络搜索效率和搜索质量的重要因素之一.提出采用文档聚类技术构建文档聚类特征树来组织共享文档的方法,并对文档聚类特征树的结构、性质、维护进行详细的分析;将该方法应用到超节点对等网络中,以提高搜索效率和搜索质量.实验结果显示了该方法的有效性. 相似文献
2.
3.
为了满足用户对信息检索结果准确不断提高的需求,尽可能应用那些与查询及检索结果有关的信息进行查询结果优化是一种有效的手段。查询扩展和结果重排就是利用附加信息进行检索结果优化的方法。该文提出了基于文档团的文档重排模型(DCRM模型),此模型通过对文档集的学习,构造文档与文档关系的Markov网络,提取出文档Markov网络中的“文档团”,应用文档团信息进行文档重排。在adi、cacm、med、cisi和cran五个数据集上的实验结果表明,本文提出的基于文档团的文档重排模型较BM25模型性能得到有效提高。 相似文献
4.
本体论在基于内容信息检索中的应用 总被引:43,自引:2,他引:43
网络信息的激增加和多样化给有效的信息检索带来了种种困难,目前的检索工具仅提供了基于关键字的检索,而忽视了关键字本身所含的语义内容,该文提出的信息检索原型系统,利用本体论中概念规范,语义丰富的特点,将用户的检索要求扩充成语义集,并且将检索到的文档通过文档分析器进一步过滤,使用户最终得到与检索要求内容匹配度较高的文档。 相似文献
5.
基于网络用户行为的搜索引擎系统SISI 总被引:1,自引:0,他引:1
提出了一种基于网络用户行为的搜索引擎SISl(Similar Interest,Similar access on Internet)。SISI的查询输入是一个Web文档的URL。SISI的检索模型是使用统计的方法基于网络日志中用户对文档的访问频率挖掘相关文档,充分利用了用户在相关文档判定上的潜在意识。模型的假设基础是一组兴趣相似的人访问的文档有可能相关。与传统的搜索引擎相比较,搜索引擎SISI具有系统初始化时间代价小、空间代价小等优点。同时SISI的检索优势在于可以查找那些没有显式相似内容的相关文档,尤其是在检索处理时避开了文档的类型,将文本文档和多媒体文档一视同仁。 相似文献
6.
7.
WWW网页布局规则初探 总被引:1,自引:0,他引:1
连入WWW(WorldWideWeb)的用户和网点数量每年成倍增长.要想使一个网点在数以百万计的网点中给访问者留下深刻的印象,设计出一个含有丰富信息、易于浏览、视觉上怡人的网页(WebPages)是不可或缺的.本文从Gestalt心理学、传统印刷术、超文本制作和人机交互学出发,尝试提出一个网络文档(WebDocuments)界面布局的设计规则,包括文本、图形、静态和动态的网络文档.本文把网络文档分成五种基本类型,然后给出了一些布局规则. 相似文献
8.
本文使用XML语言和加解密技术提出了一种基于分布式网络的文档安全管理系统,它通过网络管理重要文档的使用权限和放发许可证制度实现对重要电子文档的保护。与目前使用的电子文档安全管理系统相比较,本系统具有良好的安全性、扩展性和易用性。 相似文献
9.
10.
研究表明合理考虑术语之间的关系可以提高检索系统的性能。采用共现分析的方法从文档集合中学习得到术语之间的关系,并应用到结构化文档检索中,提出了一个基于贝叶斯网络的结构化文档检索模型,给出了其拓扑结构、概率估计以及推理过程。实验表明该模型的检索性能要优于没有考虑术语之间关系的模型。 相似文献
11.
Marc Lauritsen 《Artificial Intelligence and Law》1992,1(1):87-102
Document assembly and other substantive legal practice applications are the most knowledge-intense forms of software now widely available in the legal technology marketplace. This article provides an illustrative look at two contemporary practice system engines-CAPS and Scrivener-and examines their relevance for AI-and-law researchers. 相似文献
12.
13.
14.
15.
针对目前软件测试过程中通用文档自动生成所面临的问题,介绍了一种基于XML的通用测试文档生成方法.分析了软件测试文档的基本种类及文档生成的重要性,论述了将XML技术用于通用文档生成中的优势,给出了一个基于XML的通用测试文档生成模型,并探讨了该模型的关键方案设计. 相似文献
16.
17.
18.
19.
20.
中文文本中抽取特征信息的区域与技术 总被引:30,自引:3,他引:30
本文探讨了各种从中文文本中抽取特征信息的区域和技术。本文以新闻语料、科技论文、公文类文献为例,详细论述了从各类文本中抽取特征信息的区域与技术,对科技论文,还给出了一些可操作的产生式规则。无论对自动标引、自动分类,还是自动文摘的研究者而言,本文的方法与结论都有一定的参考价值。 相似文献