首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
研究一种用于分析HTML文档的信息服务代理模型。采用模糊检索引擎,对HTML文档进行关键词及其相关语意的检索。并编写实际软件平台进行了检索实验,结果表明模糊检索算法的合理性。  相似文献   

2.
只要能准备好XML文件和样式表文件,就可以在Ja-va程序中直接使用样式表文件将XML文件输出成HTML文件。转换步骤如下:(1)当使用JAXP API处理XSLT转换时,需导入相关的包。  相似文献   

3.
主页制做的基础是HTML语言,本文以快捷的方式介绍HTML语言的主要功能和应用技巧,使读者能够较快地掌握HTML语言以及主页的文字、图案、颜色、表格等编辑制做了基本方法。  相似文献   

4.
5.
胡昕 《软件工程师》2002,(12):52-53
<正> 通常的检索引擎将用户检索的结果表现为一个按照相关度排序的列表,这里的相关度指所检索的文档与用户问题之间的相似度。这种排序的机制仅仅能够在用户可以将想要查询内容很好地定义出来的情况下才能发挥良好的功效,这个条件往往只适用于一些专业人员,在真实的情况下,70%的Web用户会将其所查询的问题浓缩到一或两个单词中,在这种条件下,检索引擎很难找到用户真正感兴趣的内容,当用户对其所检索的领域  相似文献   

6.
本文研究并探讨了使用Java编程解析HTML文件的主要技术,并就具体实现中的问题提出了自己的见解。  相似文献   

7.
本文提出了一种解决WEB系统中多样式WORD文档的输出问题的通用办法,该办法为非计算机专业人士开发WEB系统提供了一个解决问题的途径.  相似文献   

8.
WWWDOC系统中HTML文档的可视化编辑与浏览技术的 …   总被引:1,自引:0,他引:1  
WWW文档协同写作系统(简称WWWDOC)的HTML文档的层次式结构包装技术要求对标准HTML语言进行扩展,以支持文档层次结构间的超链链接和媒体引用;在此基础上实现扩展HTML文档的可视化编辑和浏览导航。  相似文献   

9.
面向XML文档的概念检索技术   总被引:11,自引:1,他引:11  
孙登峰 《计算机应用》2003,23(1):110-112
面向XML文档的信息检索是一个重要的研究课题,文中介绍了结构化文档的结构索引以及语义检索中的“上下文共现分析”技术,并在此基础上提出了一个面向XML文档的概念检索原型系统,并对系统设计及实现中应注意考虑的几个主要问题进行了分析。  相似文献   

10.
当前互联网的基础语言是HTML。HTML的核心是信息的显示,而不是信息的内容和结构。XML的出现扩展了标记语言的功能,允许用户根据需要自定义标记,具有数据内容与显示相分离、开放、跨平台等特点,能够从根本上解决分布式环境下基于异质平台的应用系统间的数据交换问题。因而,“以数据库存储和处理数据,以XML作数据交换媒介”逐渐成为数据管理的主流方式。  相似文献   

11.
基于改进向量空间模型的Web信息检索技术研究   总被引:12,自引:1,他引:12  
提出了一种改进的向量空间模型。该模型将一篇文档的相关信息从逻辑上划分为多个相对独立的文本段,按照不同位置的文本段确定相应的索引项权重,并给出了该模型的相似度计算方法。实验表明,将该模型应用于Web信息检索中,具有对输出结果的排序能力强、查询速度快等优点。  相似文献   

12.
WWW网页布局规则初探   总被引:1,自引:0,他引:1  
连入WWW(WorldWideWeb)的用户和网点数量每年成倍增长.要想使一个网点在数以百万计的网点中给访问者留下深刻的印象,设计出一个含有丰富信息、易于浏览、视觉上怡人的网页(WebPages)是不可或缺的.本文从Gestalt心理学、传统印刷术、超文本制作和人机交互学出发,尝试提出一个网络文档(WebDocuments)界面布局的设计规则,包括文本、图形、静态和动态的网络文档.本文把网络文档分成五种基本类型,然后给出了一些布局规则.  相似文献   

13.
将相关反馈技术应用于信息检索中可以学习和明确用户的信息需求,并对检索结果进行信息过滤,是提高信息检索效果的有效手段之一。除了准确率和召回率之外,过滤算法的适应性、速度也直接影响用户使用信息检索系统的体验。采用向量空间模型表示文档的内容预处理工作少,计算简单,适用于实时信息检索。结合偏差最小的基本原理,将改进的反馈文档向量的质心应用于信息重排。以重排的应用场景,在TREC Filtering Task数据集上进行仿真,并与基于关键词检索和类质心的检索方式进行了试验比较。  相似文献   

14.
乔亚男  齐勇  史椸  侯迪  王晓 《计算机科学》2009,36(7):197-201
传统的信息检索模型假设查询中的关键词之间是并列关系,但用户的需求往往应该被抽象为一系列的关键词组,组内的关键词间具有更为紧密的语义关系,这就是定义的临近词检索问题.提出了基于权重矩阵的临近词检索问题解决框架,该框架将文档和查询抽象化为文档的权重矩阵表示和查询权重矩阵,通过计算两个矩阵间的相似度来实现临近词检索.实验结果证明,针对临近词检索问题,传统的信息检索模型只是一种简化问题的解决方案,权重矩阵框架从理论上和形式上更加契合临近词检索问题,查准率得到了显著的提高.  相似文献   

15.
基于统计方法的汉语自动文摘系统研究   总被引:11,自引:0,他引:11  
本文简要介绍了文本的向量空间模型表示,并提出了用该模型进行非受限真实文本的自动文摘方法。其基本思想是对输入文本进行项(本文为词和概念)的统计,根据不同项在文本中的分布评估其重要性,据此和其它信息形成句子的综合权重,生成摘要。文中较详细地介绍了系统的实现及实验结果,同时提出了对文摘系统的评价方法。  相似文献   

16.
王磊  史烈  陈小平 《计算机工程》2002,28(2):104-105,119
介绍了基于Browser/Server结构的嵌入式超文本格式编辑器的设计和实现方法。  相似文献   

17.
当前的Web信息大多数都是HTML格式的,由于HTML文件中没有严格的结构性,故很难能用一种有效的方法来检索或提取隐藏其中的数据.针对HTML的这种缺陷,本文提出了基于多叉树的HTML到XML转换方法,把对HTML的信息检索问题转化为对XML的检索问题,以便简化下一步的检索问题.  相似文献   

18.
一种高效的行为定向广告投放算法   总被引:1,自引:0,他引:1  
行为定向广告作为一种新的精准营销手段在近几年逐渐兴起,这种广告模式以其及时、精准、高效的特点备受人们的关注。行为定向广告的主旨是利用用户的网络浏览行为,提供符合用户意图的广告信息,它主要通过分析用户的网页历史访问记录来挖掘有价值的用户行为信息,并针对这种信息投放与之相关的广告。针对行为定向广告问题,提出了一种全新的行为定向广告投放算法,该算法首先根据用户行为特征模型对用户最近访问的网页按主题进行聚类,然后利用用户行为特征分析算法对每一类网页进行行为特征分析并计算该类网页的权重,利用该权重以及该类网页的质心与广告的相似度来计算最后得分,并按照这个得分对广告进行排序从而选出适合该类网页的广告。大量实验表明这是一种高效的行为广告投放算法,有着十分广阔的应用前景。  相似文献   

19.
浅谈HTML   总被引:1,自引:0,他引:1  
HTML是构成网页文档的主要诺言,而最新版本的HTML5的新使命是将Web带入一个成熟的应用平台.在HTML5平台上,视频、音频、图像、动画,以及同电脑的交互都被标准化.我们通过对HTML的介绍,来了解HTML的发展,从而更好的了解和学习HTML5.  相似文献   

20.
While HTML is mainly designed for the visual rendering of Web documents, XML is widely accepted as a standard format to process and manage information. In particular, it can embed the information of logical structures. However, in order to utilize XML, the logical structures of HTML tables should first be extracted and transformed into XML representations. This paper presents an efficient method for the process, which consists of two phases: area segmentation and structure analysis. The area segmentation cleans up tables and segments them into attribute and value areas by checking visual and semantic coherency. The hierarchical structure between attribute and value areas is then analyzed and transformed into an XML representation using a proposed table model. Experimental results with 1180 HTML tables show that the proposed method performs better than conventional methods, resulting in an average accuracy of 86.7%.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号