期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

<正> 通常的检索引擎将用户检索的结果表现为一个按照相关度排序的列表,这里的相关度指所检索的文档与用户问题之间的相似度。这种排序的机制仅仅能够在用户可以将想要查询内容很好地定义出来的情况下才能发挥良好的功效,这个条件往往只适用于一些专业人员,在真实的情况下,70％的Web用户会将其所查询的问题浓缩到一或两个单词中,在这种条件下,检索引擎很难找到用户真正感兴趣的内容,当用户对其所检索的领域相似文献

6.

便用Java编程解析HTML文档

包宇宁《福建电脑》2004,(9):86-87

本文研究并探讨了使用Java编程解析HTML文件的主要技术，并就具体实现中的问题提出了自己的见解。相似文献

7.

WEB系统中巧用WORD文档的HTML格式创建多样式的WORD文档

黄英《网络与信息》2008,(6):39-39

本文提出了一种解决WEB系统中多样式WORD文档的输出问题的通用办法,该办法为非计算机专业人士开发WEB系统提供了一个解决问题的途径. 相似文献

8.

WWWDOC系统中HTML文档的可视化编辑与浏览技术的 … 总被引：1，自引：0，他引：1

卢坚孙煜华《计算机辅助设计与图形学学报》1999,11(6):559-562

ＷＷＷ文档协同写作系统（简称ＷＷＷＤＯＣ）的ＨＴＭＬ文档的层次式结构包装技术要求对标准ＨＴＭＬ语言进行扩展,以支持文档层次结构间的超链链接和媒体引用;在此基础上实现扩展ＨＴＭＬ文档的可视化编辑和浏览导航。相似文献

9.

面向XML文档的概念检索技术 总被引：11，自引：1，他引：11

孙登峰《计算机应用》2003,23(1):110-112

面向XML文档的信息检索是一个重要的研究课题，文中介绍了结构化文档的结构索引以及语义检索中的“上下文共现分析”技术，并在此基础上提出了一个面向XML文档的概念检索原型系统，并对系统设计及实现中应注意考虑的几个主要问题进行了分析。相似文献

10.

HTML页面加载XML文档的几种方法

王昌《电脑开发与应用》2007,20(12):75

当前互联网的基础语言是HTML。HTML的核心是信息的显示,而不是信息的内容和结构。XML的出现扩展了标记语言的功能,允许用户根据需要自定义标记,具有数据内容与显示相分离、开放、跨平台等特点,能够从根本上解决分布式环境下基于异质平台的应用系统间的数据交换问题。因而,“以数据库存储和处理数据,以XML作数据交换媒介”逐渐成为数据管理的主流方式。相似文献

11.

基于改进向量空间模型的Web信息检索技术研究 总被引：12，自引：1，他引：12

雷景生林冬雪符浅浅《计算机工程》2005,31(1):14-16

提出了一种改进的向量空间模型。该模型将一篇文档的相关信息从逻辑上划分为多个相对独立的文本段,按照不同位置的文本段确定相应的索引项权重,并给出了该模型的相似度计算方法。实验表明,将该模型应用于Web信息检索中,具有对输出结果的排序能力强、查询速度快等优点。相似文献

12.

WWW网页布局规则初探 总被引：1，自引：0，他引：1

黄海晖廖光裕智成凤《计算机应用与软件》2000,17(3):56-64

连入WWW(WorldWideWeb)的用户和网点数量每年成倍增长.要想使一个网点在数以百万计的网点中给访问者留下深刻的印象,设计出一个含有丰富信息、易于浏览、视觉上怡人的网页(WebPages)是不可或缺的.本文从Gestalt心理学、传统印刷术、超文本制作和人机交互学出发,尝试提出一个网络文档(WebDocuments)界面布局的设计规则,包括文本、图形、静态和动态的网络文档.本文把网络文档分成五种基本类型,然后给出了一些布局规则. 相似文献

13.

一种基于权重矩阵的临近词检索问题解决框架

乔亚男齐勇史椸侯迪王晓《计算机科学》2009,36(7):197-201

传统的信息检索模型假设查询中的关键词之间是并列关系,但用户的需求往往应该被抽象为一系列的关键词组,组内的关键词间具有更为紧密的语义关系,这就是定义的临近词检索问题.提出了基于权重矩阵的临近词检索问题解决框架,该框架将文档和查询抽象化为文档的权重矩阵表示和查询权重矩阵,通过计算两个矩阵间的相似度来实现临近词检索.实验结果证明,针对临近词检索问题,传统的信息检索模型只是一种简化问题的解决方案,权重矩阵框架从理论上和形式上更加契合临近词检索问题,查准率得到了显著的提高. 相似文献

14.

改进的向量质心模型在实时信息检索中的应用研究

刘绍翰王箭黄志球《计算机应用与软件》2011,(10)

将相关反馈技术应用于信息检索中可以学习和明确用户的信息需求,并对检索结果进行信息过滤,是提高信息检索效果的有效手段之一。除了准确率和召回率之外,过滤算法的适应性、速度也直接影响用户使用信息检索系统的体验。采用向量空间模型表示文档的内容预处理工作少,计算简单,适用于实时信息检索。结合偏差最小的基本原理,将改进的反馈文档向量的质心应用于信息重排。以重排的应用场景,在TREC Filtering Task数据集上进行仿真,并与基于关键词检索和类质心的检索方式进行了试验比较。相似文献

15.

基于B/S结构的嵌入式超文本编辑器的设计与实现

王磊史烈陈小平《计算机工程》2002,28(2):104-105,119

介绍了基于Browser/Server结构的嵌入式超文本格式编辑器的设计和实现方法。相似文献

16.

基于统计方法的汉语自动文摘系统研究 总被引：11，自引：0，他引：11

王文欣黄萱菁吴立德《计算机应用与软件》2000,17(9):28-33

本文简要介绍了文本的向量空间模型表示,并提出了用该模型进行非受限真实文本的自动文摘方法。其基本思想是对输入文本进行项（本文为词和概念）的统计,根据不同项在文本中的分布评估其重要性,据此和其它信息形成句子的综合权重,生成摘要。文中较详细地介绍了系统的实现及实验结果,同时提出了对文摘系统的评价方法。相似文献

17.

一种基于多叉树的HTML到XML的转换方法

张文斌陈恩红王进《小型微型计算机系统》2003,24(9):1617-1620

当前的Web信息大多数都是HTML格式的，由于HTML文件中没有严格的结构性，故很难能用一种有效的方法来检索或提取隐藏其中的数据．针对HTML的这种缺陷，本文提出了基于多叉树的HTML到XML转换方法，把对HTML的信息检索问题转化为对XML的检索问题，以便简化下一步的检索问题．相似文献

18.

一种高效的行为定向广告投放算法 总被引：1，自引：0，他引：1

俞淑平陈刚《计算机应用与软件》2011,28(1)

行为定向广告作为一种新的精准营销手段在近几年逐渐兴起,这种广告模式以其及时、精准、高效的特点备受人们的关注。行为定向广告的主旨是利用用户的网络浏览行为,提供符合用户意图的广告信息,它主要通过分析用户的网页历史访问记录来挖掘有价值的用户行为信息,并针对这种信息投放与之相关的广告。针对行为定向广告问题,提出了一种全新的行为定向广告投放算法,该算法首先根据用户行为特征模型对用户最近访问的网页按主题进行聚类,然后利用用户行为特征分析算法对每一类网页进行行为特征分析并计算该类网页的权重,利用该权重以及该类网页的质心与广告的相似度来计算最后得分,并按照这个得分对广告进行排序从而选出适合该类网页的广告。大量实验表明这是一种高效的行为广告投放算法,有着十分广阔的应用前景。相似文献

19.

浅谈HTML 总被引：1，自引：0，他引：1

王晖媛《计算机光盘软件与应用》2010,(11)

HTML是构成网页文档的主要诺言,而最新版本的HTML5的新使命是将Web带入一个成熟的应用平台.在HTML5平台上,视频、音频、图像、动画,以及同电脑的交互都被标准化.我们通过对HTML的介绍,来了解HTML的发展,从而更好的了解和学习HTML5. 相似文献

20.

Extracting logical structures from HTML tables

Yeon-Seok Kyong-Ho 《Computer Standards & Interfaces》2008,30(5):296-308

While HTML is mainly designed for the visual rendering of Web documents, XML is widely accepted as a standard format to process and manage information. In particular, it can embed the information of logical structures. However, in order to utilize XML, the logical structures of HTML tables should first be extracted and transformed into XML representations. This paper presents an efficient method for the process, which consists of two phases: area segmentation and structure analysis. The area segmentation cleans up tables and segments them into attribute and value areas by checking visual and semantic coherency. The hierarchical structure between attribute and value areas is then analyzed and transformed into an XML representation using a proposed table model. Experimental results with 1180 HTML tables show that the proposed method performs better than conventional methods, resulting in an average accuracy of 86.7%. 相似文献