首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
本文介绍了一种树型结构的存储、显示和维护方法。以二叉链表的数据结构将树的信息存储在数据库中,服务器端将数据库中树的信息转化成XML,客户端将其加载到浏览器的(DOM)实例中,并采用深度优先搜索算法对该实例中的结点进行递归遍历,生成浏览器端树的HTML代码,它是一个与上述XML文档逻辑相同的树型结构。同时在各结点上设置JS事件,可以对该树进行维护,生成针对结点维护的XML,服务器解析该XML并生成一系列SQL提交到数据库中。  相似文献   

2.
讨论了利用堆栈来生成二叉链表树的非递归算法.通过仔细分析二叉链表树的递归生成过程,从中找到了二叉树非递归实现的算法,最后应用前序遍历和中序遍历可以惟一确定一棵二叉树的方法来检验生成的二叉树的正确性.分析该算法的实现,有助于我们对它的理解与掌握.  相似文献   

3.
基于文档对象模型(DOM)的变电站配置描述语言(SCL)文件解析算法在解析文件时会将整个SCL文档内容在内存中展开,并将文件内容转化为树状节点的结构,占用较大的内容空间。针对该问题,对传统DOM算法进行改进,利用SCL文件的文本节点信息存在冗余的特性,分别使用动态数组、散列表以及二叉平衡查找树3种数据结构为文本节点建立索引并去除冗余,避免相同的信息重复使用内存。实验结果表明,对于普通的SCL文件,使用基于二叉平衡查找树的改进算法能在原算法的基础上减少46%~66%的内存使用;对于较大的SCL文件,使用基于散列表的改进算法能在原算法的基础上减少40%~59.8%的内存使用;2种针对不同大小SCL文件的改进算法,能够在保证SCL文件解析速度的前提下,有效减少DOM算法的内存消耗。  相似文献   

4.
5.
张瑞雪  宋明秋  公衍磊 《计算机科学》2011,38(4):213-215,225
一般地,从HTML网页中提取正文信息,应先将HTML、网页解析成DOM树,然后遍历DOM树,依据目标信息在DOM树中的分布规律,将信息从DOM树中提取。这种传统方法将解析DOM树和从DOM树中提取信息看成两个独立的过程,制约了提取信息的速度。事实上,在准确提取目标信息的过程中,独立解析整个DOM树是没有必要的。在此,提出了逆序解析DOM树算法,并结合DOM树相似理论和传统的顺序解析算法,从部分目标信息开始分别向后顺序和向前逆序解析DOM树,同时定位并获取其他目标信息。利用该方法提取网页正文信息,一方面只需解析部分DOM树,从而减少了解析树结构花费的时间,另一方面不需要遍历整个DOM树查找目标信息,从而节省了查找时间,大大提高了信息提取速度。最后,通过实验证实了该方法的优越性。  相似文献   

6.
张侃 《福建电脑》2011,27(2):85-86
递归生成二叉链表存储结构是一种常见的生成二叉树的方法,本文比较和分析了用C语言实现的几种递归生成算法,并指出了一种常见的错误算法。同时给出了两种递归遍历的C语言实现方法。  相似文献   

7.
利用XML DOM创建强大的XML应用   总被引:10,自引:1,他引:10  
介绍了DOM产生的背景和DOM规范,并讨论了利用XML DOM技术来实现动态地创建文档,以及遍历文档结构、添加、修改、删除文档内容,改变文档的显示方式等方法,最后给出了制作XML网页应用的实例和步骤。  相似文献   

8.
二叉链表有一个致命的缺点,即不容易显示到屏幕上。对传统的二叉树遍历算法进行改进,解决了二叉链表的输出问题,使数据结构中树的逻辑结构显示得以实现。并进而揭示出树的输出结果与逻辑结构间的几何关系。  相似文献   

9.
基于区间编码方案分裂大型XML文档到关系存储   总被引:6,自引:0,他引:6  
将一个XML文档分裂存储到关系数据库中,通常的方法是利用DOM对该XML文档进行解析,并利用DOM接口提供的XML文档树信息来实现分裂。但是,DOM在解析一个大型XML文档时效率特别低,甚至是无法胜任。文中对转换XML文档到关系数据库中进行存储和查询的策略以及区间编码方案进行了综述;基于区间编码方案探讨了如何分裂一个大型XML文档到关系存储的基本原理,并给出了相应的算法。实验结果表明,该方法是通用的、高效的。  相似文献   

10.
文章分析了HTML和XML的特点、论述了HTML向XML转换的必要性、介绍了转换的有关原理,采用了基于把HTML文档解析为DOM树形成节点信息,然后进行深度遍历的方法对各节点信息进行抽取映射为XML结构的信息,以达到转换为XML文档的目的。  相似文献   

11.
一种基于Hash表的XML模式快速提取算法   总被引:1,自引:0,他引:1  
为快速获取XML文档的模式信息,提出一种基于Hash表的XML模式提取算法。该算法首先将XML文档转换为一棵XML文档树;然后遍历这棵文档树,将相关模式信息存储到一个Hash表中;最后,对Hash表中的信息进行处理,得到XML模式的DTD表示形式。将文中的算法用VC++实现,实验结果表明该方法是可行有效的,而且在保证XML模式提取结果正确性的同时,还有效地简化了模式表示形式。  相似文献   

12.
中文单文档摘要是把一篇文档压缩成一个更短描述的过程.随着互联网数据量的增长,文档压缩技术对文本分析、数据浏览等有着重大的应用价值.但在基于序列模型的单文档单句摘要生成即标题生成领域中仍然存在数据使用率不高的问题.该文提出基于关键信息指导的标题生成算法.算法中的关键信息除了主流方法中使用的新闻首段句子之外,还包括新闻后续...  相似文献   

13.
一种基于词共现的文档聚类算法   总被引:1,自引:0,他引:1       下载免费PDF全文
常鹏  冯楠  马辉 《计算机工程》2012,38(2):213-214
为解决文本主题表达存在的信息缺失问题,提出一种基于词共现的文档聚类算法。利用文档集上的频繁共现词建立文档主题向量表示模型,将其应用于层次聚类算法中,并通过聚类熵寻找最优的层次划分,从而准确反映文档之间的主题相关关系。实验结果表明,该算法所获得的结果优于其他基于短语的文档层次聚类算法。  相似文献   

14.
依据信息论的思想,对基于层次的K-均值聚类算法(HKMA)过程进行了分析,该算法首先采用层次方法对文档进行初始聚类,得到的聚类总数作为k均值算法中的k值,在此基础上,通过k均值聚类对聚类结果进行修正。实验结果表明,HKMA执行时间整体上优于k-means算法,而且随着数据量的增大执行时间的增长幅度也较小。  相似文献   

15.
The limited display size of current small Internet devices is becoming a serious obstacle to information access. In this paper, we introduce a Document REpresentation for Scalable Structures (DRESS) to help information providers make composite documents, typically web pages, scalable in both logic and layout structure to support effective information acquisition in heterogeneous environments. Through this novel document representation structure based on binary slicing trees, the document can dynamically adapt its presentation according to display sizes by maximizing the information throughput to users. We discuss the details of this structure with its key attributes. An automatic approach for generating this structure for existing web pages is also presented. A branch-and-bound algorithm and a capacity ratio-based slicing method are proposed to select proper content representation and aesthetic document layouts respectively. A set of user study experiments have been carried out and the results show that compared with the thumbnail-based approach, the DRESS-based interface can reduce browsing time by 23.5%. This work was performed when the second and the third authors were visiting students at Microsoft Research Asia.  相似文献   

16.
人工神经网络是一种有效的文本分类技术,但网络本身的不确定性使得很难找到合适的网络。本文提出粒子群优化算法优化神经网络,使得该网络在进化过程中自适应地调节其连接权重和网络结构。首先把文本集合表示为向量空间;然后使用信息增益算法选择特征项,使用特征项频率-倒排文档频率计算特征项权值;最后使用进化神经网络对中文文本进行自动分类。实验结果表明,与原BP神经网络相比,进化BP神经网络的分类效果更好。  相似文献   

17.
XML模式验证作为处理XML数据的前提和保证有着重要的地位,XML Schema作为XML的定义语言,其本身并不能保证XML数据的有效性.利用XML Schema抽象模型,定义了XML Schema中每个复杂类型的模式信息,并用非终节点序对集描述XML文档,最后给出了XML模式验证算法,可以有效地验证XML文档的组织结构和内容类型.  相似文献   

18.
基于语义的中文文本关键词提取算法   总被引:1,自引:0,他引:1       下载免费PDF全文
为克服传统关键词提取算法局限于字面匹配、缺乏语义理解的缺点,提出一种基于语义的中文文本关键词提取(SKE)算法。将词语语义特征融入关键词提取过程中,构建词语语义相似度网络并利用居间度密度度量词语语义关键度。实验结果表明,与基于统计特征的关键词提取算法相比,SKE算法提取的关键词能体现文档的主题,更符合人们的感知逻辑,且算法性能较优。  相似文献   

19.
基于子元素排列组合的XML文档信息隐藏   总被引:2,自引:1,他引:1       下载免费PDF全文
分析XML文档的层次结构,提出基于XML子元素排列组合的信息隐藏算法。将待隐藏秘密信息转换成十进制整数,利用子元素的排列组合形成等价元素,根据等价元素与整数间的映射关系,采用等价元素置换方法将整数嵌入XML文档。实验结果和分析表明,该算法不改变XML文件大小,其隐蔽性和鲁棒性优于现有XML文档信息隐藏技术,且信息隐藏量较大,可以应用于XML网页保护和隐秘通信。  相似文献   

20.
K-Means聚类算法的结果质量依赖于初始聚类中心的选择。该文将局部搜索的思想引入K-Means算法,提出一种改进的KMLS算法。该算法对K-Means收敛后的结果使用局部搜索来使其跳出局部极值点,进而再次迭代求优。同时对局部搜索的结果使用K-Means算法使其尽快到达一个局部极值点。理论分析证明了算法的可行性和有效性,而在标准文本集上的文本聚类实验表明,相对于传统的K-Means算法,该算法改进了聚类结果的质量。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号