共查询到18条相似文献,搜索用时 93 毫秒
1.
文章针对互联网中网页结构多样、易变等因素,通过研究网页结构中存在的一般规律,并结合DOM树和DBSCAN聚类算法,提出了新的Web信息提取算法.并详细介绍了构建DOM树和基于DBSCAN算法的网页内容提取.最后通过实验证明该算法能有效地获取网页中的正文信息,不依赖于网页结构,具有较强的通用性. 相似文献
2.
本文介绍了一种基于DOM文档模型和网页视觉属性的信息过滤方法。通过对网页内容的结构和特点进行分析,把整个网页信息内容拆分成信息块和干扰块两种类型,通过网页解析器把页面转化成DOM模型并对网页干扰信息进行判定,依据页面的视觉属性对DOM模型进行简化,最终实现对DOM模型干扰信息的有效过滤。 相似文献
3.
星载图像编码系统要求图像压缩算法具有一定压缩比、低复杂度的特点,同时希望尽可能减少码流比特错误造成的误码扩散。为了减少误码扩散,提出了一种易于硬件实现、低复杂度、抗误码强的树块数据无损压缩算法。图像数据经过小波变换后,将各级分辨率的系数按照树的结构进行排序,并由若干棵相邻的树构成树集合,称之为树块,每个树块独立进行比特平面编码,产生的码流独立进行打包。结果表明,这种编码方法有较低复杂度,易于硬件实现,能够有效优化,使输出码率达到最短,而且可以有效提高系统的抗误码性能。 相似文献
4.
5.
构建系统发生树是研究物种起源和演化的重要手段.本文基于KEGG(Kyoto Encyclopedia of Genes and Genomes)代谢路径,引入图论的"核"概念,提出一种构建系统发生树的方法.首先解决在无数据丢失前提下,代谢路径数据的提取和表示问题,其次将不同代谢路径的相似度定义为图的核部分与非核部分各自匹配程度的加权之和,利用距离矩阵构建物种间的系统发生树.通过大量试验数据和NCBI(National Center for Biotechnology Information)分类法进行比较,验证了本文方法的有效性. 相似文献
6.
通过对复杂的Web应用需建立恰当的模型可以对系统进行抽象和简化,帮助开发者更好地理解及设计该系统。采用XML格式建立的平台无关模型具有良好的适应性及扩展性,这里通过设计一个建模平台,以JSP页面为交互界面获取复杂Web应用的功能需求;采用面向Java的XML解析技术输出该Web应用的平台无关模型信息;采用增量式开发方法能够对不同开发阶段的模型信息进行合理有效的管理,并最终引导代码开发人员建立符合复杂Web应用功能需求的系统模型。实验证明,采用这种建模方法能快速有效地建立Web应用的平台无关模型。 相似文献
7.
8.
多标签分类已在很多领域得到了实际应用,所用标签大多具有很强的关联性,甚至存在非完备标签或部分标签遗失。然而,现有的多标签分类算法难以同时处理这两种情况。基于此,提出一种新的概率模型处理方法,实现同时对具有标签关联性和遗失标签情况进行多标签分类。该方法可以自动获知和掌握多标签的关联性。此外,通过整合遗失的标签信息,该方法能够提供一个自适应策略来处理遗失的标签。在完备标签和非完备标签的数据上进行实验,结果表明,与现有的多标签分类算法相比,提出的方法得到了较好的分类预测评价值。 相似文献
9.
结构力导致体系整体的作战能力超过了组成要素各自作战能力之和,而节点间的信息交互关系是形成体系结构力的主要因素。因此信息节点交互关系研究是体系作战能力研究的重要内容。针对体系节点间如何选择信息交互路径的问题开展研究,采用有向图模型来描述体系节点的信息交互关系,利用体系有向图模型的生成树描述节点间的交互路径。首先分析了体系节点间信息交互的两种优化策略,即节点负载均衡和链路负载均衡,两种策略分别适用于不同的作战条件。其次,对应上述优化策略,提出了基于最小和最大秩生成树的体系节点信息交互路径优化方法,给出了穷举生成树的算法。最后给出的算例说明了方法的有效性。 相似文献
10.
提出了一种非均匀行采集的路径识别算法.在图像采集中,采用非均匀行采集实现了图像畸变矫正;在图像处理中,根据摄像头采集时序,时图像进行横向滤波、阈值分割、边缘检测、纵向滤波和导航参数提取等.该算法合理安排程序流程,提高了图像处理和车体控制的实时性.实验结果表明,此方法能够有效降低噪声干扰和图像畸变对参数提取的影响,提取出精确的引导线导航参数. 相似文献
11.
12.
密文图像的可逆数据隐藏技术既能保证载体内容不被泄露,又能传递附加信息。本文提出了一种基于块容量标签(block capacity label, BCL)的高容量密文图像可逆数据隐藏算法。该方案在图像加密之前进行预处理,首先将图像分为两个区域:参考像素区域和预测像素区域。然后将预测像素区域分为不重叠的块,根据所提出的算法确定分块的BCL,在对图像进行加密之后嵌入BCL,生成加密图像;在秘密数据嵌入阶段,根据BCL和数据隐藏密钥嵌入秘密数据。实验测试了BOWS-2数据集,平均嵌入容量为3.806 8 bpp,与现有方法相比,该方法可以获得更高的秘密数据嵌入容量,并可以实现原始图像的完美重建。 相似文献
13.
网页信息抽取方法的研究 总被引:2,自引:0,他引:2
信息抽取技术属于人工智能的一个分支.使用信息抽取技术可以人性化地从网页中把人们需要的信息抽取出来.文中提出的信息抽取技术是基于DOM和网页模板的一种归纳网页模板的新方法,它能很好地对各种布局元素的网页进行模板归纳,同时给出核心算法的C++实现. 相似文献
14.
随着互联网技术的迅速发展,网上文本数量成指数级增长,如何有效地提取出所需干言息成为当前重要的研究课题。首先介绍文本信息检索的研究背景和现状,并讨论信息检索模型和目前广泛使用的文本信息检索算法,然后阐述通用信息检索系统和个性化信息检索系统以及目前的研究状况。最后,基于现存的问题提出了未来的工作。 相似文献
15.
提出一种基于最短路径树的节点删除动态路由算法。算法建立一个最短路径树更新集合,该集合包括被删除节点的断裂子树所有节点和其它节点连接的边,利用子树的结构信息,对子树节点的直系子孙节点和祖先节点进行更新,采用Dijkstra算法对其它子树节点进行更新。实验结果表明,该算法能有效减少节点更新计算次数。 相似文献
16.
综述了基于Web的数学信息表示的已有方法,并提出了基于SVG的数学信息描述模型解决Web数学信息表示问题.该模型采用面向对象的方法来描述,主要包括类结构、图元描述模型和文档解析模型. 相似文献
17.
为了给用户提供有效信息,能够根据用户的需要对Internet上的网页信息进行获取和过滤,设计了一个基于XML的Web信息筛选器。系统利用了XML作为中间数据的数据交换技术将Microsoft.NET技术、数据库技术与XML技术相结合设计并实现Web服务程序。采用在Web服务和客户端应用程序之间使用基于XML的存储和访问技术进行数据交换与处理的实现方法,构建了一个基于XML的Web服务,进行解析并过滤多余的信息,将解析后有用的信息结果返回给请求数据的客户端,实现为用户提供特定信息的服务。 相似文献
18.
为提高教育信息化建设水平,加快教育现代化的进程,通过对教育信息化建设与应用现状分析,阐述了目前在教育信息化建设方面所面临的问题,实现了一种基于Web的教育信息化平台。与传统的教育网站相比,该方案综合资源平台,结合学校、教师、学生、家长等受众群体,重点研究了教育信息化建设网"门户内容管理平台"功能需求、方案的总体结构、系... 相似文献