共查询到11条相似文献,搜索用时 62 毫秒
1.
为实现对数字X光图像进行快速分割,提出一种针对直方图的包络特征进行处理的新方法.该方法采用分水岭算法对数字X光图像的直方图一维信号进行处理.首先计算出图像的直方图,然后对直方图进行形态学滤波,提取出直方图的包络.在此基础上对直方图的包络采用分水岭算法自动提取出最佳阈值.用提取出的阈值进行基于阈值的初步分割,然后进一步采用基于标记的分水岭算法对初步分割的二值图像作进一步分割.通过实验表明,采用该方法可以有效地分割大幅X光图像. 相似文献
2.
基于DOM树的可适应性Web信息抽取 总被引:4,自引:2,他引:4
Web信息抽取通常采用的是一种归纳学习方法,从给定的训练样本网页中学习到抽取规则,这种方法虽然能够准确地抽取出信息,但是当网站的模版发生改变后,必须重新获得抽取规则,因而这种抽取器的维护成本比较高,可适应性差.提出一种新的可适应性Web信息抽取方法,该方法首先通过聚类方法获取商品在网页中频繁出现的关键词组,然后利用网页的DOM树结构来确定包含这些关键词的信息块,从而实现Web信息的自动抽取.对大量商业网站进行信息抽取的实验表明,该算法不仅能有效抽取出商品信息,而且是一种与站点结构无关的可适应性信息抽取方法. 相似文献
3.
网页广告与当前页面内容不匹配使得广告的投放效果降低。本文使用基于站点的贝叶斯模型扩展和基于维基百科的语义扩展两种方法,精确提取网页的标签信息,用更加精确的标签去匹配网络广告,增强了广告效果。本文实现了一个基于语义扩展的网页标签推荐系统,实验证实效果良好。 相似文献
4.
5.
针对网页噪音和网页非结构化信息抽取复杂度高的问题,提出一种基于标签路径聚类的文本信息抽取算法。对网页噪音进行预处理,根据网页的文档对象模型树结构进行标签路径聚类,通过自动训练的阈值和网页分割算法快速判定网页的关键部分,根据数据块中的嵌套结构获取网页文本抽取模板。对不同类型网站的实验结果表明,该算法运行速度快、准确度高。 相似文献
6.
Web信息抽取通常采用的是一种归纳学习方法,从指定的模版网页中归纳到抽取规则,这种方法虽然能够准确地抽取出信息,当网站的模版发生改变后,必须重新获得抽取规则,因而这种抽取器的维护成本比较高,可适应性差。本文针对这一难题,提出一种基于DOM树的可适应性多信息块Web信息抽取,该方法首先通过NekoHtml将网页解析成DOM树,然后确定包含关键词组的信息块,从而实现Web信息抽取。经过大量网站的实验证明该方法适用于不同站点的信息抽取,并且能对多信息块的Web页面进行信息抽取。 相似文献
7.
8.
9.
随着远程教育及多媒体教学的发展,教学活动成为师生与数字环境及媒体相互作用的过程,Flash动画渐渐成为网络上流行的媒体表现形式,在教学和生活中发挥着重要作用。该文基于Flash动画的文件结构,通过分析Flash动画的形成原理,建立了Flash动画内容特征提取平台.为基于内容的Flash动画检索带来新的发展。 相似文献
10.
邵振凯 《计算机技术与发展》2013,(9)
随着互联网的快速发展,Web页面上的信息量已变得非常巨大,面对网页上海量的信息资源,如何快速有效地检索及发现有价值的信息已成为Web研究的一个重要方面。对此提出了一种标签提取方法。利用JTidy将网页优化为格式良好的HTML文档并解析为DOM树,然后用标签提取方法对该DOM树中包含有文本信息内容的叶子节点标签进行提取,把用于控制网页交互性和显示的标签删除掉,并运用基于标点符号的信息提取方法去除版权说明等信息。对不同网站的网页进行抽取实验,结果表明标签提取方法不但通用性强,而且能够准确地提取网页的主题信息。 相似文献
11.
随着远程教育及多媒体教学的发展,教学活动成为师生与数字环境及媒体相互作用的过程,Flash动画渐渐成为网络上流行的媒体表现形式,在教学和生活中发挥着重要作用。该文基于Flash动画的文件结构,通过分析Flash动画的形成原理,建立了Flash动画内容特征提取平台,为基于内容的Flash动画检索带来新的发展。 相似文献