首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
基于路径学习的信息自动抽取方法   总被引:7,自引:0,他引:7  
针对用户需求的网页信息自动抽取是解决互联网信息爆炸问题的一个有效途径 ,然而现有的信息自动抽取方法均难以同时满足网页信息自动抽取中查全率与查准率高、抽取速度快、抽取信息量大和用户负担轻的要求 .本文提出了一种基于路径学习的信息自动抽取方法 ,并采用该方法编制了一个商品价格信息自动抽取系统 .实验结果表明 ,该方法具有用户负担较轻 (只需用户提供 2~ 4个学习实例 )、查全率 (97.0 4~ 10 0 % )与查准率 (99~ 10 0 % )高、可实现大样本量信息抽取和时间资源耗费少 (抽取时间 <1秒 )等特点 ,能基本满足网页信息自动抽取的要求 .  相似文献   

2.
为高效便捷地获取互联网上发布的真实事件信息,提出了一种无监督的互联网事件抽取框架.该框架利用DOM树模型的平行结构特性对表格页面进行事件抽取,并以表格页面抽取的事件作为种子采总结详情页面的对应模式,进一步使用总结的模式在详情页面中抽取.在大量网站页面中应用该框架,并将抽取结果与常用的包装器生成算法进行比较,结果表明了该...  相似文献   

3.
基于多知识的Web网页信息抽取方法   总被引:9,自引:1,他引:9  
从Web网页中自动抽取所需要的信息内容,是互联网信息智能搜取的一个重要研究课题,为有效解决网页信息抽取所需的信息描述知识获取问题,这里提出了一个种基于多知识的Web网页信息抽取方法(简称MKIE方法)。该方法将网页信息抽取所需的知识分为二类,一类是描绘网页内容本身表示特点,以及识别各网信息对象的确定模式知识,另一类则描述网页信息记录块,以及各网页信息对象的非确定模式知识,MKIE方法根据前一类知识,动态分析获得后一类知识;并利用这两类知识,最终完全从信息内容类似担其表现形式各异的网页中,抽取出所需要的信息,美大学教员论文网页信息抽取实验结果表明,MKIE方法具有较强的网而信息自动识别与抽取能力。  相似文献   

4.
互联网商品信息抽取技术   总被引:1,自引:0,他引:1       下载免费PDF全文
于鲁波  陈超 《计算机工程》2008,34(5):274-276
针对网页信息抽取中格式多样化的问题,提出一种基于路径统计聚类的信息抽取算法。该算法充分利用电子商务网站网页的特点,给出网页统计信息的一般数学表达式,在此基础上,采用基于统计聚类的思想,分割信息块,实现抽取信息。通过对实际电子商务网站网页信息的抽取,证明算法的有效性,分割正确率达92.27%,信息抽取正确率达98.24%。  相似文献   

5.
基于Ontology的视频描述信息抽取系统   总被引:1,自引:1,他引:0  
宫继兵  唐杰 《计算机工程》2009,35(18):34-36
网络视频信息包括视频内容和视频描述信息。鉴于效率问题,网络视频监管主要考虑视频描述信息。结合本体论和成熟的Java字符处理规则,提出基于Ontology的网络视频描述信息抽取方法。建立网络视频领域内的本体模型,自定义启发式抽取规则,并应用Java编程将该方法应用于某部委国家级视频监管项目中。实验结果表明,该方法在抽取的准确率和覆盖率上取得了较好的效果。  相似文献   

6.
Web信息抽取   总被引:14,自引:0,他引:14  
With the tremendous amount of information available on the Web,the ability to quickly obtain information has become a crucial problem.It is not enough for us to acquire information only with Web information retrieval technology.Therefore more and more people pay attention to Web information extraction technology.This paper first introduces some concepts of information extraction technology,then introduces and analyzes several typical Web information extraction methods based on the differences in extraction patterns.  相似文献   

7.
针对现今较流行的动态Web网页数量巨大、数据价值高,并且网页结构高度模板化的特点,设计了一个基于网页聚类的Web信息自动抽取系统。在DOM抽取技术基础上利用网页聚类寻找高相似簇,并引入列相似度和全局自相似度计算方法,提高了聚类结果的准确性。抽取模板中应用了可选节点对模板的修正和调整,以提高内容节点的正确标识。实验结果表明,该方法能够自动寻找并抽取网页主要信息,达到了较高的准确率和查全率。  相似文献   

8.
随着互联网的快速发展,网络中的信息正在爆炸式地增长,网页作为网络中信息表达的方式之一,其结构也变得越来越复杂。而如何精确、高效地从网页中获取目标信息成为一个问题。本文总结现有的针对网页的信息抽取方法并加以分类,同时分析其优缺点,最后对未来的研究内容进行展望。  相似文献   

9.
半结构化网页中多记录信息的自动抽取方法   总被引:1,自引:0,他引:1  
朱明  王庆伟 《计算机仿真》2005,22(12):95-98
从多记录网页中准确的自动抽取出需要的信息,是Web信息处理中的一个重要研究课题。针对现有方法对噪声敏感的缺点,该文提出了基于记录子树的最大相似度发现记录模式的思想,以在同类记录的表现模式存在一定差异的情况下正确识别记录。在此基础上,实现了多记录网页自动抽取系统,该系统可以从多个学术论文检索网站中,自动获取结果网页,并自动抽取其中的记录。对常见论文检索网站的实验表明了该系统具有较好的有效性和准确性。  相似文献   

10.
文章提出一种基于静态网页特征的文本信息抽取方法。该方法首先根据静态网页的URL特征判断其是否是静态网页,然后根据静态网页的结构特征和内容特征对标题和正文文本内容进行抽取.再按照统一规范将结果顺序存储便于再处理。实验结果表明,网页内容信息抽取的查全率和查准率分别为96.2%和95.9%,该方法计算量小、抽取速度快、正确率高,可实际应用于大规模的网页内容安全分析。  相似文献   

11.
视频文本的自动提取方法   总被引:4,自引:0,他引:4  
提出一种基于彩色边缘检测和游程平滑的视频文本提取方法,首先用彩色边缘检测算子检测出图像中的边缘。然后用多次水平和垂直的游程平滑操作使得文字边缘形成连通区域,并去掉部分孤立的噪声,再通过对连通域的分析和分解定位出文本区域的边界,最后对文本区进行确认.实验表明,本文的视频文本自动提取方法具有较高的文本提取率和较准确的边界定位。  相似文献   

12.
新闻视频的场景分段索引及摘要生成   总被引:12,自引:0,他引:12  
姜帆  章毓晋 《计算机学报》2003,26(7):859-865
在提出一种新闻视频检索系统结构的基础上,介绍了基于标题条检测的新闻场景分段索引方法,并阐述了两种新闻摘要的生成策略.该方法利用新闻节目标题条出现的时空位置线索,结合标题关键词的识别,建立起一个层次化的新闻视频索引结构,并帮助用户通过新闻摘要实现不同要求的视频浏览.实验证明该方法有较高的检索成功率,并且简单快捷,为新闻视频检索提供了新的有效途径.  相似文献   

13.
Automatic Video Database Indexing and Retrieval   总被引:17,自引:0,他引:17  
  相似文献   

14.
采用基于Internet的网络技术,应用网络视频摄像机对模拟量视频图像进行数字编码,通过IP网络传输至监控中心储存并实现数字信号转模拟图像上传电视墙实时监控。重点分析网络技术在视频监控系统中的应用及系统结构的设计和功能实现,通过实际项目运用证明基于网络的视频监控技术在现代安防系统的运用中取得显著的效果。  相似文献   

15.
徐利再 《软件》2012,(5):35-37
移动互联网市场上频繁出现视频业务的盗链现象,业务的使用安全极为严峻。本文详细阐述了移动互联网视频业务的盗链情况,深入研究了盗链的规律和技术原理。通过技术分析研究,针对门户访问盗链提出了建立渠道访问白名单的技术方案;针对视频业务使用盗链提出了防篡改、防传播和防破解的技术解决方法。实践证明,相应的技术解决方案有效控制了视频盗链的情况。  相似文献   

16.
视频数据的不断丰富以及人们对视频检索的要求越来越复杂,使得视频语义信息建模和高层语义概念提取逐渐成为视频检索中的重要组成部分.本文提出一种基于本体的视频语义概念检测方法,利用贝叶斯网络构造视频中概念语义关系的检测本体,构建了视频中概念之间的层次关系,并能够通过推理完成复合语义概念的检测.该方法从语义信息学的角度对视频内容进行分析,在一定程度上削弱了语义鸿沟的影响,并且取得了较好的查询结果.  相似文献   

17.
对因特网中某些不良的实时视频通信数据进行监听和还原,是保证网络应用健康发展和打击网络犯罪的一个重要方面.本文介绍了监听和还原因特网中H.264实时视频数据的一种处理方法和处理过程,实现了对被监听的视频通信数据的截获、还原和存储,并可进一步将存储的视频帧提取、转换为图像文件供特定需求使用.实践证明,该方法的处理效率和效果达到了预期目标,对识别因特网中的不良流媒体信息具有较大的实用价值.  相似文献   

18.
在无线Ad Hoc网络上的视频传输要比在其他网络的视频传输更富于挑战性。由于无线Ad Hoc网络中的节点可以用任意方式动态地连接到一起,通过给定的网孔状的拓扑,在网络传输的源端节点和终端节点之间建立起不止一条的多路径是完全可能的。为在多路径传输中结合多条流的编码方式,开发了一种基于率歪曲优化的算法,进而把一条未加工的视频流分成多条流。实验证明,该算法在最大化多路径传输的效率方面是非常有效的。  相似文献   

19.
基于视频页的视频流分割方法   总被引:6,自引:0,他引:6  
提出了基于视频页的视频流分割方法。该方法通过定义视频帧的色彩相近区、光照变化区和色彩变化区,获得视觉内容改变的局部区域,由此进一步确定两帧的视觉内容相似性,从而实现视频页的分割,经与几种有代表性的视频流分割算法的实验比较,证明该检测算法不仅对光照变化的影响具有很高的鲁棒性,而且使得分割能在较高信噪比上进行,明显提高了视频流分割的准确性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号