首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
半结构化网页中多记录信息的自动抽取方法   总被引:1,自引:0,他引:1  
朱明  王庆伟 《计算机仿真》2005,22(12):95-98
从多记录网页中准确的自动抽取出需要的信息,是Web信息处理中的一个重要研究课题。针对现有方法对噪声敏感的缺点,该文提出了基于记录子树的最大相似度发现记录模式的思想,以在同类记录的表现模式存在一定差异的情况下正确识别记录。在此基础上,实现了多记录网页自动抽取系统,该系统可以从多个学术论文检索网站中,自动获取结果网页,并自动抽取其中的记录。对常见论文检索网站的实验表明了该系统具有较好的有效性和准确性。  相似文献   

2.
从半结构化或者非结构化的Web文档中提取信息时通常要求指定记录集的边界符,如果不根据记录边界符将包含多记录的页面分成单个记录块,那么记录的提取就不能成功。介绍了一种根据启发式的规则发现Web文档中的记录分隔符的方法,能够很好地解决多记录页面记录分割的问题。  相似文献   

3.
一种针对商品数据记录的自动抽取方法   总被引:2,自引:2,他引:0       下载免费PDF全文
杨舟  卓林  赵朋朋  崔志明 《计算机工程》2010,36(23):262-265
提出一种针对电子商务网站商品列表页数据记录的自动抽取方法。该方法根据商品记录的特点,通过商品记录中商品的文本、图片以及布局等节点类型信息计算节点对应的值,依据节点值的相似度对节点进行分组,再从不同分组中过滤出包含数据记录节点的集合,从而抽取整个页面的数据记录。实验结果证明该方法有效且抽取效率较高。  相似文献   

4.
装备管理工作中有不少病态信息问题与信息集合关系有关,论文通过分析研究其中的三个典型问题:装备管理考评加分问题、装备实力核对问题和上报维修计划问题,定义了三类信息集合:主体信息集合、参照信息集合、目标信息集合,归纳了目标信息集合的四种用途:查多余记录、查缺少记录、查变化记录、查重复记录,形成了信息集合关系分析方法,并制定了检测规则,为有效解决与信息集合关系相关的病态信息问题提供了新思路。  相似文献   

5.
为了满足人们对各类测试和计量仪器数据输出和记录显示等方面的要求,目前工业上常用的一些仪器仪表都配有标准的RS—232C串行通信接口,以支持与外界记录或打印装置的接口,输出人们所要求的各种测试、计量数据的记录报表。由于目前市场上提供的九针并行接口的打印机丰富、价格便宜、功能较强,因此在许多测试、计量场合,往往被用于记录打印数据等。然而,在此存在两个技术问题有待解决:其一是能使带有串行通信接口的测试仪器与并行打印机  相似文献   

6.
陈波  王延章 《计算机工程》2009,35(24):60-62
通过一组成员记录表示实体时,相似记录匹配问题被扩展为记录簇匹配问题。提出2种记录簇匹配模式,应用赋权二部图理论建立记录簇匹配数学模型,设计记录簇上下界匹配算法。快速推导出记录簇匹配阈值的上下界,以减少记录簇子记录最大权的匹配次数。实验结果证明该算法能提高记录簇匹配精度和计算效率。  相似文献   

7.
面对企业中许多信息是难以记录和描述的经验、思想、个人禀赋,研究基于图灵机原理"避重""就轻"管理法,不去记录那些难以记录的思考过程(避重),只记录决策过程中凝结着决策者智慧的各类文档结果(就轻),恰到好处地解决这一难题。  相似文献   

8.
本文介绍了一种新颖的硬盘主引导记录的修复程序。如果主引导记录中的分区信息未被破坏,则该程序可用于各种机型的主引导记录修复工作。如果分区信息被破坏,则该程序只需稍加修改,与机器对应也可使用。  相似文献   

9.
彭邦全  贺鹏 《计算机时代》2002,(11):37-37,45
本文介绍了计算机系统信息(CMOS参数、硬盘主引导记录MBR、DOS引导记录DBR)的备份和恢复方法。  相似文献   

10.
实现了以table标记为信息存贮特点的多记录网页信息的自动抽取工作,该抽取方法从网页信息的存贮特点入手,将有用信息定位于表格中,该抽取方法能够在一个网页中自动查找结构相同或相似的记录模式,并自动分析该记录模式的结构特点从而调用相应的抽取模式(XSLT文档)实现对信息的自动抽取。  相似文献   

11.
公安专网的不断完善和网络系统的不断应用,在网络中绝大部分的网络是用于信息管理,这样就需要对这些信息的应用情况有个了解和把握;还有是由于公安这个行业的特殊性,需要对所查询过的信息进行记录,以备倒查。这个网页信息记录系统所完成的功能就是记录查询过的信息,并用VC和ASP.NET实现了全部功能,现已经应用于公安局,起到了很好的效果。  相似文献   

12.
FreeInternetWindowWasher能够帮助用户快速清除计算机使用记录,包括:缓存文件、Cookies文件、使用者的浏览历史、输入网址、打开文件等记录,甚至WindowsMediaPlayer的播放记录或是压缩软件打开文件记录等,也全都包含在它的清除之列。  相似文献   

13.
由于传统程序人工操作过多,导致出入量记录误差较大,无法满足临床工作需求,提出了心血管病人出入量记录误差控制技术。充分考虑语言使用环境,选择C++作为程序编译语言构造新词素,实现程序的动态编译。根据动态编译结果,集合全部数据,分析出入量记录结构,确定各个结构之间的逻辑关系,改善人工操作方式。以该结构逻辑关系为基础设计误差控制界面,为出入量记录数据与处理提供快捷误差控制界面和必要图表。由实验结果可知,该设计方法成功避免了人工记录出现误差的行为,使程序最高运行效率达到92%,能够满足临床工作需求。  相似文献   

14.
面对企业中许多信息是难以记录和描述的经验、思想、个人禀赋,研究基于图灵机原理“避重”“就轻”管理法,不去记录那些难以记录的思考过程(避重),只记录决策过程中凝结着决策者智慧的各类文档结果(就轻),恰到好处地解决这一难题。  相似文献   

15.
针对某型飞机视频记录系统结构复杂,故障呈现多层次、模糊性的问题,研究了基于神经网络信息融合技术进行故障诊断的方法.并以视频记录系统为对象进行了仿真分析.研究结果表明该方法故障诊断过程相对简单,诊断精度相对较高.能够降低虚警、误报、漏报等情况的发生.  相似文献   

16.
一种基于主动学习的相似记录匹配方法   总被引:1,自引:1,他引:0       下载免费PDF全文
陈波  王延章 《计算机工程》2009,35(3):211-213
针对当前相似记录匹配方法中存在的问题,提出一种改进的机器学习匹配方法。该方法聚类相似记录,生成决策树学习委员会,由学习委员会主动挑选信息量最大的相似记录,由用户标注匹配结果后对学习委员会成员进行训练,自主学习不同数据源问相似记录匹配规则。实际数据的实验分析验证了该方法可以在有效减少训练实例数量的同时获得较高的匹配精度。  相似文献   

17.
姚巍 《电脑学习》1995,(2):43-44
硬盘中除存有大量的用户文件外,还存有硬盘分区表、主引导记录等信息,这些信息的完整与否直接关系到计算机能否正常工作。由于用户的误操作和计算机病毒的入侵,往往导致这些信息的丢失或被破坏,使计算机不能工作。研究硬盘信息的保存和恢复,对保护硬盘减少用户损失意义重大。在MS-DOS或PC-DOS操作系统的管理下,硬盘上的信息按其类型不同分别存放在硬盘上的不同区域。现以CONNE-CP3O44硬盘为例说明如下。主弓l导记录从0柱1面1扇区开始,占有一个扇区共512个字节。硬盘主引导记录的正确与完整是决定计算机能否由硬盘启动并正…  相似文献   

18.
现有的多记录网页抽取方法通常是对文件对象模型( DOM)树进行整体纵向结构分析,计算的结构相似度普遍偏低,使其不能正确识别记录区域。文中提出基于DOM树层次特征的记录抽取方法,该方法利用DOM树不同层次节点的不同作用对其进行横向分析,将寻找相似子树的问题转换为寻找节点块的相似子块,最后采用双向拓展搜索非重叠重复子块进行记录分隔。实验表明该方法能抽取现有抽取器无法处理的页面,多个数据源的抽取结果验证其有效性。  相似文献   

19.
本文对八十年代磁信息存贮技术中有重要影响的成就,例如高能磁粉介质和溅射金属薄膜、垂直记录、磁头及磁光存贮等作了简要的回顾,并对九十年代的技术进展作了粗略的估计和评述。  相似文献   

20.
计算机网络的发展信息折传递更加方便、快捷。在众多的Internet用户中,大部分用户使用的是拨号连接入网方式,通过公用网的用户面临着需要对电信局付费的问题,如何准确地记录用户的上网时间,是所有上网 用户所关心的问题。本文参照现有的拨号软件,提出了一种新的记录计费的方案,通过在国家授时中心取得的标准时间,准确地记录用户的上网时间。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号