共查询到20条相似文献,搜索用时 31 毫秒
1.
半结构化网页中多记录信息的自动抽取方法 总被引:1,自引:0,他引:1
从多记录网页中准确的自动抽取出需要的信息,是Web信息处理中的一个重要研究课题。针对现有方法对噪声敏感的缺点,该文提出了基于记录子树的最大相似度发现记录模式的思想,以在同类记录的表现模式存在一定差异的情况下正确识别记录。在此基础上,实现了多记录网页自动抽取系统,该系统可以从多个学术论文检索网站中,自动获取结果网页,并自动抽取其中的记录。对常见论文检索网站的实验表明了该系统具有较好的有效性和准确性。 相似文献
2.
从半结构化或者非结构化的Web文档中提取信息时通常要求指定记录集的边界符,如果不根据记录边界符将包含多记录的页面分成单个记录块,那么记录的提取就不能成功。介绍了一种根据启发式的规则发现Web文档中的记录分隔符的方法,能够很好地解决多记录页面记录分割的问题。 相似文献
3.
4.
装备管理工作中有不少病态信息问题与信息集合关系有关,论文通过分析研究其中的三个典型问题:装备管理考评加分问题、装备实力核对问题和上报维修计划问题,定义了三类信息集合:主体信息集合、参照信息集合、目标信息集合,归纳了目标信息集合的四种用途:查多余记录、查缺少记录、查变化记录、查重复记录,形成了信息集合关系分析方法,并制定了检测规则,为有效解决与信息集合关系相关的病态信息问题提供了新思路。 相似文献
5.
为了满足人们对各类测试和计量仪器数据输出和记录显示等方面的要求,目前工业上常用的一些仪器仪表都配有标准的RS—232C串行通信接口,以支持与外界记录或打印装置的接口,输出人们所要求的各种测试、计量数据的记录报表。由于目前市场上提供的九针并行接口的打印机丰富、价格便宜、功能较强,因此在许多测试、计量场合,往往被用于记录打印数据等。然而,在此存在两个技术问题有待解决:其一是能使带有串行通信接口的测试仪器与并行打印机 相似文献
6.
7.
面对企业中许多信息是难以记录和描述的经验、思想、个人禀赋,研究基于图灵机原理"避重""就轻"管理法,不去记录那些难以记录的思考过程(避重),只记录决策过程中凝结着决策者智慧的各类文档结果(就轻),恰到好处地解决这一难题。 相似文献
8.
孟祥龙 《数字社区&智能家居》1994,(2)
本文介绍了一种新颖的硬盘主引导记录的修复程序。如果主引导记录中的分区信息未被破坏,则该程序可用于各种机型的主引导记录修复工作。如果分区信息被破坏,则该程序只需稍加修改,与机器对应也可使用。 相似文献
9.
本文介绍了计算机系统信息(CMOS参数、硬盘主引导记录MBR、DOS引导记录DBR)的备份和恢复方法。 相似文献
10.
火善栋 《数字社区&智能家居》2009,(9)
实现了以table标记为信息存贮特点的多记录网页信息的自动抽取工作,该抽取方法从网页信息的存贮特点入手,将有用信息定位于表格中,该抽取方法能够在一个网页中自动查找结构相同或相似的记录模式,并自动分析该记录模式的结构特点从而调用相应的抽取模式(XSLT文档)实现对信息的自动抽取。 相似文献
11.
公安专网的不断完善和网络系统的不断应用,在网络中绝大部分的网络是用于信息管理,这样就需要对这些信息的应用情况有个了解和把握;还有是由于公安这个行业的特殊性,需要对所查询过的信息进行记录,以备倒查。这个网页信息记录系统所完成的功能就是记录查询过的信息,并用VC和ASP.NET实现了全部功能,现已经应用于公安局,起到了很好的效果。 相似文献
12.
《数字社区&智能家居》2007,(5):19-19
FreeInternetWindowWasher能够帮助用户快速清除计算机使用记录,包括:缓存文件、Cookies文件、使用者的浏览历史、输入网址、打开文件等记录,甚至WindowsMediaPlayer的播放记录或是压缩软件打开文件记录等,也全都包含在它的清除之列。 相似文献
13.
由于传统程序人工操作过多,导致出入量记录误差较大,无法满足临床工作需求,提出了心血管病人出入量记录误差控制技术。充分考虑语言使用环境,选择C++作为程序编译语言构造新词素,实现程序的动态编译。根据动态编译结果,集合全部数据,分析出入量记录结构,确定各个结构之间的逻辑关系,改善人工操作方式。以该结构逻辑关系为基础设计误差控制界面,为出入量记录数据与处理提供快捷误差控制界面和必要图表。由实验结果可知,该设计方法成功避免了人工记录出现误差的行为,使程序最高运行效率达到92%,能够满足临床工作需求。 相似文献
14.
于华飞 《电脑与微电子技术》2011,(13):11-14
面对企业中许多信息是难以记录和描述的经验、思想、个人禀赋,研究基于图灵机原理“避重”“就轻”管理法,不去记录那些难以记录的思考过程(避重),只记录决策过程中凝结着决策者智慧的各类文档结果(就轻),恰到好处地解决这一难题。 相似文献
15.
16.
17.
硬盘中除存有大量的用户文件外,还存有硬盘分区表、主引导记录等信息,这些信息的完整与否直接关系到计算机能否正常工作。由于用户的误操作和计算机病毒的入侵,往往导致这些信息的丢失或被破坏,使计算机不能工作。研究硬盘信息的保存和恢复,对保护硬盘减少用户损失意义重大。在MS-DOS或PC-DOS操作系统的管理下,硬盘上的信息按其类型不同分别存放在硬盘上的不同区域。现以CONNE-CP3O44硬盘为例说明如下。主弓l导记录从0柱1面1扇区开始,占有一个扇区共512个字节。硬盘主引导记录的正确与完整是决定计算机能否由硬盘启动并正… 相似文献
18.
现有的多记录网页抽取方法通常是对文件对象模型( DOM)树进行整体纵向结构分析,计算的结构相似度普遍偏低,使其不能正确识别记录区域。文中提出基于DOM树层次特征的记录抽取方法,该方法利用DOM树不同层次节点的不同作用对其进行横向分析,将寻找相似子树的问题转换为寻找节点块的相似子块,最后采用双向拓展搜索非重叠重复子块进行记录分隔。实验表明该方法能抽取现有抽取器无法处理的页面,多个数据源的抽取结果验证其有效性。 相似文献
19.
本文对八十年代磁信息存贮技术中有重要影响的成就,例如高能磁粉介质和溅射金属薄膜、垂直记录、磁头及磁光存贮等作了简要的回顾,并对九十年代的技术进展作了粗略的估计和评述。 相似文献
20.
计算机网络的发展信息折传递更加方便、快捷。在众多的Internet用户中,大部分用户使用的是拨号连接入网方式,通过公用网的用户面临着需要对电信局付费的问题,如何准确地记录用户的上网时间,是所有上网 用户所关心的问题。本文参照现有的拨号软件,提出了一种新的记录计费的方案,通过在国家授时中心取得的标准时间,准确地记录用户的上网时间。 相似文献