首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 625 毫秒
1.
本文阐述了前期的技术准备在档案数据库建设中的重要性。介绍了打好数据库建设基础的12个步骤,列出了文本信息标准、描述标准、Web服务标准等各种标准,可供文档数据库建设时参考。  相似文献   

2.
基于网页上下文的Deep Web数据库分类   总被引:6,自引:0,他引:6  
马军  宋玲  韩晓晖  闫泼 《软件学报》2008,19(2):267-274
讨论了提高Deep Web数据库分类准确性的若干新技术,其中包括利用HTML网页的内容文本作为理解数据库内容的上下文和把数据库表的属性标记词归一的过程.其中对网页中的内容文本的发现算法是基于对网页文本块的多种统计特征.而对数据库属性标记词的归一过程是把同义标记词用代表词进行替代的过程.给出了采用分层模糊集合对给定学习实例所发现的领域和语言知识进行表示和基于这些知识对标记词归一化算法.基于上述预处理,给出了计算Deep Web数据库的K-NN(k nearest neighbors)分类算法,其中对数据库之间语义距离计算综合了数据库表之间和含有数据库表的网页的内容文本之间的语义距离.分类实验给出算法对未预处理的网页和经过预处理后的网页在数据库分类精度、查全率和综合F1等测度上的分类结果比较.  相似文献   

3.
传统医院图书馆数据库文本分类是对指定规模文本的分类,无法针对特定用户的浏览内容实施分类。为此,提出基于协同过滤的医院图书馆数据库文本分类优化方法。将用户浏览数据库文本的特征看做物品,构建半自动编码器的协同过滤模型优化用户物品评分矩阵,使用平均评分修正因子、热门物品惩罚因子改进相似度计算。引入注意力机制构建CNN-SVM分类模型,将用户文本浏览特征作为输入,实现文本分类。测试表明,该方法构建评分矩阵的RMSE最低,推荐图书馆文本阅读特征的MAE值最小,在文本分类上F1值达到96.5%,有较好的文本分类效果。  相似文献   

4.
本文阐述了前期的技术准备在档案数据库建设中的重要性.介绍了打好数据库建设基础的12个步骤,列出了文本信息标准、描述标准、Web服务标准等各种标准,可供文档数据库建设时参考.  相似文献   

5.
基于客户/服务器体系结构的PowerBuilder数据库开发平台,能够与Sybase、Oracle和FoxBASE等数据库相连接,其本身也带有Watcom数据库。其中,Oracle和Watcom数据库支持大文本二进制数据类型。大文本和图象在这些数据库应用中进行处理非常方便。而FoxBASE作为PowerBuilder的后台数据库,并不支持大文本二进制数据类型,其提供的Memo备注类型对大文本处理比较繁杂,使用起来很不方便。在实际工作中,大文本是必不可少的。因此,为了解决这一问题,笔者进  相似文献   

6.
本文阐述了前期的技术准备在档案数据库建设中的重要性。介绍了打好数据库建设基础的12个步骤,列出了文本信息标准、描述标准、Web服务标准等各种标准,可供文档数据库建设时参考。  相似文献   

7.
基于XML实现数据库间信息交换的方法   总被引:28,自引:0,他引:28  
徐周  黄上腾 《计算机工程》2001,27(4):177-179
针对传统的基于文本方式的数据库间信息交换方法存在的不足,了基于XML的数据库间信息交换的方法,分析了基于文本方式的不足之处,介绍了实现基于XML的数据库间信息交换的方法的步骤。通过实例说明了基于XML实现数据库间信息交换的方法。  相似文献   

8.
面向中文文本数据库的信息抽取机制   总被引:2,自引:0,他引:2  
中文文本文件的句子中常包含有一些有价值的结构化数据。本文提出了一种针对中文文本结构化信息的抽取机制;抽取文本中的匹配模式,并将抽取后的匹配模式作为匹配模板放入知识库中,作为知识库中的规则。并在此基础上提出了一种面积文本数据库的一种新的信息查询机制:以知识库中的规则作为基础,查询文本数据库中的数据时,先在知识库中找相应的规则(即匹配模板),然后根据匹配模板在相应的文本数据库中查找相应的数据信息。  相似文献   

9.
数据库服务外包是近几年兴起的一种新的数据库应用模式.外包数据库模型中数据的完整性检测是为了防止外包数据库提供商内部和外部人员对数据库内容篡改,保证查询者获得正确查询结果的一种手段.现有的完整性检测方法都是针对关系型数据库中的结构化数据,对于文本这种非结构化数据目前还没有成型的解决方案.为了完善外包数据库模型中数据完整性检测技术,提出了一种基于数字指纹的文本数据的完整性检测方案,该方案不仅可以检测文本数据的完整性,还可以对被篡改数据的位置进行精确定位;提出了两种指纹管理方案,对两种方案的安全性进行了分析;最后通过理论分析和实验验证了该文本数据完整性检测方案的准确性和有效性.  相似文献   

10.
为了能在计算机中实现储油液位和容积的自动换算,本文研究油罐容积表自动识别并导入数据库的方法。在实现过程中,首先对文本形式的油罐容积表扫描,转换成纯文本数据,然后利用VB数据库开发技术编程,将数据导入数据库。该方法可方便地将容积表自动输入数据库,提高了容积表的转换效率。  相似文献   

11.
针对异构数据库之间数据同步缓慢、数据交换格式复杂、数据安全度低等问题,设计了一个基于文本协议的异构数据库数据交换引擎.该引擎设计了基于文本的二进制安全的数据交换协议,通过该协议可以方便地定义程序运行需要的配置信息以及存储变化结果集的格式,并且该协议可以保证存储数据的安全性、数据协议格式解析的高效性以及数据在网络中传输的高效性和安全性.采用该协议实现的数据交换引擎有着设计简单、数据安全度高、整体传输的数据小等优点,从而可以实现快速、高效的数据传输以及快速、高效的数据解析和数据更新等功能.实验数据表明,设计的基于文本协议的异构数据库数据交换引擎可以有效地实现各种数据库之间的数据交换,设计是可行的、有效的.  相似文献   

12.
为了提高Symbian S60数据库中文本数据存储的效率,同时使数据库应用具有良好的响应速度,在研究该类数据库的特点和"字典码"压缩算法的基础上,提出通过提取隐含在"字典码"压缩算法压缩的文件中的字典并独立存储和维护,实现对数据库记录级的文本压缩。该方法只有在用户用到数据库记录数据时,相应记录中被压缩的数据才被解压缩,因此数据库的响应速度快,内存占用也更少,开始运行软件时数据库加载也更快。该方法在数据记录短,文本数据量大的数据库应用中更具有优势。  相似文献   

13.
张立忠  高巍 《计算机工程与设计》2012,33(11):4105-4108,4277
针对非数值型关系数据的水印嵌入及提取问题,提出了一种应用于数据库文本属性的水印方法。利用回车符和换行符在数据库状态及正常数据操作中具有隐蔽性的特点,将它们作为水印信号嵌入到文本数据的秘密位置上。嵌入的水印信号不可见,且不影响文本数据在数据库中的原始外观及语义。水印检测不需要原始数据库和水印,并通过多数表决制将水印信号还原为版权水印图像。实验结果表明,该方法对子集添加、属性添加及其顺序调整攻击具有免疫性。即使数据库遭受约50%的子集修改或删除那样的破坏性攻击时,仍有96%以上的水印匹配率。  相似文献   

14.
本文说明了建立在工程数据库管理系统EDBMS之上的工程数据库查询语言ESQL的功能和实现思想,着重阐述了ESQL如何处理文本、声音、图象等复杂数据类型。最后指出了今后ESQL语言的研究方向。  相似文献   

15.
不规范文本常见于银行报表中,数据库中常见的文本转换形式是用分格符和定长的方式进行转换。但实际的不规范文本长度不一,含义也不尽相同转换很困难。这里,用多种方式,对行特征的进行识别。用不同文本中的处理指令及方式信息,处理文本格式的多样性。采用先生成标准的SQL语句,再执行写数据的工作,最终实现不规范文本的转换。  相似文献   

16.
本文说明了建立在工程数据库管理系统EDBMS之上的工程数据库查询语言ESQL的功能和实现思想,着重阐述了ESQL如何处理文本、声音、图象等复杂数据类型。最后指出了今后ESQL语言的研究方向。  相似文献   

17.
陶波 《软件世界》1995,(5):12-15
在管理信息系统的开发中,最基本的操作是对数据库的操作。目前国内应用的数据库中仍以DBF类的数据库为主流产品。单位自行开发的应用系统中,大多数只能在屏幕上显示一条要操作的记录,上下记录、左右字段的操作很不直观不方便。在FoxBase中虽然提供BROW命令解决这一问题,但由于其窗口大小固定、色彩单一、功能简单,因此人们在实际很少使用它。 笔者在设计某管理信息系统中,模仿文本编辑器  相似文献   

18.
文语转换是中文信息处理中研究的热点,是实现人机语音通信的一项关键技术。文章对实现中文文语转换的整个过程进行了初步分析和研究,给出了基于语音数据库的文语转换方法和实现过程。具体介绍了语音库的建立,分析了文本录入、文本分词、文本正则化、语音标注、韵律处理和语音合成等各个环节处理的内容及技术难点。  相似文献   

19.
金融业务数据库的数据压缩方法   总被引:1,自引:1,他引:0       下载免费PDF全文
贾永洁  王耀强  郑骏 《计算机工程》2008,34(11):281-282
针对金融业务中实时数据库的数据存储特点,提出结构混合压缩(SMC)算法。SMC算法利用金融数据具有纯文本、数据分散和数据项内重复少的特点,以哈夫曼编码作为算法基础,根据词频将单字和词组混合,在哈夫曼树中引入数组结构,对文本数据进行压缩。测试结果表明,SMC算法的平均数据压缩率比原始哈夫曼算法提高了约13%。  相似文献   

20.
大型数据库SYBASE的数据备份,非常重要。用命令方式非常麻烦,为此可利用文本编辑器编辑批处理文件DBCOPY.BAT,自动实现SYBASE数据库的服务器和客户端的数据库备份,DBCOPY.BAT的文件如下:  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号