首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
本文针对数据库访问技术中数据库字段的几种常见类型:文本。数字、日期、货币、是/否, 探讨并总结了记录和窗体文本间类型转换的基本方法。  相似文献   

2.
文语转换是中文信息处理中研究的热点,是实现人机语音通信的一项关键技术。文章对实现中文文语转换的整个过程进行了初步分析和研究,给出了基于语音数据库的文语转换方法和实现过程。具体介绍了语音库的建立,分析了文本录入、文本分词、文本正则化、语音标注、韵律处理和语音合成等各个环节处理的内容及技术难点。  相似文献   

3.
文中首先通过语言学特征表来对文本信息进行结构化处理,同时实现了对远距离约束的表示;然后借助于面向个体的数据泛化算法来去除语言学特征表中的冗余信息,并利用规则抽取算法过滤特征表中不一致的部分,从而为相应的自然语言处理任务建立了一个一致、高效的规则库。最后,本文研究了模型在汉语词义排歧以及音字转换中的应用,在采用了动态规则平滑算法后,分别获得了0.93和0.95的判别精度以及0.92和0.89的覆盖率,这一结果显示模型具有很高的实用性。  相似文献   

4.
不规范文本常见于银行报表中,数据库中常见的文本转换形式是用分格符和定长的方式进行转换。但实际的不规范文本长度不一,含义也不尽相同转换很困难。这里,用多种方式,对行特征的进行识别。用不同文本中的处理指令及方式信息,处理文本格式的多样性。采用先生成标准的SQL语句,再执行写数据的工作,最终实现不规范文本的转换。  相似文献   

5.
通过对两种传统的CAD数据到GIS数据转换方法的系统研究,分析了转换过程中存在的信息丢失等问题。基于空间数据关联规则挖掘思想,从问题着手,设计了一种全新的CAD的文本数据到GIS的点层数据的转换方案与挖掘算法。最后,以一个实际的例子,实现了对CAD的文本数据的空间关联规则挖掘,提取文本的坐标信息和属性信息,建立GIS空间数据库,并对转换的几何精度和属性精度进行了评价。  相似文献   

6.
大规模文本计算机音字相互转换技术的研究   总被引:2,自引:1,他引:2  
文中介绍了一种利用马尔可夫统计文法和自然语言理解技术相结合的计算语言模型进行汉语音节到汉字的机器自动相互转换技术.该技术集成了统计文法和句法分析方法各自的优点,可以实用于计算机大规模真实文本的音字相互转换,并且具有处理语言深度递归现象和远距离约束关系的能力.其音字转换算法已被应用到大词表非特定人孤立词语音识别系统和中文WIN-DOWS95、WINDOWSNT4.0的智能语句输入法上.  相似文献   

7.
结合多媒体网络自主学习平台的开发,分析了Oracle interMeida技术框架及工作原理,提出了基于Web的非结构化数据在数据库内的便捷管理方法,实现了图像、音视频数据在媒体数据库中的快速存取管理,该方法在基于内容的文本、图像检索方面具有广泛的应用前景。  相似文献   

8.
基于转移的音字转换纠错规则获取技术   总被引:4,自引:1,他引:3  
文中描述了一种在音字转换系统中从规模不限的在线文本中自动获取纠错规则的机器学习技术。该技术从音字转换结果中自动获取误转换结果及其相应的上下文信息,从而生成转移规则集。该转移规则集应用于音字转换的后处理模块,使音字转换系统率进一步提高,并使系统具备了很强的灵活性和可扩展性。  相似文献   

9.
分析了数据仓库中数据填充存在的问题,为了保持数据仓库数据的全面性、完整性和数据仓库的质量,提出了一种多数据源的数据填充方案,并介绍了这种填充方案的结构和各模块的功能,具体讨论了同质和异质数据库数据源的数据转换模式,对于非数据库数据源,给出了从文本数据源和Web页面数据源获取数据的填充方法。  相似文献   

10.
用XML在Word文档表格中转换非结构化数据   总被引:1,自引:0,他引:1  
非结构化数据广泛存在于各种应用系统中,对非结构化数据进行管理以及通过转换成为结构化数据是非常重要的.XML语言非常适合用于数据存储与数据交换.本文使用Microsoft visual Studio 2005开发了基于XML的非结构化数据转换工具.该工具可以把Microsoft word表格中的文本数据转换成可以导入到数据库中的纯文本数据文件.使用该工具,可以完成类似的非结构化数据的转换工作.  相似文献   

11.
本文讨论我们设计并实现的地图数据库管理系统MDB的体系结构、数据模型、数据类型及其实现技术。  相似文献   

12.
作战数据库文件与记录的文本格式涉及到作战文书的自动生成,文本分类直接关系到情报信息检索效率及准确性。针对军事情报信息的特点,建立了一个基于情报数据库的文本分类模型,然后分析了模型中的文本表示、自动分词、特征提取关键技术,并对互信息特征选取方法提出了改进措施。应用表明,该文本分类模型可有效地从文字信息中分离出规范化的情报要点,不仅辅助作战决策,而且能直接写入数据库。  相似文献   

13.
《计算机与网络》2010,(7):18-18
将Access数据库转换成其他文件格式 Office Access 2007使用新的文件格式,该文件格式支持一些新功能(如多值查阅字段、使用格式文本以及附件).  相似文献   

14.
作战数据库文件与记录的文本格式涉及到作战文书的自动生成,文本分类直接关系到情报信息检索效率及准确性。针对军事情报信息的特点,建立了一个基于情报数据库的文本分类模型,然后分析了模型中的文本表示、自动分词、特征提取关键技术,并对互信息特征选取方法提出了改进措施。应用表明,该文本分类模型可有效地从文字信息中分离出规范化的情报要点,不仅辅助作战决策,而且能直接写入数据库。  相似文献   

15.
基于网页上下文的Deep Web数据库分类   总被引:6,自引:0,他引:6  
马军  宋玲  韩晓晖  闫泼 《软件学报》2008,19(2):267-274
讨论了提高Deep Web数据库分类准确性的若干新技术,其中包括利用HTML网页的内容文本作为理解数据库内容的上下文和把数据库表的属性标记词归一的过程.其中对网页中的内容文本的发现算法是基于对网页文本块的多种统计特征.而对数据库属性标记词的归一过程是把同义标记词用代表词进行替代的过程.给出了采用分层模糊集合对给定学习实例所发现的领域和语言知识进行表示和基于这些知识对标记词归一化算法.基于上述预处理,给出了计算Deep Web数据库的K-NN(k nearest neighbors)分类算法,其中对数据库之间语义距离计算综合了数据库表之间和含有数据库表的网页的内容文本之间的语义距离.分类实验给出算法对未预处理的网页和经过预处理后的网页在数据库分类精度、查全率和综合F1等测度上的分类结果比较.  相似文献   

16.
基于客户/服务器体系结构的PowerBuilder数据库开发平台,能够与Sybase、Oracle和FoxBASE等数据库相连接,其本身也带有Watcom数据库。其中,Oracle和Watcom数据库支持大文本二进制数据类型。大文本和图象在这些数据库应用中进行处理非常方便。而FoxBASE作为PowerBuilder的后台数据库,并不支持大文本二进制数据类型,其提供的Memo备注类型对大文本处理比较繁杂,使用起来很不方便。在实际工作中,大文本是必不可少的。因此,为了解决这一问题,笔者进  相似文献   

17.
刘西瑜 《微机发展》1995,5(3):29-30
由不同字处理软件所编排的文本的差异给用户带来了麻烦,为了解决这一问题,作者在本文中提出了把这些不同文本转换成一般文本的方法,并给出了一个华光文本转换成一般文本的程序。  相似文献   

18.
数据库服务外包是近几年兴起的一种新的数据库应用模式.外包数据库模型中数据的完整性检测是为了防止外包数据库提供商内部和外部人员对数据库内容篡改,保证查询者获得正确查询结果的一种手段.现有的完整性检测方法都是针对关系型数据库中的结构化数据,对于文本这种非结构化数据目前还没有成型的解决方案.为了完善外包数据库模型中数据完整性检测技术,提出了一种基于数字指纹的文本数据的完整性检测方案,该方案不仅可以检测文本数据的完整性,还可以对被篡改数据的位置进行精确定位;提出了两种指纹管理方案,对两种方案的安全性进行了分析;最后通过理论分析和实验验证了该文本数据完整性检测方案的准确性和有效性.  相似文献   

19.
音字转换中的机器学习研究   总被引:6,自引:2,他引:6  
本文提出了音字转换学习系统的模型,给出了它所采用的三种机器学习形式:单词学习,规则学习,参数修正学习、单词以及规则的自动获取用于确定的推理机制,而非确定规则的自动获取以及可信度函数的自适应调整主要用于概率推理上,基于上述学习机制所进行的数万字的学习实验结果表明,机器学习在改进音字转换的系统性能(如正确率、通用性等)上,具有相当好的效果,目前已经在语句级声音输入、键盘输入等汉字系统上实用。  相似文献   

20.
语句拼音-汉字转换的智能处理机制分析   总被引:4,自引:4,他引:4  
语句拼音- 汉字转换是中文信息处理研究的一个重要方面,是键盘汉字输入和语音输入的核心技术,其主要特征是对动态输入的拼音串进行词法分析,给出所有可能的汉语句子,然后对这些汉语句子根据上下文环境进行句法分析和语义分析,动态调整句子中的字词,输出最佳结果。近年来,语句拼音- 汉字转换系统大量应用了人工智能技术和机器翻译的理论,以期提高系统转换的准确率和增强系统的智能处理功能。本文分析了语句拼音- 汉字转换系统所采用的核心技术,即知识支持、自动分词和动态调整等,讨论了语句拼音- 汉字转换的处理方法和过程,知识库的组成结构,用于拼音串自动分词的算法和实现,音字转换中动态调整的概率模型等,本文还分析了现有语句拼音- 汉字转换系统在拼音串自动分词和音字转换的动态调整中发生错误的原因,并提出了改进方法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号