首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
语料标注是语料库构建的一项重要的基础性工作。基于搜狗日志,该文借助XML文档的结构化特点,将语料标注转换成节点属性的改写,根据语料的特点,制定了一套服务于搜索引擎用短语词典构建的短语语料标注加工规范及执行原则,并对标注集及加工规范进行了详细描述。利用此规范,已完成145 645条查询词串的标注,而且标注质量很高。  相似文献   

2.
周敏  万频  黄锴  谷刚  詹宜巨 《微计算机信息》2006,22(36):211-213
提出了一个基于移动Agent的智能楼宇异构数据库集成的框架,通过将数据库记录转换成XML文档形式,以及用Java语言和Aglet平台对移动Agent的设计,为智能楼宇异构数据库的集成提供了一种新方法。  相似文献   

3.
基于XML的信息集成研究   总被引:1,自引:0,他引:1  
基于可扩展标记语言(extensible markup language,XML)的Web服务作为一种新型的信息集成架构已经受到来自数据库领域和软件工程领域的广泛关注.服务的整个构建、描述、发布、发现、数据传输过程都是以XML为基础的.在分析了XML的特性的基础上,提出将服务组合、调用的接口处理问题转换成XML数据的处理问题,将服务传送的异构数据、参数的处理转换成XML消息的处理.在此基础上,提出了基于XML的异构信息集成方案.该方案将异构数据库数据以及接口处理信息转换成XML文档,按照通用的XML文档的格式来访问异构系统服务,集成系统服务,并可以通过XML文档的加密/解密来保证系统内部数据的安全性.最后还分析了基于XML的信息集成方案的实现.  相似文献   

4.
余露 《微计算机应用》2002,23(4):231-234
本文介绍了一种利用Microsoft VisualC 工具开发的科技论文文档解析转换器的设计与实现,利用中文信息处理方法,该解析器可以快速将科技论文HTML文档转换成符合科技论文DTD规范的XML文档,实现文档从格式标注向语义标注的自动转换,从而方便科技论文的语义查询和统计。  相似文献   

5.
针对SQL Server数据库技能测评系统缺乏的现状,分析了现有逻辑形式化自动阅卷技术,提出了基于XML实现SQL Server数据库技能操作自动阅卷方案。介绍了自动阅卷的实现原理和流程,重点阐述了两个关键技术环节:XML形式化表达和XML形式化自动阅卷技术。阅卷效果表明,基于XML的SQL Server数据库技能操作自动阅卷是切实可行的。  相似文献   

6.
通过对现有异构数据库间数据交换方法进行系统分析,提出了以XML作为交换中间件来实现异构数据库闻数据交换的新方法.其中,重点分析了XML技术和XML与关系数据库之间的映射,并通过一个实例阐述了利用XML和DOM技术,通过数据库模式之间的模板映射,实现异构数据库之间数据交换的具体实现方法.  相似文献   

7.
通过对现有异构数据库间数据交换方法进行系统分析,提出了以XML作为交换中间件来实现异构数据库间数据交换的新方法。其中,重点分析了XML技术和XML与关系数据库之间的映射,并通过一个实例阐述了利用XML和DOM技术,通过数据库模式之间的模板映射,实现异构数据库之间数据交换的具体实现方法。  相似文献   

8.
分析了报务系统数据库记录备份与分发的需要,设计了报务系统数据分发功能模块,介绍了系统总体架构,提出了将数据库中的报务数据转换成适合在网络上传输的XML文件的设计,利用TCP/IP协议和套接字建立了基于客户端/服务器架构的网络通信模块,实现了数据分发的功能,重点分析了基于XML的数据处理过程和实现数据分发的网络通信架构.实验结果表明,该模块可以方便将报务数据在数据库表与XML文件相互转换.  相似文献   

9.
本文主要分为三个方面:语义词典的构建,词语标注的数据结构和数据库语义的标注与排歧算法.其中词典用来存储数据库的语义信息,通过程序调用以标注分词后的词语;词语标注的数据结构采用了动态的方式存储数据库语义,可节省内存空间并增强程序的可读性;对于数据库的歧义问题提出了一种利用相关词的语义确定歧义词的语义的方法,充分利用了词语之问的相互关系.  相似文献   

10.
本文介绍了如何由ASP从数据库中将查询结果转换成XML文件,然后利用数据岛实现分页显示。  相似文献   

11.
逐字分词法是以汉语词典为基础对中文语句通过匹配进行切分的方法。该方法在分词中无法解决交叉歧义与组合歧义带来的问题。本文以词典分词为基础,从序列标注的角度,在逐字匹配过程中使用CRFs标注模型提供辅助决策,由此来处理歧义问题。经实验和分析,该方法较传统的CRFs模型分词法和词典分词,更适合对分词速率及正确率都有一定要求的系统。  相似文献   

12.
该文通过借鉴中文及英文情感分析中基于极性词典的方法来对藏文句子文本进行情感分析。首先我们通过人工的方法构建了一个全面、高效的极性词典,包括基础词词典、否定词词典、双重否定词词典、程度副词词典以及转折词词典,将极性词与修饰词组合成极性短语作为极性计算的基本单元,并研究了转折词对句子情感极性的影响,提出了一种基于极性词典的藏语文本句子情感分析方法。实验结果表明,利用该文构建的词典进行的倾向性分析效果良好。  相似文献   

13.
稀疏编码中的字典学习在稀疏表示的图像识别中扮演着重要的作用。由于Gabor特征对表情、光照和姿态等变化具有一定的鲁棒性,提出一种基于Gabor特征和支持向量引导字典学习(GSVGDL)的稀疏表示人脸识别算法。先提取图像的Gabor特征,然后用增广Gabor特征矩阵来构造初始字典。字典学习模型中综合了重构误差项、判别项和正则化项,判别项公式化定义为所有编码向量对平方距离的加权总和;通过字典学习同时得到字典原子与类别标签相对应的结构化字典和线性分类器。该字典学习方法能够自适应地为不同的编码向量对分配不同的权值,提高了字典的判别性能。实验结果表明该方法具有很好的识别精度和较高的识别效率。  相似文献   

14.
介绍了11世纪中国突厥语言学著作"突厥语大词典"的电子词典软件的设计与实现。突厥语大辞典的电子版是突厥语大辞典的维、土、汉、英版本的基础上研究了多语种(维吾尔语、土耳其语、汉语、英语)突厥语大辞典电子版的构建技术。实现了具有通过原词或原词在以上四种不同语言中的词义来快速查找的功能。详细介绍了本词典的总体结构、功能、数据库设计、查找算法、系统运行机制。最后提出了进一步增强、改进系统的一些设想。  相似文献   

15.
Dictionary learning is crucially important for sparse representation of signals. Most existing methods are based on the so called synthesis model, in which the dictionary is column redundant. This paper addresses the dictionary learning and sparse representation with the so-called analysis model. In this model, the analysis dictionary multiplying the signal can lead to a sparse outcome. Though it has been studied in the literature, there is still not an investigation in the context of dictionary learning for nonnegative signal representation, while the algorithms designed for general signal are found not sufficient when applied to the nonnegative signals. In this paper, for a more efficient dictionary learning, we propose a novel cost function that is termed as the summation of blocked determinants measure of sparseness (SBDMS). Based on this measure, a new analysis sparse model is derived, and an iterative sparseness maximization scheme is proposed to solve this model. In the scheme, the analysis sparse representation problem can be cast into row-to-row optimizations with respect to the analysis dictionary, and then the quadratic programming (QP) technique is used to optimize each row. Therefore, we present an algorithm for the dictionary learning and sparse representation for nonnegative signals. Numerical experiments on recovery of analysis dictionary show the effectiveness of the proposed method.  相似文献   

16.
语义知识资源蕴含了深刻的语言学理论,是语言学知识和语言工程的重要接口。该文以形容词句法语义词典为研究对象,探索对语义知识资源自动扩展的方法。该文的目标是利用大规模语料库,扩展原有词典的词表及其对应的句法格式。具体方法是根据词的句法格式将词典的词分类,将待扩展的新词通过分类器映射到原有词典的词中,以此把词典扩展问题转化为多类分类问题。依据的原理是词典词和待扩展新词在大规模语料中句法结构的相似性。该文通过远监督的方法构造训练数据,避免大量的人工标注。训练过程结合了浅层机器学习方法和深度神经网络,取得了有意义的成果。实验结果显示,深度神经网络能够习得句法结构信息,有效提升匹配的准确率。  相似文献   

17.
介绍了11世纪中国突厥语言学著作“突厥语大词典”的电子词典软件的设计与实现。突厥语大辞典的电子版是突厥语大辞典的维、土、汉、英版本的基础上研究了多语种(维吾尔语、土耳其语、汉语、英语)突厥语大辞典电子版的构建技术。实现了具有通过原词或原词在以上四种不同语言中的词义来快速查找的功能。详细介绍了本词典的总体结构、功能、数据库设计、查找算法、系统运行机制。最后提出了进一步增强、改进系统的一些设想。  相似文献   

18.
针对人脸识别中的图像存在噪声等情况,提出基于鉴别性低秩表示及字典学习的算法。使用鉴别性低秩子空间恢复算法(discriminative low-rank representation, DLRR)获得类别间尽可能独立且干净的训练样本,然后通过引入基于Fisher准则的字典学习(Fisher Discrimination Dictionary Learning, FDDL)方法得到结构化字典,其子字典对对应的类有较好的表示能力,约束编码系数具有较小类内散列度和较大类间散列度。最后对测试样本稀疏线性表示时正确类别的样本贡献更大。在标准人脸数据库上的实验结果表明该算法有较好性能。  相似文献   

19.
后缀树的重要性可以为多年来学术界对它总是有新的发现而印证.它的结构简单,但可以在线性的时间里解决许多复杂的问题,被大量的使用在字符串及树的模式匹配中,对于XML标准,有很多基于关系库和对象库的索引技术和查询方案被提出来,我们试图给出一种基于后缀树进行路径导航的查询机制:用后缀树构造XML路径字典加速路径查询评价速度,我们提出可以在线地建立一个trie树的后缀树,讨论了XML路径字典中的后缀树建树算法,阐述了整个索引方案和查询机制,并探讨了包括RPE在内的它所支持的各种查询操作,XML路径字典被用于加快路径查询的评价速度.  相似文献   

20.
Sparse representation and Dictionary learning have attracted a lot of research attention in the last couple of decades and have provided state of the art results in many fields such as denoising, classification, inpainting and compression. However, applying general dictionary learning such as Method of Optimal Directions and Recursive Least Squares Dictionary Learning Algorithm can be computationally expensive, due to the large amount of free variables to be learned. Also sometimes the signal class has obvious repetitive structure which could benefit from a structured dictionary. One way to deal with these shortcomings is to impose a structure on the dictionary itself, for example the dictionary can be sparse or the atoms can be shift-invariant. In practice, imposing a structure means limiting the number of free variables. There are many examples of structured dictionaries such as double sparsity model or shift-invariant dictionaries. We have recently proposed a closed form solution to impose arbitrary structures onto a dictionary, called Flexible Structure Dictionary Learning. In this paper, we use this method to impose shift-invariant structure when training a dictionary. This structure allows us to not only simplify the original solution and make it computationally feasible to be used for large signals but also extend the concept of shift-invariance to include variable sized shifts in different atoms. The proposed dictionary update step finds all the free variables in all the atoms jointly, whereas some shift-invariant structured dictionaries in the recent literature, update one atom at a time. We have compared our proposed method with a general dictionary learning method and another shift-invariant method. Results show that signal approximation can be a promising application.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号