首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 695 毫秒
1.
基于递归式最大匹配法的数据库查询接口的实现   总被引:1,自引:0,他引:1  
针对中史自然语言应用在数据库查询这一特殊领域,提出了比较适用于数据库查询的递归式最大匹配法,它是最大匹配法的改进算法。在该算法的基础上,实现了一个中文自然语言数据库查询的接口,该接口允许用户随意输入中文自然语言,把用户的输入语句处理后生成存放中间结果的多又树,然后根据多又树生成SQL语句,进行数据库查询。  相似文献   

2.
提出了一种新的分词算法——WSDM算法。该算法针对特定的考古数字博物馆应用领域,基于各单词的语义概念,参照和单词相关的数据库语义进行单词的划分,它在设计实现的考古数字博物馆的汉语自然语言查询系统中有效地消除了切分单词的歧义性,最大程度的支持了语义分析的需要和自然语言查询语句到SQL的转化。  相似文献   

3.
陈云  王铮 《计算机工程》2008,34(20):58-61
针对界面层自然语言理解的应用,该文设计一个基于受限自然语言和模块组合的代码自动生成系统。该系统允许用户输入,格式比较随意的中文需求语句,,把用户的输入转换为标准的C程序,再返回给用户。提出一种IMM分词算法,改进原有MM法在局部的最大匹配,减少错误切分句子的数量,提高分词的精度。  相似文献   

4.
专业搜索引擎中文分词算法的实现与研究   总被引:1,自引:0,他引:1  
王坚  赵恒永 《福建电脑》2005,(7):55-55,57
为实现专业信息查询的中文搜索引擎,首要的问题就是中文分词。本文首先介绍了分词用词典数据结构的组织以及使用二分查找的查询算法,然后提出了一种基于最短路径的改进分词算法。实验证明,利用该算法。可以消除大量歧义,取得较好的分词效果。  相似文献   

5.
基于字表的中文搜索引擎分词系统的设计与实现   总被引:9,自引:0,他引:9  
丁承  邵志清 《计算机工程》2001,27(2):191-192,F003
分析了常用的基于词典的汉语分词方法用于中文搜索引擎开发中的不足,提出基于字表的中文搜索引擎分词系统,并在索引,查询,排除歧义等方面进行了设计和实现。  相似文献   

6.
战场态势时空数据引擎是基于时空数据库技术实现的,面向战场时空数据查询的战场态势辅助分析系统.针对时空数据库查询语言的复杂性,设计了战场态势时空数据引擎的中文查询系统,研究了中文查询任务到时空查询语句的映射过程,设计了时空查询词库,研究了分词算法,查询文法以及STQL生成方法.通过原型系统验证了中文查询技术的可行性,提高了时空数据库查询的可用性和易用性.  相似文献   

7.
针对当前自然语言处理中中文分词基于词典的机械分词方法,正序词典不能作为逆向最大匹配分词词典以及反序词典维护困难的问题,提出一种新的词典构造方法并设计了相应的双向最大匹配算法,同时在算法中加入了互信息歧义处理模块来处理分词中出现的交集型歧义。该算法可以在分词的过程中显著提高分词的精确度,适用于对词语切分精度要求较高的中文语言处理系统。  相似文献   

8.
为了提高现有的中文分词效率,提出了基于Hash结构词典的逆向回溯中文分词方法.针时首字Hash结构词典的不足,设计了能够记录词长的Hash结构尾字词典,然后对逆向最大匹配分词算法进行了分析,为了解决其存在的中文分词歧义问题,设计出一种逆向回溯最大匹配算法,该改进算法采用的回溯机制能够有效消除分词中可能存在的一些歧义问题.实验结果表明,该方法实现了提高中文分词速度并减少交集型歧义字符串切分错误的设计目标.  相似文献   

9.
分词识别和歧义消除是影响信息检索系统准确度的重要因素,该文提出了一种基于语法和语义的使用约束矩阵的中文分词算法。该算法建立在语法和句法的基础上,从语境角度分析歧义字段,提高分词准确率。系统可以将输入的连续汉字串进行分词处理,输出分割后的汉语词串,并得到一个词典。再用《现代汉语语法信息词典》进行处理,实验结果显示分词准确率能提高10%左右。  相似文献   

10.
基于中文文本分类的分词方法研究   总被引:13,自引:1,他引:13  
文本分类有助于用户有选择地阅读和处理海量文本,因此其预备工作分词系统的研究是很有意义的。该文主要提出了一种基于中文文本分类的分词方法,区别于常用的基于字符串匹配等方法,并利用数据库特有的查询技术设计和实现了该分词系统,旨在通过新的分词方法提供更加准确的分词率,同时提高系统实现效率。  相似文献   

11.
Chiql is a novel Chinese relational database query language for Chinese users.It supports procedural query style in which users can specify a complex database request in multiple simple statements.This facility renders Chiql simple-to-use and easy-to-remember.However,direct execution of multi-statemen Chiql rueries(i.e.statement by statement)is often inefficient as potential index-based operations(e.g.join) are by-passed.Furthermore,it often incurs additional database operations,such as scan and projection.To improve this situation,the SMA(Statement Merging Algorithm)is proposed.The goal of SMA is to merge as many dependent statments within Chiql query as possible to form a more efficient Chiql query.The ability in achieving improved effciency without sacrificing the simplicity of the language is the major advantage of this algorithm.  相似文献   

12.
马根峰 《计算机时代》2011,(12):35-36,39
万能数据库查询分析器有两个版本:DB查询分析器(中文版)和DB Query Analyzer(英文版)。它不仅能够直接获取SQL语句执行的时间,而且能够真正中断非常耗时的SQL语句的执行,从前台界面或者从后台操作系统都可以验证到SQL语句被中断,而不会在数据库服务器主机产生僵尸进程。这些优点是绝大部分数据库自带的客户端工具所不具备的。文章以英文版本DB Query Analyzer连接Windows2000 Server操作系统的MySQL数据库为例,来展现整个中断处理过程。  相似文献   

13.
在互联网和大数据时代下,SQL关系型数据库已不能适应与日俱增的数据量,HBase等NoSQL数据库变得极为重要。但HBase数据库操作较为复杂,本文设计并实现基于SQL的HBase查询,可以使HBase的使用者通过熟悉的SQL查询语句操作HBase数据库。首先构建SQL语言的编译器,将SQL语句转化成语法树,再将语法树转化为HBase的相关操作。使用协处理器处理SQL查询语句中的聚合函数和复杂表达式,并可以使用连接查询。  相似文献   

14.
将SQL嵌入到C语言中混合编程,程序中含有两种不同计算模型的语句,一种是描述性的面向集合的SQL语句,一种是过程性的高级语言语句。两种语言各有分3-,SQL语句负责操纵数据库,而C语言语句负责控制程序流程。利用高级语言的过程性结构来弥补SQL语句实现复杂应用系统方面的不足。给出了C语言与嵌入式SQL编程在不同版本SQLServer中的图像处理应用实例。  相似文献   

15.
数据库自然语言查询界面   总被引:9,自引:2,他引:7  
数据库技术的普及使得用户对数据库应用界面的要求越来越高,以往的几类接口都需要用户有较高计算机知识水平,而且必须经过一定的培训,这样就会造成人力物力的浪费而且不利于计算机的普及。本文探讨的是一种更为方便简洁不秀学习即可操作的自然语言界面。  相似文献   

16.
SQL Server数据库查询优化技术应用   总被引:2,自引:0,他引:2  
在结构化查询语言中,SELECT是一个关键的查询操作语句。为了设计合理高效的查询脚本,应合理使用索引、嵌套子查询、WHERE条件子句。从SQL Server数据库查询优化方法的各个方面描述该技术的应用,最后能正确评价各种方法的优点及代价,从而选出最佳方案。  相似文献   

17.
In this paper a novel word-segmentation algorithm is presented to delimit words in CHinese natural language queries in NChiql system,a Chinese natural language query interface to databases.Although there are sizalbe literatures on Chinese segmentation.,they cannot satisfy particular requirements in this system,The novel word-segmentation algorithm is based on the database semantics,namely Semantic Conceptual Model(SCM) for specific domain Knowledge,Based namely Semantic COnceptual Model(SCM) for specific domain knowledge,Based on SCM,the segmenter labels the database semantics to words directly,which eases the disambiguation and translation(from natural language to database query)in NChiql.  相似文献   

18.
采用VS 2008开发环境和C#语言开发高校课程管理系统。数据访问使用类型化数据集,支持Windows控件数据绑定,使用可视化设计工具生成SQL查询语句和视图定义。这些开发方法可以减少编写代码,提高开发效率。  相似文献   

19.
基于XML的可移植汉语生成技术   总被引:2,自引:1,他引:2  
提出了基于XML的汉语生成方法,该方法以XML树传递内部信息,使用XSL构造汉语句子生成格和实现XML树之间的转换。开发了一个基于XML的汉语生成功能模块。此模块具有一定可移植性,依托不同领域的知识库仅需对其作少量修改便能在该领域工作。  相似文献   

20.
汉字键盘输入智能处理软件综述   总被引:13,自引:5,他引:13  
作为输入编码的后处理,各种类型输入软件智能化的共同目标是由软件来识别和选定上屏的重码字、词与缩短平均码长,并促使编码简单化和规范化。本文简要地论述了基于理解的智能输入、基于语用统计的智能输入、基于模板匹配的智能输入和基于上下文关联的智能输入等四种类型的汉字键盘输入智能处理软件的原理、优点和有待解决的问题,并列举了每种类型的典型作品。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号