首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 109 毫秒
1.
汉语智能接口的自动分词研究   总被引:2,自引:0,他引:2  
讨论了在旅游信息库汉语接口中的自动分词问题,基于系统的情况提出了模糊切分及形式分词与语法分析辅助分词相结合解决歧义切分、未登录词切分的方法,实验表明,该方法是可行的和令人满意的。  相似文献   

2.
汉语理解智能接口是国家经济信息系统专家系统的重要组成部分。它的准确性、有效性和用户友好性将直接影响该系统的生存能力。本文着重讨论汉语理解过程中的语法,语义和语用分析模块中的有关问题。  相似文献   

3.
汉语自动分词词典机制的实验研究   总被引:66,自引:4,他引:66  
分词词典是汉语自动分词系统的一个基本组成部分。其查询速度直接影响到分词系统的处理速度。本文设计并通过实验考察了三种典型的分词词典机制:整词二分、TRIE索引树及逐字二分,着重比较了它们的时间、空间效率。实验显示:基于逐字二分的分词词典机制简洁、高效,较好地满足了实用型汉语自动分词系统的需要。  相似文献   

4.
数据库汉语查询接口CQI的设计和实现   总被引:5,自引:0,他引:5  
顾国良  王能斌 《计算机学报》1990,13(12):950-953
1.引言 研究数据库的自然语言接口,对促进数据库的广泛应用和自然语言理解的研究,都具有很大的意义。现在国内外都有这方面的研究,如RENDEZVOUS,ROBOT,PLANES、LIFER和IRUS。但是,以往在研制数据库的自然语言接口时,无论是混合进行语法分析和语义分析(如ROBOT),还是把两者分开(如IRUS),都没有充分利用数据库中包含的语义信息,没有把语法和语义很好地结合起来。  相似文献   

5.
书面汉语自动分词的研究   总被引:2,自引:0,他引:2  
  相似文献   

6.
汉语自动分词方法   总被引:26,自引:0,他引:26       下载免费PDF全文
本文给出了为汉语自动分词而提出了机械匹配法,特征词库法,约束矩法,语法2分析法和理解切法。  相似文献   

7.
数据库汉语查询语言的分词研究与实现   总被引:3,自引:2,他引:3  
在综合考虑数据库查询这一特殊性的基础上,根据查询语句中词汇对数据查询不同贡献程度分级建立分词词典;然后提出了分步- - 正向单扫描的分词方法(DSWS) ,并对该分词方法的时间复杂度进行了分析。  相似文献   

8.
基于受限汉语的数据库自然语言接口技术研究   总被引:24,自引:0,他引:24  
介绍了一种新的基于受限汉语的数据库自然语言接口NLCQI(natural language (Chinese) query interface)的系统模型及设计框架.给出系统实现中具有特色的多栈结构的中间语言以及以关联路径搜索方法实现的中间语言向SQL转换的策略.实验表明,该系统采用的非过程化汉语查询句表达方式较自然,对汉语句型的理解、处理能力有较大的改进.  相似文献   

9.
利用上下文信息解决汉语组合型歧义   总被引:1,自引:0,他引:1  
汉语自动分词问题是制约中文信息处理发展的瓶颈之一,歧义切分又是影响分词系统切分精度的重要因素。在对已有方法深入分析的基础上,提出利用上下文信息的消歧策略。结果显示,经多次学习后搭配信息显示的消歧参数逐渐趋于稳定,且消歧准确率有大幅度提高。  相似文献   

10.
本文阐述了自动分词技术的理论与技术创新点,提出了一个适用于中英文WWW搜索引擎的分词器的实现,它具有高速的特点,同时具有较好的切分精度。该分词技术能对外提供基于全文和关键字检索的接口,并采用一系列的策略来提高切分速度,优化结构。它已应用于“中英文WWW搜索引擎系统”中,应用效果较好。  相似文献   

11.
现代汉语分词系统通用接口设计与实现   总被引:7,自引:0,他引:7  
现代汉语文本自动分词是中文信息处理的重要基石,为此提供一个通用的分词接口是非常重要的。本文提出了通用分词接口的目标,论述了它的原理和设计方案。该系统已经初步实现。  相似文献   

12.
提出一种基于内容的中文垃圾邮件实时过滤系统的实现方案,该系统建立在Linux的Sendmail邮件服务器上,通过Milter接口实时提取邮件内容,并结合中文分词及文本分类算法对邮件实施分类和过滤。该系统可嵌入多种文本分类算法,具有良好的可扩展性。通过测试对该系统内嵌入的不同分类算法模型进行了分析和比较。  相似文献   

13.
中文信息处理中自动分词技术的研究与展望   总被引:22,自引:0,他引:22  
汉语自动分词是中文信息处理的关键技术,已经成为中文信息处理发展的瓶颈。文章介绍了当前自动分词技术的研究状况,对各种分词算法进行了介绍,并对各种算法进行了比较和讨论。最后,对汉语自动分词技术的发展进行了展望。  相似文献   

14.
基于Hash结构的机械统计分词系统研究   总被引:3,自引:1,他引:3  
在综合比较了常用的机械分词方法和统计分词方法基础上,论文设计并实现了一种基于Hash结构的机械统计分词系统。系统突破了传统的机械分词方法和统计分词方法,结合了两者的优势,并对其做了一系列的改进。从对测试结果的分析可以看出,系统的分词速度达到了每秒一万两千个汉字以上,且具有较强的未登陆词识别能力。  相似文献   

15.
针对目前高校质量工程中精品课程建设存在的问题,智能答疑系统以提高学生个性化学习的能力.首先分析当前智能答疑系统存在智能性不足、答疑手段单一、答案或知识的结构不良、呈现方式不够丰富等不足,然后对当前的智能答疑系统进行改进,设计出了一个网上智能答疑系统模型.另外,本系统模型特别对标签检索模块进行了设计,在建好标签库的基础上...  相似文献   

16.
基于复句语料库分词系统研究   总被引:2,自引:0,他引:2  
复句在书面语中具有举足轻重的地位,如何让计算机正确理解复句是中文信息处理中一个值得重视的问题。现有的分词系统对复句关系词的正确切分与标注上不足以满足对复句进行层次分析和语义分析的需要。建立的分词系统在复句中关系词的切分和标注上做出了必要的改进。  相似文献   

17.
18.
面向信息检索的自适应中文分词系统   总被引:16,自引:0,他引:16  
新词的识别和歧义的消解是影响信息检索系统准确度的重要因素.提出了一种基于统计模型的、面向信息检索的自适应中文分词算法.基于此算法,设计和实现了一个全新的分词系统BUAASEISEG.它能够识别任意领域的各类新词,也能进行歧义消解和切分任意合理长度的词.它采用迭代式二元切分方法,对目标文档进行在线词频统计,使用离线词频词典或搜索引擎的倒排索引,筛选候选词并进行歧义消解.在统计模型的基础上,采用姓氏列表、量词表以及停词列表进行后处理,进一步提高了准确度.通过与著名的ICTCLAS分词系统针对新闻和论文进行对比评测,表明BUAASEISEG在新词识别和歧义消解方面有明显的优势.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号