共查询到18条相似文献,搜索用时 109 毫秒
1.
2.
李秀志 《计算技术与自动化》1991,10(2):61-65
汉语理解智能接口是国家经济信息系统专家系统的重要组成部分。它的准确性、有效性和用户友好性将直接影响该系统的生存能力。本文着重讨论汉语理解过程中的语法,语义和语用分析模块中的有关问题。 相似文献
3.
4.
数据库汉语查询接口CQI的设计和实现 总被引:5,自引:0,他引:5
1.引言 研究数据库的自然语言接口,对促进数据库的广泛应用和自然语言理解的研究,都具有很大的意义。现在国内外都有这方面的研究,如RENDEZVOUS,ROBOT,PLANES、LIFER和IRUS。但是,以往在研制数据库的自然语言接口时,无论是混合进行语法分析和语义分析(如ROBOT),还是把两者分开(如IRUS),都没有充分利用数据库中包含的语义信息,没有把语法和语义很好地结合起来。 相似文献
5.
6.
7.
数据库汉语查询语言的分词研究与实现 总被引:3,自引:2,他引:3
在综合考虑数据库查询这一特殊性的基础上,根据查询语句中词汇对数据查询不同贡献程度分级建立分词词典;然后提出了分步- - 正向单扫描的分词方法(DSWS) ,并对该分词方法的时间复杂度进行了分析。 相似文献
8.
9.
利用上下文信息解决汉语组合型歧义 总被引:1,自引:0,他引:1
汉语自动分词问题是制约中文信息处理发展的瓶颈之一,歧义切分又是影响分词系统切分精度的重要因素。在对已有方法深入分析的基础上,提出利用上下文信息的消歧策略。结果显示,经多次学习后搭配信息显示的消歧参数逐渐趋于稳定,且消歧准确率有大幅度提高。 相似文献
10.
本文阐述了自动分词技术的理论与技术创新点,提出了一个适用于中英文WWW搜索引擎的分词器的实现,它具有高速的特点,同时具有较好的切分精度。该分词技术能对外提供基于全文和关键字检索的接口,并采用一系列的策略来提高切分速度,优化结构。它已应用于“中英文WWW搜索引擎系统”中,应用效果较好。 相似文献
11.
12.
13.
中文信息处理中自动分词技术的研究与展望 总被引:22,自引:0,他引:22
汉语自动分词是中文信息处理的关键技术,已经成为中文信息处理发展的瓶颈。文章介绍了当前自动分词技术的研究状况,对各种分词算法进行了介绍,并对各种算法进行了比较和讨论。最后,对汉语自动分词技术的发展进行了展望。 相似文献
14.
基于Hash结构的机械统计分词系统研究 总被引:3,自引:1,他引:3
在综合比较了常用的机械分词方法和统计分词方法基础上,论文设计并实现了一种基于Hash结构的机械统计分词系统。系统突破了传统的机械分词方法和统计分词方法,结合了两者的优势,并对其做了一系列的改进。从对测试结果的分析可以看出,系统的分词速度达到了每秒一万两千个汉字以上,且具有较强的未登陆词识别能力。 相似文献
15.
针对目前高校质量工程中精品课程建设存在的问题,智能答疑系统以提高学生个性化学习的能力.首先分析当前智能答疑系统存在智能性不足、答疑手段单一、答案或知识的结构不良、呈现方式不够丰富等不足,然后对当前的智能答疑系统进行改进,设计出了一个网上智能答疑系统模型.另外,本系统模型特别对标签检索模块进行了设计,在建好标签库的基础上... 相似文献
16.
基于复句语料库分词系统研究 总被引:2,自引:0,他引:2
复句在书面语中具有举足轻重的地位,如何让计算机正确理解复句是中文信息处理中一个值得重视的问题。现有的分词系统对复句关系词的正确切分与标注上不足以满足对复句进行层次分析和语义分析的需要。建立的分词系统在复句中关系词的切分和标注上做出了必要的改进。 相似文献
17.
18.
面向信息检索的自适应中文分词系统 总被引:16,自引:0,他引:16
新词的识别和歧义的消解是影响信息检索系统准确度的重要因素.提出了一种基于统计模型的、面向信息检索的自适应中文分词算法.基于此算法,设计和实现了一个全新的分词系统BUAASEISEG.它能够识别任意领域的各类新词,也能进行歧义消解和切分任意合理长度的词.它采用迭代式二元切分方法,对目标文档进行在线词频统计,使用离线词频词典或搜索引擎的倒排索引,筛选候选词并进行歧义消解.在统计模型的基础上,采用姓氏列表、量词表以及停词列表进行后处理,进一步提高了准确度.通过与著名的ICTCLAS分词系统针对新闻和论文进行对比评测,表明BUAASEISEG在新词识别和歧义消解方面有明显的优势. 相似文献