首页 | 本学科首页   官方微博 | 高级检索  
 共查询到20条相似文献,搜索用时 125 毫秒
提出了一种基于茶学词典和统计算法相结合的茶学知识概念抽取方法。该方法以茶学词典为基础,首先对非结构化数据源进行中文分词处理,然后采用两种统计算法对分词结果进行概念抽取。通过使用丰富的茶学词典来降低统计算法时间复杂度,提高了中文分词和概念抽取的精度和效率。实验结果表明,词库的丰富程度决定了概念抽取的效果,可以通过不断丰富词库,进一步提高概念抽取精度。  相似文献   

提出了一种基于茶学词典和统计算法相结合的荼学知识概念抽取方法。该方法以茶学词典为基础,首先对非结构化数据源进行中文分词处理,然后采用两种统计算法对分词结果进行概念抽取。通过使用丰富的荼学词典来降低统计算法时间复杂度,提高了中文分词和概念抽取的精度和效率。实验结果表明,词库的丰富程度决定了概念抽取的效果,可以通过不断丰富词库,进一步提高概念抽取精度。  相似文献   

针对现有信息检索系统中存在的词不匹配问题,本文提出一种基于负关联规则挖掘与特征词抽取融合的局部反馈查询扩展算法。该算法首先从前列n篇初检局部文档中抽取特征词,建立特征词库;然后,对特征词库挖掘同时含有查询词和非查询词的频繁项集和非频繁项集,由此挖掘前件是查询项的负关联规则,提取负关联规则的后件作为负关联特征词,计算负关联特征词与原查询的相关性,根据相关性在特征词库中删除负关联特征词,将余下的特征词作为最终扩展词,和原查询组合成新查询实现查询扩展。实验结果表明,该算法能有效地提高和改善信息检索性能。  相似文献   

提出一种分组并具有三级索引结构的词库组织体系,并就词库的扩充问题,考虑一种基于词频统计并具有过滤功能的关键词自动抽取和小词条添加方法.仿真实验结果表明,采用该方法可较大提高对中文文本的切词速度,保证系统具有较高的信息查全和查准率.  相似文献   

针对政策术语具有时效性、低频度、稀疏性和复合短语的特点,传统术语抽取方法难以满足需求的问题,设计实现了语义增强的多策略政策术语抽取系统.该系统从频繁项挖掘和语义相似度两个维度对政策文本特征进行建模,融合多种频繁模式挖掘策略选取特征种子词,利用预训练语言模型增强语义匹配来召回低频且稀疏的政策术语,实现了从无词库冷启动到有词库热启动半自动化的政策术语抽取.该系统能够提升政策文本分析效果,为建设智慧政务服务平台提供技术支持.  相似文献   

具有三级索引词库结构的中文分词方法研究   总被引:2,自引:1,他引:1  
提出了一种分组并具有三级索引结构的词库组织体系,给出了合适的索引密度间隔;针对系统基本词库的扩充问题,考虑了一种基于词频统计并具有过滤功能的关键词自动抽取和小词条添加方法。大量仿真实验结果表明,采用该方法可较大提高中文文本的切词速度及信息的查全查准率。  相似文献   

为了研究复杂系统中需求之间的依赖关系,针对需求文本固有的特点以及可能存在的上下文关系,结合各个词之间的词义以及特定语境下的语义知识,提出了一种基于句法和语义的需求依赖关系自动获取方法。在以自然语言描述的需求文本上,首先,通过对每条需求提取关键词,并结合领域知识对其添加领域词汇,对每个关键词进行词性标注并封装成集合来形式化需求;其次,通过对不同需求的关键词做语义分析,定义关联需求的语义词库表,将关系词库和集合中的词性特征结合来判断两个需求之间的依赖关系,并给出抽取关系的方法,基于该方法设计并实现了一个系统,通过自动分析各个词之间的语义依存关系得出需求之间的依赖关系。最后,通过实例证明了该方法的可行性和有效性。  相似文献   

针对半结构化文本的信息抽取粒度较大,不能对抽取结果进行有效语义分析的问题,面向领域提出一种基于模式匹配的结构化信息二次抽取方法.该方法以Web文档形式呈现的半结构化文本为对象,对粗粒度抽取结果进行领域识别,根据识别结果加载相应领域词库.根据模式中各个角色的词性实现模式角色到分词序列词语的映射,从分词序列中抽取出结构化信息,为准确的语义分析提供支持.实验表明该方法能获得更准确的抽取结果.  相似文献   

针对复杂文本评论的情感分析研究存在着隐式主题方面分类不精确、文本特征提取不全面和识别文本上下文语义不足等问题,论文提出了一种多维特征融合的混合神经网络文本情感分析模型MFF-HNN.该模型先把词向量、词性、位置和句法依存特征进行注意力特征融合,抽取出主题词库,然后把融合特征输入到改进的TBGRU模型和DCNN模型中获取语义信息和局部特征信息,再与主题词库结合进行注意力特征融合语义特征信息,最后使用SoftMax函数获取文本方面级情感分类信息.实验表明,该模型的情感分类的效果优于其它模型.  相似文献   

研究了从数据密集型Web页面中自动提取结构化数据并形成知识表示系统的问题。基于知识数据库实现动态页面获取,进行预处理后转换为XML文档,采用基于PAT-array的模式发现算法自动发现重复模式,结合基于本体的关键词库自动识别页面数据显示结构模型,利用XML的对象-关系映射技术将数据存入知识数据库,由此实现Web数据自动抽取。同时,利用知识数据库已有知识从互联网抽取新知识,达到知识数据库的自扩展。以交通信息自动抽取及混合交通出行方案生成与表示系统进行的实验表明该系统具有高抽取准确率和良好的适应性。  相似文献   

The researches of semantics (positive, negative, neutral) are performed for a long time and they are very important for many commercial applications, many scientific works, etc. In this paper we propose a new model to calculate the emotional values (or semantic scores) of English terms (English verbs, English nouns, English adjectives, English adverbs, etc.) as follows: firstly, we create our basis English emotional dictionary (called bEED) by using Sorensen measure (Sorensen coefficient, called SM) through Google search engine with AND operator and OR operator and secondly, many English adjective phrases, English adverb phrases and English verb phrases are created based on the English grammars (the English characteristics) by combining the English adverbs of degree with the English adjectives, the English adverbs and English verbs; finally, the valences of the English adverb phrases are identified by their specific contexts. The English phrases often bring the semantics which the values (or emotional scores) are not fixed and are changed when they appear in their different contexts. Therefore, the results of the sentiment classification are not high accuracy if the English phrases bring the emotions and their semantic values (or their sentiment scores) are not changed in any context. For those reasons, we propose many rules based on English language grammars to calculate the sentimental values of the English phrases bearing emotion in their specific contexts. The results of this work are widely used in applications and researches of the English semantic classification.  相似文献   

本研究旨在探讨工作记忆广度和语言水平差异在中国英语学习者对隐喻句这一特定句型理解的影响。通过英语工作记忆广 度、英语语言水平及英语隐喻理解的研究测试发现,中国英语学习者的英语工作记忆广度、英语语言水平与其隐喻理解能力高度 相关,工作记忆和语言水平高低两组t 检验结果均呈显著性差异。工作记忆广度及语言水平是影响中国英语学习者隐喻理解的两 大因素,故英语学习者可以通过知识面拓展及工作记忆训练来提高自己的隐喻理解能力。  相似文献   

分析了计算机专业英语教学的现状,从培养学生掌握英语思维方式的角度对教学目标进行了细化,总结了专业英语中常用的翻译技巧。并就通过“汉译英”方式对学生加强专业英语学习做了初步探讨。  相似文献   

分析了计算机专业英语教学的现状,从培养学生掌握英语思维方式的角度对教学目标进行了细化,总结了专业英语中常用的翻译技巧,并就通过“汉译英”方式对学生加强专业英语学习做了初步探讨。  相似文献   

计算机和英语在现代化的建设中起着关键的作用.而计算机的学习离不开英语,所以计算机英语是计算机专业的必修课.计算机专业的学生掌握了专业的同时,在英语上也有一定的基础,但是对计算机英语还存在很大的问题,需要经过系统的训练.关键是怎样利用学生已有的知识,结合起来,获得真正的理解从而应用,而不是单纯靠记忆.建构主义学习理论很好地解决这个难题.本文阐述了用建构主义理论来进行计算机英语教学的模式,并以实例来说明.  相似文献   

Since learning English is very popular in non-English speaking countries, developing modern assisted-learning tools that support effective English learning is a critical issue in the English-language education field. Learning English involves memorization and practice of a large number of vocabulary words and numerous grammatical structures. Vocabulary learning is a principal issue for English learning because vocabulary comprises the basic building blocks of English sentences. Therefore, many studies have attempted to improve the efficiency and performance when learning English vocabulary. With the accelerated growth in wireless and mobile technologies, mobile learning using mobile devices such as PDAs, tablet PCs, and cell phones has gradually become considered effective because it inherits all the advantages of e-learning and overcomes limitations of learning time and space that limit web-based learning systems. Therefore, this study presents a personalized mobile English vocabulary learning system based on Item Response Theory and learning memory cycle, which recommends appropriate English vocabulary for learning according to individual learner vocabulary ability and memory cycle. The proposed system has been successfully implemented on personal digital assistant (PDA) for personalized English vocabulary learning. The experimental results indicated that the proposed system could obviously promote the learning performances and interests of learners due to effective and flexible learning mode for English vocabulary learning.  相似文献   

在大学英语教学中,如何从庞大的英语试题库中生成符合一定测试目标或教学要求的英语考试试卷是英语辅助教学的重要手段.针对大学英语考试试卷的总体评价目标及试题的整体测试参数进行了分析,给出了一个有效的组卷模型,同时提出了基于入侵杂草优化的大学英语试题库自动组卷方法.实验结果表明,该方法能有效生成一份满足大学英语教师或教学大纲要求的英语考试试卷,极大地节约了高等学校英语教学的人力资源.  相似文献   

基于英语词汇的内部结构及其基本含义,致力于为用户打造一款英语词汇拓展和构词方法学习的利器。软件借鉴英语构词法的基本思想,通过分系统和分模块查询的工程实践方法实现对英语单词、词根和词缀的检索目的,并最终在软件窗口界面上为用户呈现英语构词方法的一套完整理论体系。最后,经论证与调研,英语构词法软件适用于本科生、研究生以及其它有志于拓展英语词汇的学习者。英语构词法软件在一定程度上填补了国内专业英语软件不足的缺口。  相似文献   

This paper conducts a comparative study between L1 and L2 (L1 Bengali) English discourse level speech planning to investigate differences between L1 and L2 English speaker groups in the organization of discourse-level speech planning. For this purpose, English speech of 10 L1 English and 40 L1 Bengali speakers of the same discourse are analyzed in terms of using prosodic and acoustic cues by applying hierarchical discourse prosody framework. From this analysis, between-group differences in discourse level speech planning are found through the speech rate, locations of discourse boundary breaks as well as size and scope of speech planning and chunking units. Result of analysis shows that the speech rate of L1 English speakers is higher than that of L2 English speakers, L2 English speakers contain more break boundary than that of the L1 English speakers at every discourse level in the organization, which exhibit the fact that L2 English speakers use more intermediate chunking units and larger scale planning units than that of L1 English speakers. Between-group differences are also found through the analysis of phrase component at prosodic phrase level and accent component at the prosodic word level. These findings can be attributed to L2 English speakers’ improper phrasing, improper word level prominence and the ambiguous difference between content words and function words. The study concludes that the deficiencies in English strategy for L1 Bengali speakers’ discourse-level speech planning compared to L1 English speakers are due to the influence of L1 (Bengali) prosody at the L2 discourse level.  相似文献   

王飞 《现代计算机》2011,(15):24-26
以计算机和信息为核心的信息技术与英语有着天生的关系,而且具体的IT工作也非常强调英语应用能力。对将来从事IT职业的学生而言,在学校开设IT职业英语课程对这方面能力的培养是一种行之有效的方法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号