首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 109 毫秒
1.
词汇是语言系统中最具活力的子系统。在语言演化的过程中,词汇的历时变化是语言学、历史学、社会学等多学科所关注的信息。我们收集了时间跨度约为60年的同质新闻语料。基于自然语言处理技术我们开发了现代汉语词汇历时检索系统。基于该平台可以利用频率、累积和与累积频率等方法从微观和宏观的角度上对词汇的语义、语用等方面进行研究。  相似文献   

2.
Python是不同语言模块的连接语言,而wxPython则是Python语言中的GUI图形库,其能够完成计算各个语言模块的调用与联结.主要使用免费软件系统、OpenGL开放图形库两种图形语言系统构建了基于四边数据结构的三维可视化建模系统.四边数据结构属于一种三角网格拓扑结构,其结构的连接性更加紧密,在数据查找和算法操作方面的效率也较高.主要对基于Python的三维建模可视化系统进行了研究,通过空间离散投影的德洛内三角网络,来完成建模可视化系统的边、角和顶点的插入与切割活动.  相似文献   

3.
本文首先阐明了汉语分析中所要面对的问题,并描述了如何建立搭配词典以表达个性的语言现象及处理规则.为了适应自然语言中的随机性和规律性,我们提出一个词汇语义驱动算法,它不仅提高了系统的效率,而且较好地解决了自然语言处理中诸如词汇兼类处理这样的难题.  相似文献   

4.
面向高校的学生信息管理系统是高校人事管理的无纸化、信息化进程的重要战略步骤,其系统直接决定了高校信息化进程.程序采取三层架构,有较强的可扩展性、稳定性.该系统采用了.NET 技术,应用UML建模语言进行系统分析和设计,开发语言采用了C#,运用ADO.NET技术进行数据处理连接,并运用SQL Server 2008实现数据高效存储管理.系统基本实现了预定信息化目标.在系统长时间压力测试和可用性测试上完成既定任务,进一步强化了高效的信息处理能力.  相似文献   

5.
为了在情感分析中有效实现汉语词汇主观性提取,提高提取准确率,分析和研究了汉语词汇主观性提取方法,建立了基于二元语法依赖关系的语言模型,由此定义了主观性提取模式,设计了自适应主观性自举算法,利用情感倾向特征和主观性强度特征集合进行特征选择和建模,提高了词汇主观性判断的准确率,使用机器学习方法构造分类器实行主观性判断.实践结果表明,该方法能有效的实现了词汇主观性获取,性能得到了提高,提取准确率达到88.64%.  相似文献   

6.
针对舰艇指挥训练系统的特点,提出了一种利用语音识别技术提高其训练效率的方法;首先分析了舰艇指挥指令的语言特点,然后研究了基于Sphinx平台的汉语连续语音识别的相关问题,包括声学模型的训练、语言模型的训练及语音识别引擎等;最后设计并实现了一个非特定人,中等专用词汇量的连续汉语语音识别系统;实验采用了一定数量的数字和专用词汇进行验证,结果表明,经过声学模型训练后,该系统的识别率有较大提高;该方法对提高舰艇指挥训练系统的自动化水平具有一定的指导意义。  相似文献   

7.
面向高校的学生信息管理系统是高校人事管理的无纸化、信息化进程的重要战略步骤,其系统直接决定了高校信息化进程。程序采取三层架构,有较强的可扩展性、稳定性。该系统采用了.NET技术,应用UML建模语言进行系统分析和设计,开发语言采用了C#,运用ADO.NET技术进行数据处理连接,并运用SQL Server 2008实现数据高效存储管理。系统基本实现了预定信息化目标。在系统长时间压力测试和可用性测试上完成既定任务,进一步强化了高效的信息处理能力。  相似文献   

8.
黄定琦  史晟辉 《计算机应用研究》2020,37(6):1724-1728,1754
汉语语言在书面表达时不具有天然分词的特性,词汇与词汇之间没有分词标记,因此在汉语文本的识别中需结合其行文的习惯及规则,即所谓的词汇特征。已有研究通常在实验中显式地标注词汇特征来提高识别效果,增加了人工处理流程,极大地加重了算法移植的工作量。研究并归纳了常用汉语语言的词汇特征,并利用条件随机场(conditional random fields,CRF)的特征提取能力,自行实现了复杂特征函数,在语料只具有简单标注的前提下,隐式地提取词汇特征,提高了识别效果。实验证明,在汉语分词中应用复杂词汇特征能有效提高识别性能,提供了在应用中提高识别算法可移植性的新思路。  相似文献   

9.
数据大集中完成后,商业银行信息化的基础设施建设框架已经基本构成,但与国际先进银行相比,我国商业银行信息化建设的运行效率、综合程度和服务水平仍较滞后,信息系统的集成化程度、基于信息技术的风险管理、金融创新能力以及系统运行的安全可靠性亟待提高.文章就这些问题进行了讨论.  相似文献   

10.
本文介绍了对汉语词汇声音信号进行抽样的算法.利用该算法可获得输入信号有声部分的抽样数据,即得到输入汉语词汇声音的准确抽样数据.实验表明,该算法是简易的,行之有效.  相似文献   

11.
ATMS在计算机辅助中医诊断中的应用*   总被引:1,自引:0,他引:1  
计算机辅助诊断是当前人工智能和信息技术研究的热点之一。针对计算机辅助中医诊断的特殊性,结合ATMS这一人工智能推理系统,以脾虚证的计算机辅助诊断研究为契机,讨论了运用ATMS进行中医辅助诊断规则的表示、挖掘、查询和更新的问题。  相似文献   

12.
辅助汉语学习研究作为一个重要的研究领域,已经在自然语言处理领域激发起越来越多人的兴趣。文中提出一个基于字分析单元的辅助阅读系统,它可以为汉语学习者提供即时的辅助翻译和学习功能。系统首先提出基于字信息的汉语词法分析方法,对汉语网页中文本进行分词处理,然后利用基于组成字结构信息的方法发现新词。对于通用词典未收录的新词(例如: 专业术语、专有名词和固定短语),系统提出了基于语义预测和反馈学习的方法在Web上挖掘出地道的译文。对于常用词,系统通过汉英(或汉日)词典提供即时的译文显示,用户也可通过词用法检索模块在网络上检索到该词的具体用法实例。该系统关键技术包括: 基于字信息的汉语词法分析,基于组成字结构信息的新词发现,基于语义预测和反馈学习的新词译文获取,这些模块均以字分析单元的方法为主线,并始终贯穿着整个系统。实验表明该系统在各方面都具有良好的性能。  相似文献   

13.
隐喻的计算研究与进展   总被引:1,自引:0,他引:1  
隐喻作为自然语言处理最棘手的问题之一逐渐引起了学者们的关注,国外学者在隐喻模型设计和隐喻知识库建设方面进行了很多尝试,也取得了一定效果。相比较而言,中文隐喻计算研究却显得有些薄弱,因此本文在传统隐喻研究的基础上综述了隐喻计算模型和隐喻知识库建设方面的进展,重点介绍了基于优选限制思想的Met5系统,基于实例方法的MIDAS系统,以及以统计为手段,基于大规模语料库提取的隐喻分析模型CorMet系统。通过总结国外的相关研究成果,探索面向信息处理的汉语隐喻形式化的研究方向。  相似文献   

14.
语义角色标注的研究方法中使用最频繁的一类是基于特征工程,将任务转化成分类问题使用机器学习的方法来解决,几乎所有的有指导语义角色标注采用的标注语料都是宾州大学命题库标注体系。近年来,北京大学开发出一套新的标注语料—北京大学中文网库,该文的目的在于测试这类研究方法在新语料的效果,验证之前所使用的特征是否对标注语料具有依赖性。通过实验发现前人方法中的一些不足,尤其个别特征在北大网库上作用更关键。  相似文献   

15.
汉字字形的关系稳定原理   总被引:1,自引:1,他引:0  
本文对汉字的字形描述进行了深入的研究, 并在此基拙土总结得出了汉字字形的关来稳定原理在汉字字形中, 笔划基元的方向、长度、位置等属性均是不穗定的, 而各笔划塞元之间的关来是稳定的。基元间关亲是反映字形本质的因素, 是汉字字形信巴的主体。关来穗定原理作为反应汉字字形本质的重要原理, 除了在研究汉宇字形方面有重要意义之外, 最重要的应用就是对汉字识别的研究提供方向性的指导。  相似文献   

16.
为了帮助汉语教学研究人员使用计算机有效处理错字,分析了汉语教学界对错字分类的研究成果,建立了一种适合计算机处理、以字形为依据的错字分类体系.基于Unicode5.1标准中表意文字变体序列标准(ideographic variation sequences,IVS),设计并实现了以正字为中心组织和管理错字,使用正字加IVS变体选择符表示错字编码,应用OpenType字体技术解决了错字的输入输出问题.实验结果表明,该错字处理方案是可行的,而且能够较好地支持错字的传输、共享和检索,以及错字与标准字符集内汉字同文显示.  相似文献   

17.
汉语语义关系的探求离不开汉字音义关系的探求,汉字的音义关系分为同音、同义和同源三种。探求汉字之间的音义关系、利用汉字的字音来推求字义之间的关系,是《说文解字》研究的一项重要内容。为了便于基于计算机技术更全面地探求音义关系尤其是同源关系中的“音近”、“义通”关系,本文对音韵通转规则进行了形式化表述。在《说文》知识库中,建立了《说文》双声规则库和叠韵规则库(含8个规则表) ,它们通过“规则槽”与传统框架表示法中的“属性槽”和“属性库”共同构成产生式框架,有效地表达了《说文》中的各项描述性知识和规则性知识,为后续研究奠定了基础。  相似文献   

18.
基于学术社区的学术搜索引擎设计   总被引:1,自引:1,他引:0  
学术社区和学术搜索引擎在科研活动中日趋重要。给出了一个基于学术社区的学术搜索引擎的设计方案,指出了它应具备的功能,提出了应着重解决的关键问题,并对部分问题提出了实现思路。给出了系统的架构设计,并讨论了文献资料的整合算法,将分散在不同位置、提供不同内容的学术信息组合为一个整体,有效地解决了文献提取问题。针对普通中文分词组件在对姓名进行分词时准确率较低的问题,设计了一个专门针对姓名进行分词的高效的算法。在开源框架Nutch和HBase的基础上,实现了一个学术搜索引擎,并在实验中验证了设计的有效性。  相似文献   

19.
传统的汉字书写教学方法具有一定的局限性,为此人们开始关注计算机辅助的汉字书写教学技术。它主要研究汉字书写规范的智能化、自动化评判方法以及可视化的反馈形式。对近20年来计算机辅助汉字书写教学技术的发展情况进行了综述;详细介绍了数字化展示、书写评判、水平评测等几个研究分支的特点、关键问题以及主要成果;结合相关技术的发展和需求的变化,提出了汉字书写数字化教学技术在未来的发展方向。  相似文献   

20.
计算机辅助审计是目前审计领域研究的一个热点。结合国内开展计算机辅助审计的现状及特点,以数据采集、数据预处理和数据分析为线索,对数据库技术在我国面向数据的计算机辅助审计中的应用进行了分析。最后,结合计算机辅助审计的发展趋势,探讨了数据库技术在持续审计中的应用,从而为我国实施计算机辅助审计提供理论和实践上的指导。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号