首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 10 毫秒
1.
模板的自动抽取算法对机器翻译的研究具有重要意义。从面向英汉翻译的角度出发,论文对基于句子比较的翻译模板抽取(ATTEBSC)算法及其改进开展了比较研究,结果发现传统ATTEBSC算法在处理大规模语料库时运行效率较低,而且产生的无用模板比例较高,其中一个重要原因是没有事先对双语对齐语料库进行分类处理。通过相似性分析对句子进行聚类处理后再运行ATTEBSC算法,则发现该算法的运行效率和有用模板的比例都获得了较大的提高。  相似文献   

2.
索引模板匹配替换通用算法能够自动快速地从模板对应规则库找到与英语句子中相匹配的英语模板,并将其替换成相对应的汉语模板。以该算法为基础的英汉翻译系统能够合理地综合基于规则和基于例子的翻译系统的优点,同时能够在一定程度上克服它们的缺点。速度测试表明,该该英汉翻译系统在P—IV1.7G的计算机上的翻译速度每秒可以达到1300个单词左右;质量测试表明,该系统具有较好的发展潜力。  相似文献   

3.
并行程序执行行为的模板分析及提取算法   总被引:1,自引:0,他引:1  
沈美明  李程 《计算机学报》1995,18(2):158-160
并行程序执行行为的模板分析及提取算法沈美明,李程,田新民(清华大学计算机科学与技术系北京100084)THETEMPLATEANALYZINGANDEXTRACTINGALGORITHMSFORCAPTURINGTHEEXECUTIONBEHAVIO...  相似文献   

4.
业务服务作为业务活动具体实现的一种抽象表示,在业务层上解决了业务用户可用及领域可复用的问题,然而,业务服务在落实到具体的物理服务时缺少一种规范化的实例化方法,因此,文中提出了一种基于泛化-特化关系模式的业务服务实例化方法.通过泛化-特化关系的判定,最终用户定制的表达个性化需求的业务服务能够发现它的邻近上界业务服务,并且基于泛化-特化关系模式的应用,业务服务只需要在它的邻近上界业务服务的公共实例集合中去匹配.实验表明,这种实例化方法能够很好地减少业务服务实例化中的冗余匹配,提高业务服务实例化的效率.  相似文献   

5.
海量天体光谱数据的自动分类是大型观测计划项目中急需解决的重要问题之一.本文设计一种基于覆盖算法的天体光谱自动分类方法.首先对训练样本进行训练,得到各类样本的支撑点(代表点),然后在分类时只需计算待分类样本到各类支撑点的距离,并将与之最近的支撑点所在的类别作为待分类样本的类别.通过对正常星系、正常恒星、星暴星系和活动星系核的模拟和实测光谱进行分类实验,并与SVM分类方法进行比较,结果表明本文方法具有训练速度快、分类准确率高等特点.因此,本文的自动分类算法对大型观测计划所获得的海量天体光谱数据处理有着重要的意义.  相似文献   

6.
基于模板的机器翻译系统中模板库的自动构建技术   总被引:3,自引:0,他引:3  
林贤明  李堂秋  史晓东 《计算机应用》2004,24(9):127-128,135
基于模板的机器翻译(Template Based Machine Translation,TBMT)系统需要一个具有较大规模、句型覆盖面广泛的模板库,而这样的模板库单凭手工无法构建,需要利用计算机自动构建,提出了一种利用基于动态规划的相似模型与基于系统聚类法的分类模型,从句子对齐的双语语料库中抽取模板库的方法。该方法是在句子对齐的语料库中,首先运用系统聚类法对其进行聚类,使得包含相同模板的句子对被聚成一类,然后根据句子的相似度模型计算句子之间的相似度,进而从各个子类中将模板抽取出来,构建出整个模板库。  相似文献   

7.
本文针对于专利术语的特点,建立了一个基于属于模板的术语自动翻译系统。系统中结合了翻译模型和相似度打分机制,实验结果表明该方法能够解决术语翻译中的固定术语翻译问题和基于中心词序调整问题,提高了统计机器防疫的质量。同时术语模板中引用了单一的统计翻译中增加了语言学知识,为翻译提供了一个有效手段。  相似文献   

8.
针对传统算法对边界模糊的图像分割效果不理想,分割结果多毛刺的问题,提出了一种由粗到细的图像边缘提取方法,主要由像素覆盖分割方法和Chan-Vese模型组成。将改进的覆盖分割方法和活动轮廓模型相结合,首先使用原始覆盖分割算法对图像进行分割,利用多方向模糊形态学边缘检测算法提取不同物体之间的边界;然后采用改进的像素覆盖分割方法给边界像素重新分配覆盖值;最后,运用活动轮廓算法进行细化的图像边界提取;分别进行了分割结果的定性比较,抗噪性测试以及提取的边缘对比实验。实验结果表明,该方法对具有模糊边界的图像,提取边缘结果优于其他可比文献中提出的方法。  相似文献   

9.
针对普通的动态轮廓算法对曲线仅提供有限的连续与正则性约束,虽然带来了局部的灵活性,却丧失了全局的完整性,从而导致轮廓提取结果强烈敏感于图像噪声及邻近边缘点,针对这一问题,给出了一种基于椭圆变形模板的椭圆提取新算法。该算法使用一种基于椭圆形状约束的变形模板,由于其能量最小化过程直接在椭圆的参数空间中进行,从而可保证提取的结果一定是椭圆。此外,算法还容许同时提取多个椭圆,并可充分利用各个椭圆参数及其相关性(例如同心椭圆)等先验知识来实现快速、准确、鲁棒的椭圆提取。仿真结果与实际图像应用表明,该新算法是有效的。  相似文献   

10.
泛化能力是机器学习理论研究的主要目的.本文通过对算法稳定框架下分类机器学习相对误差的研究,得到了重叠稳定条件下分类机器学习不依赖于分布的相对误差的界,再通过这个界讨论了重叠稳定条件下分类机器学习的泛化能力,得出了重叠稳定条件下分类机器学习是具有较好泛化能力的结论.  相似文献   

11.
一个基于GLR算法的英汉机器翻译浅层句法分析器   总被引:5,自引:0,他引:5  
浅层句法分析是指短语级的自然语言句法分析。在研制MatLink英汉机器翻译系统的过程中,提出了扩充的CFG文法用于描述英语短语句法,并改进了GLR算法,设计实现了用于英汉翻译的英语浅层句法分析器。该分析器采用多出口的分析表结构,引入符号映射函数实现短语边界的自动识别,用孩子兄弟树描述短语的句法结构,并通过短语转换模式实现源语言向目标语言的短语级转换。最后,通过对一个实例句子的分析阐述了该浅层句法分析器的设计思想和工作过程。  相似文献   

12.
一种新的基于神经网络覆盖分类算法   总被引:4,自引:1,他引:4       下载免费PDF全文
为了克服传统神经网络算法在处理分类问题时训练时间长、泛化能力弱的不足,提出了一种新的基于构造型神经网络覆盖分类算法,该算法通过在超球面上对样本数据进行聚类分析,找出同类样本中未被覆盖样本的最大密度点,然后在特征空间里做超平面与球面相交,得到球面领域覆盖,从而将神经网络训练问题转化为点集覆盖问题,同时也考虑了神经网络规模的优化问题。实验结果证明了该算法的有效性。  相似文献   

13.
一种基于泛化的在线分类规则挖掘算法   总被引:1,自引:0,他引:1  
分类规则挖掘是数据挖掘中一项重要的挖掘任务,现存的分类算法对小数据集非常有效,但如果直接作用于大型的现实数据库,效率不能令人满意,研究了一种基于泛化的分类算法,能够对数据库进行直接的在线分类规则挖掘。  相似文献   

14.
该文提出的方法,使用模板匹配的方式在高分辨率遥感影像中提取房屋.通过对相关系数的调整来实现对相似房屋的提取.实验结果表明该方法提取模板对应及其相似的房屋具有可行性.  相似文献   

15.
首先介绍了覆盖算法的基本原理,然后在此基础上,以安徽省宣城市1960年至2006年的降雨量数据为应用实例,尝试应用覆盖算法进行建模,利用算法的优势,充分挖掘和利用数据中的隐含信息,用于对该地区的降雨量状况进行预测和分析,从中检验覆盖算法在该领域的预测效果。实验表明将覆盖算法应用于降雨量预测中,能得到较好的预测结果,为降雨量预测提供了一个新的实现方法,为气象科学的研究提供了新的研究模型。  相似文献   

16.
介绍了传统的领域覆盖算法和交叉算法,并分析它们各自存在的缺点以及造成这些缺点的原因.针对传统的领域覆盖算法存在的泛化能力不足以及交叉覆盖算法存在的正确率不高的问题,提出了一种新的改进算法--基于集成学习的覆盖算法(CABE).CABE是利用集成学习来整合交叉覆盖算法和领域覆盖算法,是通过对领域覆盖算法中的拒识样本的处理来提升算法的精度.使用UCI数据集进行实验,实验结果表明,改进的算法提高了算法分类的精度.  相似文献   

17.
针对RAKE(Rapid Automatic Keywords Extraction)算法在中文短文本关键词提取算法中未考虑词语语义和候选关键词过长的问题,提出一种以RAKE算法为基础的改进方法.在词语特征值计算阶段,利用词项距离、词间关系频率、共现频率构建共现矩阵,利用语境值计算公式计算每个候选关键词的特征值;按照特...  相似文献   

18.
为提高骨架提取的准确性和连通性,提出了一种利用模板和邻域信息的静脉骨架提取新算法,该算法首先对二值图像进行平滑,并通过自适应方法计算静脉纹路上所有像素点邻域之和,以快速区分出边缘点和中轴点,然后遍历图像找出所有符合中轴点模板的像素点,并删除其中的孤立中轴点之后,得到一些间断的中轴线段,最后从这些中轴线段的端点开始采用最大邻域点跟踪方法提取出静脉骨架。实验结果表明,该算法提取的静脉骨架与中轴线重合且平滑稳定,且具有尺度不变性,角度不变性和良好的抗噪性能,是一种有效的骨架提取算法。  相似文献   

19.
提出了一种自动化提取情感依存句法关系的分析方法。在待分析语句依存句法树的基础上,结合中文语法特点,定义了分枝、嫁接、剪枝和枝解四种基本操作,压缩依存树的特征空间的同时将语句转换成表征句法关系的子树集合,最后利用遗传算法求解最优情感子树集。针对第三届自然语言处理及中文计算会议(NLPCC 2014)评测数据的实验结果表明,该方法在语句是否表达情感的判别上具有优异效果。与基于词典的情感分析结合,可降低词典对客观句的高误判缺陷,进而明显改进基于词典的情感分析方法。  相似文献   

20.
翻译模板不仅是机器翻译的重要资源,而且是有用的语言学知识。使用词对齐结果改进了从实例中类比学习翻译模板的方法,并提出了带有函数关系的模板(TTFR)以获取语言之间的依赖关系,如“he…his”对。带函数关系的模板是一个更一般化的模板并能直接用于双向的机器翻译。实验结果表明改进的方法有效地克服类比方法的问题并且提高了自动获取模板的准确率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号