首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 109 毫秒
1.
基于Web的跨语言信息检索研究综述   总被引:1,自引:0,他引:1  
回顾了近年来基于Web的跨语言信息检索技术的理论研究和发展现状,针对跨语言信息检索中基于语料库的方法,就其中语料库的构建和使用问题进行了阐述.比较分析和总结了两方面的技术:一是利用互联网上丰富的双语资源来建立大规模双语语料库的技术,二是目前运用较多的几种查询翻译模型构建技术.最后,展望了该领域的研究前景和发展方向.  相似文献   

2.
平行语料库处理初探:一种排序模型   总被引:1,自引:0,他引:1  
十年来,统计方法在机器翻译中的应用得到了广泛的关注,并逐渐成为机器翻译研究的主流方法.构造高质量统计机器翻译系统的重要基础是大规模高质量的双语平行语料库.目前,多数平行语料库包含着错误或噪音,它们极大影响着统计机器翻译系统的性能.用人工手段来筛选语料库中的句对是费时费力的,本文研究了一种有助于处理这一问题排序模型,该模型考虑了多方面的因素,包括语言模型、长度信息、意义对应等.鉴于如今的统计机器翻译系统都依赖词对齐信息,词对齐因素也被考虑入本模型中.文章最后的实验及结果表明本模型具有较好的性能.  相似文献   

3.
判断营销活动投诉工单所属的标签类别,开展营销活动问题标签分类研究具有重要意义,然而目前尚没有相关语料库。基于K-means算法和专业知识确定分类标签,构建营销活动问题标签分类语料库,且每个问题标签的一致性均达到93%以上。这说明该语料库能够为营销活动投诉工单分类研究提供统一资源支撑。此外,在构建的语料库上,采用单一深度学习模型和融合的方法进行营销活动问题标签分类研究。实验结果显示,F1值达到67.70%,说明该分类方法是有效的。  相似文献   

4.
在跨语料库语音情感识别中,由于目标域和源域样本不匹配,导致情感识别性能很差。为了提高跨语料库语音情感识别性能,本文提出一种基于深度域适应和卷积神经网络(Convolutional neural network, CNN)决策树模型的跨语料库语音情感识别方法。首先构建基于联合约束深度域适应的局部特征迁移学习网络,通过最小化目标域和源域在特征空间和希尔伯特空间的联合差异,挖掘两个语料库之间的相关性,学习从目标域到源域的可迁移不变特征。然后,为了降低跨语料库背景下多种情感间的易混淆情感的分类误差,依据情感混淆度构建CNN决策树多级分类模型,对多种情感先粗分类再细分类。使用CASIA,EMO-DB和RAVDESS三个语料库进行验证。实验结果表明,本文的跨语料库语音情感识别方法比CNN基线方法平均识别率高19.32%~31.08%,系统性能得到很大提升。  相似文献   

5.
从搭配知识获取最优种子的词义消歧方法   总被引:5,自引:3,他引:5  
基于统计的词义消歧模型的一个关键问题是如何自动从语料库中获取指示词,虽然通过学习初始搭配实例能够在语料库中获取更多的搭配知识,但人工获取质量较好的初始搭配是比较困难的,并且无法保证有效的扩大搭配知识。针对该问题,提出了通过机器学习初始搭配实例获取最优种子,再由最优种子扩增更多指示词,最后利用这些指示词实现具有多个义项的多义词消歧。采用该方法对8 个多义词进行消歧的测试实验中取得了8717 %的平均正确率。  相似文献   

6.
周永英 《自动化技术与应用》2021,40(11):127-130,135
为提升英文语料库分词精准度,以英文语料库作为研究对象,采用改进的K-SVD算法,构建一个分词特征提取模型.利用稀疏编码与字典更新两个步骤,将初始数据替换为更高级别的特征表示,作为K-SVD算法输入项来获取最优字典.基于模型开发平台,采用文本预处理模块、文本网络构建模块、特征提取模块以及特征加权模块,构建英文语料库分词特征提取模型.选取近十年的新闻素材作为英文语料库,组成训练集,根据分词特征提取结果与提取效果度量指标数据,验证所建模型具有语义辨别与文本还原的有效性,且准确率与召回率也有显著优越性.  相似文献   

7.
有关命名实体的翻译等价对在多语言处理中有着非常重要的意义。在过去的几年里,双语字典查找,音译模型等方法先后被提出。另一种极具价值的方法是从平行语料库中自动抽取有关命名实体的翻译等价对,现有的方法要求预先对双语语料库的两种语言文本进行命名实体标注。提出了一种只要求对语料库中源语言进行命名实体标注,目标语言不需标注,然后利用训练得到的HMM词对齐结果来抽取有关命名实体翻译等价对的方法。在实验中,把中文作为源语言,英文作为目标语言。实验结果表明用该方法,即使在对齐模型只是部分准确的情况下,也得到了较高正确率的命名实体翻译等价对。  相似文献   

8.
汉盲转换是指将汉字文本自动转换为对应的盲文文本,其在盲文出版、盲人教育等领域具有重要应用价值,但当前已有系统性能难以满足实用需求。该文提出一种基于汉盲对照语料库和深度学习的汉盲自动转换方法,首次将深度学习技术引入该领域,采用按照盲文规则分词的汉字文本训练双向LSTM模型,从而实现准确度高的盲文分词。为支持模型训练,提出了从不精确对照的汉字和盲文文本中自动匹配抽取语料的方法,构建了规模为27万句、234万字、448万方盲文的篇章、句子、词语多级对照的汉盲语料库。实验结果表明,该文所提出的基于汉盲对照语料库和深度学习的汉盲转换方法准确率明显优于基于纯盲文语料库和传统机器学习模型的方法。  相似文献   

9.
汉蒙统计机器翻译中的形态学方法研究   总被引:2,自引:1,他引:1  
该文将形态学方法引入到汉蒙统计机器翻译的研究中,尝试解决译文词形选择及语序混乱问题。首先介绍语料库的准备对原始汉蒙平行语料库进行词法分析及标注,得到两组基础语料库,再由基础语料库生成两组用于形态学实验的派生语料库。其次阐述统计模型的训练,包括语言模型、翻译模型及生成模型。同时讨论了解码的扩展问题。最后重点分析两组形态学方法实验词素模型实验和factored方法实验。结果表明,相对于基线(baseline)实验,引入形态学方法后两组实验的BLEU评分均有所提高,译文词形选择及语序混乱问题得到了一定程度的解决。  相似文献   

10.
我国语音识别技术已达国际水平,但是针对低资源语音识别的研究成果较少。文章以粤语方言为例,建立老年方言语料库,并基于神经网络方法构建高斯混合模型(Gaussian Mixture Model,DNN)-隐马尔可夫模型(Hidden Markov Model,HMM)处理语料库声学特征,使用N-gram语言模型解码特征状态。经实验证明,设计方法识别准确率较高,在以语音识别为核心的智能居家养老系统中具有一定的应用价值。  相似文献   

11.
心电模板构造方法及其在心电去噪中的应用   总被引:1,自引:1,他引:0       下载免费PDF全文
针对强噪声心电去噪,提出了基于心电模板的去噪方法。首先,将小波变换模极大值方法和信号相干平均技术相结合,构造出心电模板信号。然后给出了两种基于心电模板的强噪声心电去噪方法:直接重建法和间接相关法。最后将该方法与基于小波软、硬阈值去噪方法进行了对比,结果显示所得信号波形平滑度更好、信噪比更高。基于心电模板的去噪方法能够有效去除心电强噪声,为心电弱特征信息成分的准确提取奠定了基础。同时研究提供的心电模板构造方法也可用于其他准周期性生理信号,为强噪声生理信号去噪提供了一种有益思路。  相似文献   

12.
针对数字PCR系统的配套软件缺少多重实验液滴分类功能的不足,提出了一种网格区域化DBSCAN聚类算法.首先对数据进行网格映射,建立网格索引;然后计算网格间权值并进行深度搜索扩张;最后将网格空间的聚类结果映射回数据空间.人工数据集的仿真实验表明,所提算法能够有效识别簇边缘区域且具有优良的运行效率.在此基础上,提出了基于网格区域化DBSCAN聚类的数字PCR液滴分类方法,经由对比实验及有效性测试,结果表明所提方法能够便捷、准确地进行液滴分类.可见所提方法适用于数字PCR液滴分类.  相似文献   

13.
This paper uses a hybrid method to reconstruct 3D polyhedral objects from 2D line drawings by combining two known methods, the cubic corner method and the optimisation-based method, and presents comprehensive test results comparing the three methods. The cubic corner method is deterministic and very efficient. It recovers accurate 3D objects from accurate drawings but for inaccurate drawings, the quality of its results varies with the accuracy of the input. In general, the optimisation-based method produces approximate 3D objects that conform to human perception of the drawings. But it is computationally demanding, and can sometimes converge to incorrect results, partly due to poor initial values for the optimisation. The hybrid method starts with the cubic corner method, and uses its output as the initial guess for the optimisation process, which then produces a better quality 3D object than either method on its own. Tests are conducted for each method using drawings of varying degrees of accuracy. The results of the cubic corner method and the hybrid method are consistent, with accurate inputs producing good results and inaccurate input producing poor results. The results of the optimisation-based method are inconsistent. The hybrid method produces the best results in general, but it is less efficient than the cubic corner method and more efficient than the optimisation-based method.  相似文献   

14.
基于直方图的快速Mumford-Shah模型MRI分割   总被引:1,自引:0,他引:1       下载免费PDF全文
Mum ford-Shah(MS)模型因为其具有良好的图像分割能力,目前已被广泛应用于图像分割、目标跟踪等领域。但是由于其迭代过程需要对所有图像数据反复进行计算,因而其时间效率很低,难以实时应用。针对这个缺点,根据医学核磁共振图像(MR I)的特点,对M-S模型进行了改进,提出了一种基于直方图的快速求解方法,其求解时,首先构造符号表,以区分曲线内外区域;然后利用直方图法来进行目标的快速粗分割,再通过遍历优化边界,来获得较精确的分割。对MR图像进行的分割实验表明,其分割效果更好,同时,时间效率也有大幅提高,这就方便了实时应用。  相似文献   

15.
为了能够实时了解国际双边合作中有价值的信息,高效地智能提取Web外交新闻中的国际合作元素就显得至关重要。将国际合作元素抽取抽象为类似命名实体识别的问题,首先,界定国际合作元素的内涵;其次,提取了蕴涵领域知识的规则;再次,结合神经网络与领域知识提出了面向外交新闻文本的国际合作元素抽取方法;最后在相同语料库中与神经网络方法以及自身规则组合进行了比较,实验结果表明该方法具有更好的效果。  相似文献   

16.
针对现有的彩色图像脉冲噪声去除方法没有区分滑动窗口中的像素是否为噪声像素而导致滤波效果差的问题, 提出一种基于模糊决策的开关矢量中值滤波方法。该方法首先利用开关条件判断像素是否被污染, 针对被污染的像素, 通过模糊数学理论构造适合脉冲噪声去除的隶属函数; 然后计算滑动窗口内所有像素的模糊隶属度, 并根据置信区间去除疑似噪声像素以优化滑动窗口的取值空间; 最后对优化后的滑动窗口应用矢量中值滤波(VMF)以去除噪声像素。与现有方法相比, 新的方法去除了滑动窗口中心像素的邻域疑似噪声, 从而有效提升了滤波效果。实验验证了该方法的高鲁棒性和实用性。  相似文献   

17.
Fuzzy interpolative reasoning is an inference technique for dealing with the sparse rules problem in sparse fuzzy-rule-based systems. In this paper, we present a new fuzzy interpolative reasoning method for sparse fuzzy-rule-based systems based on the areas of fuzzy sets. The proposed method uses the weighted average method to infer the fuzzy interpolative reasoning results and has the following advantages: 1) it holds the normality and the convexity of the fuzzy interpolative reasoning result, 2) it can deal with fuzzy interpolative reasoning with complicated membership functions, 3) it can deal with fuzzy interpolative reasoning when the fuzzy sets of the antecedents and the consequents of the fuzzy rules have different kinds of membership functions, 4) it can handle fuzzy interpolative reasoning with multiple antecedent variables, 5) it can handle fuzzy interpolative reasoning with multiple fuzzy rules, and 6) it can handle fuzzy interpolative reasoning with logically consistent properties with respect to the ratios of fuzziness. We use some examples to compare the fuzzy interpolative reasoning results of the proposed method with those of the existing fuzzy interpolative reasoning methods. In terms of the six evaluation indices, the experimental results show that the proposed method performs more reasonably than the existing methods. The proposed method provides us a useful way to deal with fuzzy interpolative reasoning in sparse fuzzy-rule-based systems.   相似文献   

18.
欧锁阳  冯琦  张堃 《计算机应用研究》2012,29(10):3990-3992
为了缩减归一化割算法中权值矩阵的规模,提出了一种融合对数极坐标和归一化割的图像分割算法。首先将均匀采样的图像映射到对数极坐标系下,然后进行归一化割运算,达到减少时间复杂度、提高算法执行效率的目的。实验结果表明该方法能够取得理想的分割效果。  相似文献   

19.
A Bipartite Genetic Algorithm for Multi-processor Task Scheduling   总被引:1,自引:0,他引:1  
Until now, several methods have been presented to optimally solve the multiprocessor task scheduling problem that is an NP-hard one. In this paper, a genetic-based algorithm has been presented to solve this problem with better results in comparison with related methods. The proposed method is a bipartite algorithm in a way that each part is based on different genetic schemes, such as genome presentation and genetic operators. In the first part, it uses a genetic method to find an adequate sequence of tasks and in the second one, it finds the best match processors. To evaluate the proposed method, we applied it on several benchmarks and the results were compared with well known algorithms. The experimental results were satisfactory and in most cases the presented method had a better makespan with at least 10% less iterations compared to related works.  相似文献   

20.
函像分形维数是反映图像纹理特征的重要因素,也是图像分割的主要依据;通常,图像的分形维数多数采用盒维数计算方法来得到.但是避免不了计算时阚值选择带来不精确的问题,本文结合小波变换和布朗模型,提出了一种新的计算方法,并且和盒维数方法计算结果进行比较,结果表明,通过本文的计算方法得到的图像分形维数较准确。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号