首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 171 毫秒
1.
针对向量空间模型忽略词语出现位置和词序的缺点,结合科技文献结构明显分层的特点,本文提出了基于N层向量空间模型的文本相似度计算方法.该算法首先用N层向量空间模型表示查询短语和科技文献,其次在词频角度上和词序角度上分别计算两者间的相似度,最后得出整体的文本相似度.将本文算法应用于中、朝、英对照科技文献多语种检索模块测试其有效性,测试结果表明,本文设计的文本相似度计算方法算法性能较好,与传统的向量空间模型余弦相似度算法相比,查准率提高了2.7%,MRR提高了2.02%.  相似文献   

2.
针对在扩展有限状态机(extended finite state machine, EFSM)模型上测试序列集生成效率低、规模大等问题,提出了一种面向全迁移的小规模测试序列集生成方法。该方法基于改进的自适应多种群遗传算法(improved adaptive multi-population genetic algorithm, IAMGA)。首先,利用迁移覆盖增益设计适应度函数,使每次生成的可行迁移路径均能产生迁移覆盖增益;然后,根据个体的可行迁移划分子种群,并在子种群内使用轮盘赌算法进行选择,克服了“早熟”问题,提高了全迁移覆盖的成功率;再利用种群的平均路径通过率自适应地调整交叉和变异概率,加快了收敛速度;最后,通过倒序遍历测试序列集去除冗余序列,进一步压缩了测试序列集规模。实验结果表明,与面向单迁移的测试序列生成方法相比,本文所提出的测试序列生成方法面向全迁移,仅一次就能以90%以上的成功率生成满足全迁移覆盖的测试序列集;与传统的遗传算法相比,IAMGA算法生成的测试序列集的平均规模减少了50%,平均迭代次数也减少了20%。本文提出的测试序列集生成方法可有效提高EFSM测试序列集生成的效率和质量。  相似文献   

3.
段艳会    李晓林    黄爽   《武汉工程大学学报》2015,37(11):47-51
为了在非规范中文地址中有效的提取行政区划信息,提出了一种基于条件随机场的方法. 该方法根据中文地址中行政区划的表达特点和特征,采用判别式概率模型,在观测序列已知的基础上对目标序列建模,通过构建语料训练集和建立相应的特征模板,得到行政区划的表达模型,然后使用该模型对测试集进行测试,并与标注好的测试数据进行比对,验证模型的性能. 实验表明,与最大熵模型相比,条件随机场模型总的性能指标在其之上,地址信息解析的准确率能达到89.93%.  相似文献   

4.
为了实现评论摘要的生成式提取,对序列到序列学习的神经网络模型进行分析,提出了一种改进的注意力机制应用模型,并用于评论摘要.挖掘评论摘要特征,使在摘要中出现的文字更多集中在原文首部;针对评论摘要的样本特征,通过改进局部注意力模型,使其对评论原文的句首具有更高的注意力权重,并可端到端地生成评论摘要的每一个词.实验结果表明,该模型在对英文同类别全文长度小于200的评论摘要提取上有更高的准确率.  相似文献   

5.
传统基于序列的文本摘要生成模型未考虑词的上下文语义信息,导致生成的文本摘要准确性不高,也不符合人类的语言习惯.本文提出了一种基于文本语义结构的文本摘要生成模型(Structure Based Attention Sequence to Sequence Model,SBA),结合注意力机制的序列到序列生成模型,引入文本...  相似文献   

6.
测试集自动生成方法的研究是协议一致性测试领域中比较活跃的一个分支,提出了一种基于EBE模型,集成数据流和控制流测试的新的协议测试自动生成方法并给出了其实现TUGEN。EBE模型中对协议的外部行为进行描述,强调变迁之间的数据依赖性。在TUGEN中,我们引入控制流测试中的UIO序列算法和描述协议不确定性的AIO树的概念,运用协议约束集来灵活地控制自动生成过程中的协议空间搜索的复杂性,并采用测试集的验证  相似文献   

7.
针对人工生成测试序列的不足,提出基于模型的车载设备测试用例自动生成方法。首先按照系统需求规范,在UPPAAL环境下运用时间自动机对车载设备进行建模及验证,然后将建立的模型导入到基于覆盖度算法的模型辅助工具Cover中自动生成测试用例,最后分析了自动生成的测试用例的正确性。    相似文献   

8.
为了解决生成与描述文本潜在语义信息配对的逼真图像这一问题,对传统的生成式模型AttnGAN中的注意力机制做出改进,即将AttnGAN模型生成器中的注意力机制进行归因,以归因注意力得分矩阵替代注意力得分矩阵在AttnGAN模型中作用,并用消融实验展示该文的DAMSM模块对于整个生成式网络的性能所产生的影响。将改进后的模型称为AttrGAN并与其他经典的生成式模型进行实验对比,从CUB鸟类数据集和Oxford-102flowers数据集的实验结果来看,改进后的AttrGAN模型生成图像的性能是优于其他经典的生成式模型的。  相似文献   

9.
基于卷积神经网络框架,提出一种洗衣机异音识别模型,根据卷积神经网络显著特征提取能力和平移不变性,学习洗衣机的异音特征,实现生产线洗衣机的异音自动智能识别。给出完整的过程解决训练数据集的建立、数据样本不平衡等问题。提出一种用于数据增强的网络模型——音频深度卷积生成对抗网络解决训练样本的稀缺性问题。该模型对传统的深度卷积生成对抗网络进行改进,以更好地适应工业音频的生成。利用该模型能够对原始数据进行扩展,生成洗衣机异音增强数据集,在该数据集的基础上进行卷积神经网络训练,经测试准确率达到0.999。利用添加背景噪声信号的数据集测试洗衣机异音识别模型的泛化能力,正确识别率达到0.902,表明该网络在识别洗衣机异音方面具有良好的鲁棒性。  相似文献   

10.
为了提高图像生成效果,减少高频信息损失,文中提出了一种基于深度学习的生成式对抗网络模型结构,实现单幅图像超分辨率重建。文中在SRGAN方法的基础上修改了网络结构、残差网络和卷积参数,采用DIV2K数据集进行网络模型训练,利用峰值信噪比和结构相识性两种评价标准对生成的图片质量进行测试与评价。实验结果表明,相较于SRGAN方法生成的高分辨率图像,文中方法生成的图像视觉效果更好、纹理更清晰,具有更好的客观和主观评价。  相似文献   

11.
为研究中韩双语实体自动对齐方法,提出了一种融合图注意力网络(GAT)和基于超平面平移的知识图谱嵌入模型(TransH)的跨语言实体对齐模型.使用中韩实体数据集对模型进行验证表明,该模型的Hits@1、Hits@5和Hits@10在韩文对齐中文时分别达到了49.62%、 80.89%和91.76%, 在中文对齐韩文时分别达到49.79%、 80.74%和91.67%, 且优于传统的基于知识嵌入或图嵌入的对齐方法.因此该模型可为构建中韩对齐知识图谱以及其他语言的对齐知识图谱提供参考.  相似文献   

12.
针对目前语音语料人工标注效率低的问题,提出了一种朝鲜语连续语音语料的音节自动切分方法.该方法首先采用Seneff听觉模型提取音频的包络检测响应和广义同步检测响应等特征参数,其次结合朝鲜语发音特点确定音节的候选边界位置,最后通过静音段和摩擦音检测消除虚假边界,以提高边界检测的准确率.实验结果表明,该朝鲜语语音语料音节自动切分方法的准确率(93.56%)比传统的基于Seneff听觉模型的分割算法提高了14.59%,召回率(86.43%)比传统的基于Seneff听觉模型的分割算法降低了1.69%; 因此,本文算法总体优于传统的基于Seneff听觉模型的分割算法.  相似文献   

13.
面向汉英机器翻译的双语语料库的建设及其管理   总被引:7,自引:0,他引:7  
近年来,在语言信息处理的研究和开发中,单语和多语语料库(主要是双语语料库)的作用日益突显出来。为了支持一项正在进行的汉英机器翻译系统的开发,我们建立了一个汉英双语语料库。本文简要介绍了该语料库的建设和管理情况。  相似文献   

14.
为减少朝鲜语古籍中的小文字错检和漏检问题,提出了一种基于HRCenterNet模型改进的朝鲜语古籍文字检测方法.首先,将HRCenterNet中Bottleneck模块的3×3卷积运算替换为Involution算子,即将Bottleneck模块替换为Involution - Bottleneck模块.其次,通过引入ECA(efficient channel attention)注意力机制扩展Involution - Bottleneck模块,并由此提出了基于IENeck模块的HRCenterNet改进模型.最后,利用朝鲜语古籍数据集对改进的HRCenterNet模型和原模型分别进行了训练,并测试了其在不同IOU下的准确率、召回率以及F1等指标.实验结果表明,在IOU ≥ 0.6时,改进的HRCenterNet模型在朝鲜语古籍数据集上的准确率、召回率和F1指标均优于原模型,且IOU值越高模型的检测效果越好.这表明改进的HRCenterNet模型显著优于原模型,可应用于朝鲜语古籍文字的检测中.  相似文献   

15.
To solve the problem that the traditional automatic text summary model cannot generate a high-quality long text summary due to the limitation of the length of the RNN (Recurrent Neural Network), a model of abstractive text summarization for topic-aware communicating agents has been proposed. First, the problem that the LSTM (Long Short-Term Memory) input sequence is too long to generate the abstract with prior information has been solved by dividing the encoder into multiple collaborating agents. Then for providing topic information and improving the correlation between the generated abstract and the source text, the joint attention mechanism has been added into our model. Finally, a hybrid training method with reinforcement learning has been employed in order to solve the problem of exposure bias, and optimize the evaluation index directly. The results show that our model not only generate long text summaries with prominent themes, but also has a higher score than the state-of-the-art models, which indicates that with the help of topic information, the model for communicating agents can be expected to generate long text summaries better.  相似文献   

16.
为解决少样本朝鲜语古籍文字识别精度低的问题,提出了一种基于迁移学习的少样本文字识别方法.首先提出了一种结合传统数据增强和条件深度卷积生成对抗网络的数据增强方法,以此扩充朝鲜语古籍文字图像的训练样本数.其次,将富样本集预训练得到的模型迁移到少样本数据集的学习任务中,以此实现少样本的朝鲜语古籍文字识别.实验结果表明,提出的数据增强方法能够满足模型预训练和少样本的学习要求,且VGG16、ResNet18和ResNet50 3种网络模型在测试集上均获得良好的识别性能,其中ResNet50的识别准确率最高(99.72%).因此,该方法可有效解决小样本的朝鲜语古籍文字识别问题,并可为其他语种的小样本文字识别提供参考.  相似文献   

17.
首先介绍文献术语的重要性和分布情况,归纳常用的文献术语抽取方法,进而提出一种从英汉平行语料库中自动抽取术语的算法.主要采用基于字符长度的改进的统计方法对平行语料进行句子级的对齐,并对英文语料和中文语料分别进行词性标注.统计已对齐和标注的双语语料中的名词和名词短语生成候选术语集.然后对每个英文候选术语计算与其相关的中文翻...  相似文献   

18.
摘要是对文档内容的概括,在信息检索中起着重要的作用。分析了机械式自动摘要的局限性,提出一种模仿人工进行自动摘要的方法;探讨了简单的中文自动摘要系统的结构模型,在此基础上对模型中的分词模块和文摘句的提取模块进行了分析。最后,结合实例对系统进行了进一步地讨论。结果表明:该系统能够达到较好的质量和效率。  相似文献   

19.
针对遥感影像镶嵌存在的几何精度差和时间效率低等问题,提出一种快速镶嵌方法,主要包括自动配准、基于地理编码的镶嵌和色调调整3个步骤.在自动配准阶段,采用基于点特征匹配的自动配准方法既减少了工作量又提高了几何精度;在镶嵌过程中,根据地理坐标确定重叠区域,然后依据重叠频率确定多幅影像间的重叠关系和镶嵌顺序;在色调调整步骤中,基于Wallis变换进行整体色调调整,依据重叠区域大小分别采用基于最优接缝线的加权平滑处理和强制改正方法实现接缝线色调调整.对SPOT全色影像的镶嵌实验结果表明,这一技术流程能够实现多幅影像的快速镶嵌,镶嵌精度优于1像素,镶嵌后影像具有良好的整体效果.  相似文献   

20.
针对基于语音识别的语音检索方法对语言模型的强依赖问题,通过改进声学模型学习框架提出了一种新的朝鲜语语音检索方法.该方法首先修改KoSpeech框架的网络模型,通过训练得到了朝鲜语的声学模型; 其次通过语音文档分割方法构建了语音文档索引库; 最后利用编辑距离匹配的方法实现了语音检索.实验结果表明,改进的朝鲜语声学模型学习框架降低了语音检索方法对语言模型的依赖和大规模数据集的要求.当k取9时, top -k评价方法的检索均值平均精度达到86.74%, 召回率达到95.25%, 该结果表明本文提出的方法是有效的,具有一定的实际应用价值.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号