首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 93 毫秒
1.
由于环境和快速发展之间的不平衡,城市空气质量问题变得越来越突出。PM2.5作为空气污染的主要成分,会对人体造成很大伤害。因此,准确地预测PM2.5浓度对于保护人们健康具有重要意义。首先选取了其他空气质量数据(PM10、NO2、CO2、O3)作为影响因素,构建了基于机器学习(多元线性回归、岭回归、套索回归、决策树、随机森林和人工神经网络)的PM2.5预测模型;其次利用这些模型预测山西省太原市未来1小时PM2.5浓度;最后通过MAE、RMSE、R2来等指标评价各模型的预测性能,实验结果表明,基于随机森林的预测模型具有最高的预测精度。  相似文献   

2.
彭辉 《现代计算机》2022,(12):81-85
随着轨道列车智能运维系统的部署运行,列车运行过程中的工况数据能实时同步发送到地面服务器。为实现对列车故障的诊断预测,本文探索利用已确认的列车故障记录作为数据集构建机器学习模型,并将采集到的列车实时工况数据输入到预测模型进行测试,得到故障诊断的结果。本文从数据集获取、故障诊断模型构建、模型优化、模型应用等方面进行说明。  相似文献   

3.
程序注释是软件开发过程中不可缺少的工作.大量的Java程序需要准确的注释来提高程序的可维护性.对自动标注方法进行研究,分析现存方法存在的问题,为了改善注释的效率,提出一种基于机器学习的程序注释自动标注方法用于Java程序的自动标注.方法 主要分为两个部分:数据的预处理和机器学习模型.数据预处理采用双编码器对程序进行处理...  相似文献   

4.
基于集成分类算法的自动图像标注   总被引:2,自引:0,他引:2  
蒋黎星  侯进 《自动化学报》2012,38(8):1257-1262
基于语义的图像检索技术中,按照图像的语义进行自动标注是一个具有挑战性的工作. 本文把图像的自动标注过程转化为图像分类的过程,通过有监督学习对每个图像区域分类并得到相应关键字,实现标注. 采用一种快速随机森林(Fast random forest, FRF)集成分类算法,它可以对大量的训练数据进行有效的分类和标注. 在基于Corel数据集的实验中,相比经典算法, FRF改善了运算速度,并且分类精度保持稳定. 在图像标注方面有很好的应用.  相似文献   

5.
基于机器学习的网页主题词自动抽取   总被引:2,自引:0,他引:2  
主题词在信息处理和信息检索过程中有广泛的用途,然而大量网页没有主题词,手工抽取主题词是一个繁重的过程,可以将主题词自动抽取看作是分类问题,充分利用网页的结构信息并且使用有监督的机器学习方法来自动地抽取网页中的主题词,试验结果表明该算法具有实用的价值。  相似文献   

6.
针对现有面阵CCD相机自动对焦算法精度比较低、易出现局部峰值的问题,提出了一种基于机器学习的自动对焦算法。采用机器学习中的决策树算法求得两个决策树,用决策树来决定镜头移动的方向及下一步的状态,进而确定了一个包含有峰值的范围,然后再用爬山算法进行局部峰值搜索,从而确定焦点峰值位置。实验结果表明,该算法把自动对焦的精确度提高了3%,且出现局部峰值的情况也得到了改善。  相似文献   

7.
机器学习在诸多学科领域的定量分析中都已经显现出了巨大价值.本文借助sklearn机器学习库,以韩国国立国语院2015年发布的《新词调查报告书》中收录的新造词为对象,根据报告中出现的分类标准为词汇建立特征矩阵.而后运用多种机器学习算法进行特征选择,最终筛选出对韩国语新造词词义理解影响较强的因素.实验结果表明:如果该词为派...  相似文献   

8.
为了能尽早发现软件中存在的缺陷,使用传统的机器学习方法来预测软件模块的缺陷倾向性,选取了NASA公开数据集中的部分数据集,针对软件缺陷预测中类不平衡的问题,分别采取了随机欠采样和随机过采样的方案,再使用逻辑回归算法和随机森林算法分别对数据集进行训练和预测,使用了查准率(Precision)、查全率(Recall)、RO...  相似文献   

9.
10.
《软件》2019,(1):97-102
肿瘤免疫治疗应答的预测对肿瘤治疗方案设计及治疗有着重要的意义。本文引入基于随机森林的机器学习方法,将病人黑色素瘤组织转录组RNA-seq的基因表达谱作为特征,对免疫检查点阻断治疗的结果进行预测研究。对病人的基因表达谱使用随机森林算法来构建预测模型,并与Logistic回归模型和XGBoost模型进行比较。实验结果表明,随机森林模型对免疫检查点阻断治疗的应答能够进行较准确的预测,并且较Logistic回归模型和XGBoost模型预测效果更好。  相似文献   

11.
机器翻译译文质量的自动评价是推动机器翻译技术快速发展的一条重要途径。该文提出了基于List-MLE 排序学习方法的译文自动评价方法。在此基础上,探讨引入刻画译文流利度和忠实度的特征,来进一步提高译文自动评价结果和人工评价结果的一致性。实验结果表明,在评价WMT11德英任务和IWSLT08 BTEC CE ASR任务上的多个翻译系统的输出译文质量时,该文提出的方法预测准确率高于BLEU尺度和基于RankSVM的译文评价方法。  相似文献   

12.
随着机器翻译的发展,对其质量进行评测的自动评价方法也越来越受重视。发展至今,各种评价方法与技术层出不穷,采用何种分类标准来组织和描述它们也是一个很大的挑战。根据核心技术的不同,该文重点介绍了三类主流的自动评价方法,包括: 基于语言学检测点的方法、字符串匹配的方法和基于机器学习的方法。论文分别阐述了这些类别中颇具代表性的方法的工作原理并分析了各自的优缺点。此外,受限参考译文下的评价技术虽然不是主流的方法,但是其对提高自动化程度和评价性能的作用不能忽视,所以该文将其作为特殊的类别做了阐述。然后,汇报了近年来衡量自动评价方法的国际评测结果。最后,总结了自动评价的发展趋势和有待进一步解决的相关问题。  相似文献   

13.
机器翻译评测的新进展   总被引:4,自引:2,他引:4  
机器翻译评测对机器翻译的研究和开发具有至关重要的作用,对其的研究一直是国内外机器翻译界的重点课题。本文首先全面地介绍了最近出现的而且受到极大关注的机器翻译评测技术,即IBM公司的BLEU机器翻译评测标准和NIST采用的机器翻译评测技术。实验表明,自动翻译评测技术能够接近人工评价,评测结果也是可接受的。因此,采用自动翻译评测技术能够给自然语言处理的研究人员和开发人员带来很大的便利性。本文还展示了一个开放式的可扩展的自动翻译评测的平台,完全实现了BLEU和NIST评测标准,并做出了一定的改进使得该系统具有良好的使用性和可扩展性。  相似文献   

14.
在机器译文自动评价中,匹配具有相同语义、不同表达方式的词或短语是其中一个很大的挑战。许多研究工作提出从双语平行语料或可比语料中抽取复述来增强机器译文和人工译文的匹配。然而双语平行语料或可比语料不仅构建成本高,而且对少数语言对难以大量获取。我们提出通过构建词的Markov网络,从目标语言的单语文本中抽取复述的方法,并利用该复述提高机器译文自动评价方法与人工评价方法的相关性。在WMT14 Metrics task上的实验结果表明,我们从单语文本中提取复述方法的性能与从双语平行语料中提取复述方法的性能具有很强的可比性。因此,该文提出的方法可在保证复述质量的同时,降低复述抽取的成本。
  相似文献   

15.
机器译文自动评价是机器翻译中的一个重要任务。针对目前译文自动评价中完全忽略源语言句子信息,仅利用人工参考译文度量翻译质量的不足,该文提出了引入源语言句子信息的机器译文自动评价方法: 从机器译文与其源语言句子组成的二元组中提取描述翻译质量的质量向量,并将其与基于语境词向量的译文自动评价方法利用深度神经网络进行融合。在WMT-19译文自动评价任务数据集上的实验结果表明,该文所提出的方法能有效增强机器译文自动评价与人工评价的相关性。深入的实验分析进一步揭示了源语言句子信息在译文自动评价中发挥着重要作用。  相似文献   

16.
机器译文的自动评价推动着机器翻译技术的快速发展与应用,在其研究中的一个关键问题是如何自动的识别并匹配机器译文与人工参考译文之间的近义词。该文探索以源语言句子作为桥梁,利用间接隐马尔可夫模型(IHMM)来对齐机器译文与人工参考译文,匹配两者之间的近义词,提高自动评价方法与人工评价方法的相关性。在LDC2006T04语料和WMT 数据集上的实验结果表明,该方法与人工评价的系统级别相关性和句子级别相关性不仅一致的优于在机器翻译中广泛使用的BLEU、NIST和TER方法,而且优于使用词根信息和同义词典进行近义词匹配的METEOR方法。  相似文献   

17.
译文质量的自动评价对机器翻译研究具有十分重要的意义。但现有方法主要是针对书面语翻译,没有考虑到口语翻译的特征。因此,本文提出了一种面向口语的新型的自动评价方法,通过定义信息段、标注权重和设计多种匹配策略等方法,使自动评价结果与人工打分更为接近,同时也提高了评价过程对不同输出译文的适应能力。各项实验表明,该算法对译文质量变化具有较高的敏感度,而且可以对输出译文质量作出与手工评判较为接近的评价结果。  相似文献   

18.
本文将影像组学的方法和机器学习算法结合起来,对脑部胶质瘤进行分级预测。利用BraTS2019公开数据集,从多模态MRI图像中分别提取肿瘤的448维影像组学特征:肿瘤形态学特征、一阶灰度特征、纹理特征等;然后通过最小绝对收缩和选择算子(Lasso)算法筛选出15个最佳的影像组学特征;最后根据筛选出的最佳特征集,利用随机森林分类算法构建脑部胶质瘤的分级预测模型。基于机器学习建立的模型在训练组患者中预测胶质瘤级别的准确率达到95.6%,ROC曲线下面积(AUC)达到0.99;在验证组患者中预测胶质瘤级别的准确率达到89.3%,AUC达到0.96。可见,基于机器学习算法,利用影像组学的方法可以对脑部肿瘤的高低级别进行准确的预测和分类。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号