排序方式: 共有52条查询结果,搜索用时 79 毫秒
41.
《Planning》2016,(26)
以统计学的教学经验为基础,利用其存在的弊端,提出了采用专题研讨式教学法,把教师和学生有机地结合起来,突出学生自主运用知识、解决具体实际问题的能力。文章介绍了专题研讨式教学法的实施环节,以及需要注意的问题和准备工作,在教学上具有一定的参考价值。 相似文献
42.
偏最小二乘判别分析(partial least squares discriminant analysis,PLS-DA)是一种线性分类方法,不能充分表达数据之间的非线性关系,难以适应非线性数据的分类识别。针对该问题,结合softmax回归能够表达非线性特征,提出融合softmax回归的偏最小二乘判别分析算法(PLS-S-DA)。为了验证PLS-S-DA对非线性数据的有效性,以准确率、运行时间、查准率、查全率和◢F◣▼1▽-score为评价指标,采用四组UCI数据集和中药寒热药性数据集测试PLS-S-DA的性能,并与PLS-DA等五种分类算法对比。结果表明,对具有非线性特征的数据,PLS-S-DA相比于其他算法有更高的准确率,并对寒药和热药有更强的识别能力。 相似文献
43.
中文实体关系抽取是开放域文本检索与知识发现的研究热点,传统的抽取策略普遍存在人工标注量大,模式通用性受限,关系抽取粒度相对固定等问题,限制了其在开放领域的关系抽取效果。基于概念的结构分层和关系连通,面向中文实体关系构建了谓词概念模型(predicate concept model,PCM),在此基础上,提出了增量学习的谓词概念获取策略PCIA和基于谓词概念连通的关系抽取策略PCCS,由此进行了开放域非紧密的、远距离实体关系的抽取。各谓词概念的构建相对独立,概念组合更为灵活,对关系的描述具有更好的通用性和可解释性,为开放域未知关系的识别与抽取提供了有效手段。实验结果表明,PCCS有效提升了中文实体识别及实体连通路径选择的质量,获得了良好的关系抽取性能。 相似文献
44.
针对以信息增益为划分标准的ID3算法中存在偏向属性取值多的属性等问题,提出了一种融合GINI指数的ID3改进算法。计算每个属性的信息增益和对应的GINI指数值,并计算所有属性的GINI指数算术平均值,筛选GINI指数低于算术平均值的属性记为候选属性集;从候选属性集中选择信息增益最大的属性建立分支,用递归方法构建决策树。实验使用6组UCI数据集进行验证。结果表明:该决策树的准确率均有所提高,对多值偏向问题有很好的克服作用。 相似文献
45.
针对随机森林分类效果受样本集类间不平衡、类内不规则的影响,提出一种聚类欠采样策略的随机森林优化方法。该方法对原始数据大类样本聚类,得到与小类样本个数相同的子类簇;从每个子类簇中随机有放回抽取一个样本与小类样本合并,形成平衡样本集;对平衡样本集进行有放回随机抽样,形成单棵决策树的训练样本集并完成建树;将两次未被抽中的样本作为袋外数据,用于模型测试;重复上述过程多次,形成随机森林。使用10组非平衡数据集进行实验验证,结果表明,该方法在这10组数据集上的分类能力及稳定性均优于传统随机森林。 相似文献
46.
对于小样本图像数据集往往采用图像增强的方法扩充数据量增加实验的合理性,图像增强算法能够提高图像整体和局部的对比度,突出图像的细节信息,使图像更符合人眼的视觉特性且易于机器识别。为了深入研究图像增强应用的新思路、新方向,从图像增强算法的基本原理出发,归纳总结了近年来应用比较广泛的空域和频域两大类图像增强算法,包括直方图均衡图像增强算法、灰度变换图像增强算法、空域滤波图像增强算法和频域滤波图像增强算法,分别详细介绍了它们的基本概念和相关定义并简述了其浅层面的优缺点。另外采用主观和客观的评价方法对这些算法的增强效果进行了对比和分析,并对各算法的优缺点、适用场景和复杂度进行了对比分析,以更深入研究各个图像增强算法的隐含有用信息,以找出鲁棒性、适用性更强的图像增强方法。实验结果表明,不同的算法都具有各自的特点,针对不同的图像效果不同,增强对比度更适宜采用空域图像增强方法,突出细节更适宜采用频域图像增强方法。单一的方法无法满足图像处理的需要,优势结合的图像增强算法更有研究意义。对这些算法的深入研究能够为研究者带来新的契机,拓展新的研究方向,推动整个图像增强技术高水平发展,使图像增强技术在多个学科领域发挥重要作用。 相似文献
47.
48.
电子病历命名实体识别(named entity recognition,NER)旨在识别电子病历文本中的医疗实体,并将其归为预定义的医疗实体类别,为进一步的医疗关系抽取、医疗信息检索、医疗智能问答等自然语言处理任务提供支持。系统梳理了电子病历命名实体识别的定义、标注方法、评价指标及难点;从电子病历命名实体识别难点及技术发展历程两个角度,综述了每类电子病历命名实体识别方法的优势与不足;详细梳理了国内医疗领域命名实体识别的评测任务及数据集;详细讨论和总结电子病历命名实体识别每一类难点的解决方案;总结全文并展望了医疗领域命名实体识别的发展方向。 相似文献
49.
特征的相关和冗余,会直接影响随机森林随机抽取特征的质量,导致随机森林的收敛性减弱,降低随机森林模型的准确度、泛化能力及性能。基于此,提出一种融合近似马尔科夫毯的随机森林优化算法,该算法利用近似马尔科夫毯构建相似特征组,再从每个相似组中按比例抽取特征形成单棵决策树的特征子集,重复上述过程直至达到随机森林规模。该算法可以在保证随机森林特征的多样性前提下,利用近似马尔科夫毯消除特征间的相关性和冗余性,提高随机抽取特征的质量。通过在12组不同维度UCI数据集实验对比表明:融合近似马尔科夫毯的随机森林在一定程度上可以消除特征相关性和冗余性,提高模型的各项评价指标,泛化能力增强,更适用于高维数据。 相似文献
50.
深度学习框架Transformer具有强大的建模能力和并行计算能力,目前基于Transformer的目标检测算法已经成为研究的热点。为了进一步探索目标检测的新思路、新方向,对基于Transformer的目标检测算法进行了归纳总结。概述了多种目标检测数据集及其应用场景,从特征学习、目标估计、标签匹配策略和算法应用四方面梳理了Transformer目标检测的相关算法,并与基于卷积神经网络的目标检测算法进行对比,分析了Transformer在目标检测任务中的优点和局限性,并提出了Transformer目标检测模型的一般性框架。对Transformer在目标检测领域中的发展趋势进行了展望。 相似文献