排序方式: 共有22条查询结果,搜索用时 140 毫秒
11.
针对动态时间弯曲(DTW)算法在提高计算速度同时不能兼顾分类正确率的问题,提出了一种基于朴素粒计算思想的弹性粗粒度动态时间弯曲(CG-DTW)算法。首先,通过计算时序方差特征的方法来获取较优的时序粒度,用粒度特征代替原始序列;其次,再代入执行DTW算法,允许动态调整被比较时序粒间的弹性大小,从而获得相对最优的时序对应粒;最后,在对应最优粒的情况下计算DTW距离。同时引入下界函数的提前终止策略进一步提高CG-DTW算法效率。实验结果表明,所提算法要比经典算法运行速率提高21.4%左右,比降维策略算法正确率提高近32.3个百分点,尤其是长序列的分类,CG-DTW能够在保持正确率的情况下兼顾较高的运行效率。CG-DTW在实际应用中能适应不确定长序列分类。 相似文献
12.
决策粗糙集理论中,三支决策代价目标函数是典型的单调线性函数.然而,在实践经验中经常发现延迟决策的代价与决策概率之间的函数关系往往呈现非单调特性,决策粗糙集理论的经典代价敏感三支决策模型无法对上述非单调现象进行直接的建模和推理,导致决策粗糙集理论的应用受到了限制.为了求解这种具有非单调延迟代价的代价敏感三支决策问题,提出一种新型分段延迟代价敏感三支决策模型.该模型定义了具有单调递增和单调递减特性的两组延迟决策损失函数,并结合经典正负域决策损失函数构造了分段延迟三支决策代价目标函数体系、度量指标和分段决策策略;然后,基于条件概率、损失函数及基础度量指标之间关系的4种分段延迟代价敏感三支决策分类模式被提了出来,并且对相应的三支分类阈值进行了推理;最后,通过一组典型实例,验证了分段延迟代价敏感三支决策模型及其三支分类是可行的. 相似文献
13.
概念格是一种数据分析和规则获取的有效工具,近年来概念格的应用和研究已逐渐成为数据分析领域的一个重要研究方向.当前随着信息技术的发展,流数据成为了大数据的重要组成部分,流数据知识挖掘中普遍存在的概念漂移已经成为近年来机器学习领域的热点问题.动态概念格的构造是概念格理论研究的重要研究任务,但是在流数据环境中进行概念格的概念漂移研究在学术界还没有展开.针对流数据环境中概念格的漂移问题,提出了一种面向滑动窗口法的概念格漂移计算方法.首先对滑动窗口中的流数据进行建模;然后对滑动窗口中的流入流出概念相同、流入流出概念不同、流入流出概念部分相交、流入概念包含流出概念和流出概念包含流入概念这五种现象分别进行推理研究;最后基于上述模型理论推理,提出面向滑动窗口法的概念格构造算法,并用实例说明了该算法的有效性和高效性. 相似文献
14.
鉴于混淆矩阵在机器学习算法性能评价领域的通用性,文中以混淆矩阵为基础构造概率粗糙集三支决策度量系统,给出部分度量指标之间的性质及其证明,提出基于混淆矩阵度量指标体系的多目标优化三支决策阈值求解模型.模型中多目标优化函数被视为不同三支决策度量指标的加权之和,而最优阈值的求解也获得一种新型的语义解释.最后通过实例演示模型如何确定接受与拒绝域阈值,同时对比Pawlak粗糙集方法,表明文中模型获得的三支决策能够更好地平衡决策的准确率与承诺率. 相似文献
15.
16.
快速、准确和全面地从大量互联网文本信息中定位情感倾向是当前大数据技术领域面临的一大挑战.文本情感分类方法大致分为基于语义理解和基于有监督的机器学习两类.语义理解处理情感分类的优势在于其对不同领域的文本都可以进行情感分类,但容易受到中文存在的不同句式及搭配的影响,分类精度不高.有监督的机器学习虽然能够达到比较高的情感分类精度,但在一个领域方面得到较高分类能力的分类器不适应新领域的情感分类.在使用信息增益对高维文本做特征降维的基础上,将优化的语义理解和机器学习相结合,设计了一种新的混合语义理解的机器学习中文情感分类算法框架.基于该框架的多组对比实验验证了文本信息在不同领域中高且稳定的分类精度. 相似文献
17.
ICU病人生死预测一直都是医学界的研究热点和难点。数据挖掘的机器学习方法近年来在该领域取得了一定的进展,但依然有很大的发展空间。针对ICU时序数据的高维度和不确定间隔采样特性,提出了不确定间隔采样转化为确定间隔的空采样的思想和相应的处理策略;在此基础上将传统的时间序列聚类与机器学习方法相结合,提出了一个两阶段的混合多机器学习算法框架,使得数据集的高维和不确定性得到了约简,从而可以采用经典的机器学习方法挖掘病人生死知识。在一个公开数据集上的两组实验结果表明,基于该算法框架的ICU病人死亡预测方法对于少数样本的分类效果优于传统方法,弹性时间间隔下的预测效果更好,最优时间间隔的选取可以通过实验效果来验证。 相似文献
18.
19.
20.
动态时间弯曲距离算法(DTW)是目前公认的最有效的时间序列相似性计算方法之一,但是较高的时间复杂度一直是其主要缺点。快速弯曲距离算法(FTW)能有效提高DTW的计算速度,但是该算法对不同粒度时间序列剪枝的行为是典型的二支决策,与人类处理不确定问题时普遍采用的三支判断不同。因此,通过将三支决策理论引入到DTW算法的优化工作中,建立了DTW三支决策模型;然后对DTW三支决策模型中的决策阈值α和β进行了基于误识别率的推导,并且给出了具体求解阈值α和β的模拟退火算法;最后基于上述理论提出了基于弯曲距离三支决策的时序相似性算法(3WD-DTW)。通过对比实验表明,与FTW算法相比,3WD-DTW算法在保持较快的计算速度的前提下明显提升了计算准确度,使其接近DTW的水平。 相似文献