首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 187 毫秒
1.
张晓博  杨燕  李天瑞  陆凡  彭莉兰 《计算机应用》2020,40(10):3088-3094
针对多发于老龄人群的帕金森病(PD)的早期智能化诊断的问题,提出基于医疗检测文本信息数据的聚类技术来对PD进行分析预测。首先,对原始数据集进行预处理以获取有效特征信息,并通过主成分分析(PCA)方法将原始特征分别降维到8个不同维度的维度空间;然后,应用5个传统的经典聚类模型和3种不同的聚类集成方法分别对8个维度空间的数据进行聚类;最后,采用4个聚类性能指标来预测数据集中的多巴胺异常PD患者、健康体和无多巴胺缺失(SWEDD) PD患者。仿真结果显示,PCA特征维度值取30时,高斯混合模型(GMM)的聚类准确度达到89.12%;PCA特征维度值取70时,谱聚类(SC)的聚类准确度达到61.41%;PCA特征维度值取80时,元聚类算法(MCLA)的聚类准确度达到59.62%。对比实验结果表明,5种经典聚类方法中,PCA的特征维度值小于40时,高斯混合模型聚类效果最佳;3种聚类集成方法中,对于不同的特征维度,MCLA的聚类性能均表现优异,进而为PD的早期智能化辅助诊断提供了技术和理论支撑。  相似文献   

2.
为了解决无线传感器网络中的不确定数据,提出了一种无线传感器网络不确定数据高效处理算法.根据不确定性数据的概率密度分布进行概率聚类,并利用Hilbert编码技术将多维数据映射到一维数据空间,通过基于Hilbert-R树索引的不确定性数据HPDBSCAN算法对不确定性数据进行聚类.实验结果表明,HPDBSCAN算法预处理效果较好,比其它聚类算法更适合不确定性数据的聚类.  相似文献   

3.
张晓博  杨燕  李天瑞  陆凡  彭莉兰 《计算机应用》2005,40(10):3088-3094
针对多发于老龄人群的帕金森病(PD)的早期智能化诊断的问题,提出基于医疗检测文本信息数据的聚类技术来对PD进行分析预测。首先,对原始数据集进行预处理以获取有效特征信息,并通过主成分分析(PCA)方法将原始特征分别降维到8个不同维度的维度空间;然后,应用5个传统的经典聚类模型和3种不同的聚类集成方法分别对8个维度空间的数据进行聚类;最后,采用4个聚类性能指标来预测数据集中的多巴胺异常PD患者、健康体和无多巴胺缺失(SWEDD) PD患者。仿真结果显示,PCA特征维度值取30时,高斯混合模型(GMM)的聚类准确度达到89.12%;PCA特征维度值取70时,谱聚类(SC)的聚类准确度达到61.41%;PCA特征维度值取80时,元聚类算法(MCLA)的聚类准确度达到59.62%。对比实验结果表明,5种经典聚类方法中,PCA的特征维度值小于40时,高斯混合模型聚类效果最佳;3种聚类集成方法中,对于不同的特征维度,MCLA的聚类性能均表现优异,进而为PD的早期智能化辅助诊断提供了技术和理论支撑。  相似文献   

4.
一种特征加权的聚类算法框架   总被引:3,自引:0,他引:3  
高滢  刘大有  徐益 《计算机科学》2008,35(10):152-154
为了考虑数据各维特征对聚类的不同贡献,并把有监督特征评价方法应用到无监督分类问题中,提出一种特征加权的聚类算法框架.该框架首先通过某种聚类算法对数据聚类,然后,根据聚类结果,采用有监督特征评价方法学习各维特征的权值,再根据特征权值重新聚类,之后再次学习特征权值,该过程反复迭代,直至算法收敛或达到指定的迭代次数.欧几里德空间内基于距离、基于密度的聚类算法均适用于本框架.基于本框架,采用模糊C均值聚类算法(FCM)、密度聚类算法(DBSCAN),并通过信息增益特征评价、ReliefF特征评价方法,对多个UCI数据集进行了实验,验证了该框架的有效性.  相似文献   

5.
为了提高医疗技术水平,加快医务人员对医疗信息数据的分析,使医疗信息数据运行更加顺畅,减少数据存储所占空间,需要对医疗信息数据存储系统进行设计;当前的医疗信息数据存储系统对医疗信息数据进行存储时,利用FPGA构建系统硬件,以硬件为基础将医疗信息数据存储,但在存储过程中,没有将冗余数据清除,导致存储空间易满,容量变小,存在正常医疗信息数据无处安放的问题;为此,提出一种基于模糊处理的医疗信息数据存储系统设计方法;该方法首先对医疗信息数据的来源进行统计,根据数据来源实现医疗数据的硬件构造,然后利用医疗信息数据中特征相似数据间的中介点实现数据聚类,完成对医疗信息数据的聚类存储,最后采用高斯混合模型对冗余医疗数据进行特征分析,以分析结果为基础,利用分数阶Fourier变换对冗余医疗信息数据进行删除操作,由此完成了基于模糊处理的医疗信息数据存储;实验结果证明,所提方法增加数据存储空间容量,减少对冗余数据的存储,加快医疗信息数据的存储速度,提高数据存储精度,为该领域研究发展提供强有力的依据。  相似文献   

6.
赵娇 《传感技术学报》2022,35(12):1686-1690
海量高维传感器数据受网络环境扰动较大,导致其异常值检测难度较大,提出基于BIRCH聚类算法的高维传感器数据异常检测方案。推算节点对应的一阶差分信号序列,信号矢量通过多跳路由传输至网关节点,将空间相关性强的传感器节点划分在同一簇内,采集完整的高维传感器数据;利用分割点预设得到传感器数据特征属性候选分割点,挑选信息增益最大的点为最佳分割点;将传感器数据序列的中位数异常看作异常检测判定条件,利用BIRCH聚类算法中的聚类特征和聚类特征树计算节点特征属性,将数据聚类结果拟作球形簇状架构,输出高维传感器数据序列异常数据。仿真结果证明,该方法的异常节点检测的检出率在95%以上,误报率为0.35%,异常检测耗时在1.5min以内。  相似文献   

7.
在对于多源不确定性信息进行分析时,需要根据其来源对信息分类.本文研究以证据形式表达的多源信息聚类问题,详细分析证据聚类的评价标准,提出将证据空间向欧氏空间转化,利用硬c-均值聚类法对多源不确定性信息聚类.基于以上理论,给出一个利用多源传感器ESM实现空中目标跟踪的实例.  相似文献   

8.
针对无线传感器网络节点定位场景中的环境变化、障碍物及传感器节点失效等异常问题, 提出了一种基于空间关联性的聚类异常检测算法(ODCASC算法)。该算法通过聚类技术完成节点的异常数据判断, 同时还利用邻居节点间感知数据的空间关联性过滤噪声数据, 提取异常事件信息, 辅助系统决策。室内实测结果显示, ODCASC算法弥补了时空关联检测算法的不足, 可以有效地检测并区分网络中的环境噪声及异常事件。  相似文献   

9.
多源数据关联问题是无线传感器网络中多传感器数据融合的关键技术之一。联合概率数据关联算法是一种 跟踪多目标的数据关联算法,它不需要任何关于目标和杂波的先验信息,但与其他有关数据关联算法相比,计算机开 销大。基于聚类算法的联合概率数据关联算法在联合概率数据关联算法的基础上,运用模式识别中的聚类思想对传 感器所接收到的量测数据进行聚类,减少有效量测的数目,从而简化了有效矩阵,减少了原有算法的计算量。  相似文献   

10.
针对传统的基于网格密度的数据流聚类方法丢失数据的空间位置特性的缺陷,提出了一种基于质量估算(mass estimation)的空间数据流聚类方法。通过 树进行空间划分,可将到达数据映射到不同的划分区域,在树得到质量(mass)的基础上,进行各子区域的密度推算的同时引入衰减因子,以及在线动态维护微簇,可精确反映空间数据流的演化信息。该方法在真实数据与模拟数据的综合试验中验证了算法的聚类效果与高效率性,并通过与传统数据流聚类算法的对比,进一步体现出其在聚类效果上的优势。该方法能够在保证较低的时间复杂度的基础上,更好的保留了数据的空间位置特性,因而能够更好的适应空间数据流聚类的需求。  相似文献   

11.
随着眼动追踪技术的进步和设备成本的降低,眼动追踪技术已广泛应用于智能教育领域,分析眼动数据以评估学习状态成为智能教育中一个十分重要的环节。眼动扫描路径可以直接或间接地反映思维模式及心理状态的变化,通过分析扫描路径探索学习者眼动行为的共性和差异性,为改善视觉内容和给出指导性意见提供重要参考。首先研究在同一任务情况下学习者扫描路径的时间序列表示和聚类,通过聚类结果评估专注、走神及信息迷航等三种学习状态。进而对重心平均动态时间规整(DTW?barycenter averaging,DBA)算法进行改进,并用于提取群体眼动模式,结合动态时间规整(dynamic time warping,DTW)算法计算扫描路径的相似度和确定聚类种子,采用距离密度聚类(distance density clustering,DDC)算法进行聚类。实验表明,基于时间序列的眼动模式挖掘能够识别群体观看行为。而聚类揭示了不同的阅读策略,并提供了评估学习状态的能力。  相似文献   

12.
吴永龙  符茂胜  罗斌 《计算机工程》2011,37(18):281-283
提出一种基于关联图谱的视频片段聚类方法。构造视频片段的关联图并将其转换成邻接矩阵,提取邻接矩阵的主分量特征值、模间邻接矩阵和模间距离后,将三者分别嵌入主成分分析和独立成分分析模式空间中,利用k-means进行聚类分析。实验结果表明,该方法能有效区分不同类型的视频片段。  相似文献   

13.
李亚非  曹长虎 《计算机工程》2011,37(16):167-169
为充分发挥粒子群优化算法和遗传算法各自的优势,提出一种新的基于粒子群和遗传算法的协同进化算法,并将其应用于聚类分析。通过构建2个相互竞争的种群,采用相对适应度度量方法,在一个纯自举的过程中产生最优竞争个体。在现实世界数据集上的仿真实验表明,该算法在收敛精度方面优于基于遗传算法的聚类方法和基本粒子群优化聚类算法。  相似文献   

14.
支持向量机在训练过程中,将很多时间都浪费在对非支持向量的复杂计算上,特别是对于大规模数据量的语音识别系统来说,支持向量机在训练时间上不必要的开销将会更加显著。核模糊C均值聚类是一种常用的典型动态聚类算法,并且有核函数能够把模式空间的数据非线性映射到高维特征空间。在核模糊C均值聚类的基础上,结合了多类分类支持向量机中的一对一方法,按照既定的准则把训练样本集中有可能属于支持向量的样本数据进行预选取,并应用到语音识别中。实验取得了较好的结果,该方法有效地提高了支持向量机分类器的学习效率和泛化能力。  相似文献   

15.
针对城市道路交通状态影响因素多、判别难的特点,在分析K-均值聚类算法和概率神经网络(PNN)的基础上,利用多源检测信息的互补性,提出一种基于快速全局聚类分析的概率神经网络集成模型,通过聚类提高集成网络间的差异度,同时利用主成分分析(PCA)优化概率神经网络结构,仿真实验表明该模型与传统的集成方法Bagging相比,能够利用更简单的网络结构,快速有效地识别出城市道路交通状态,为交通预警和诱导策略的制定提供数据依据。  相似文献   

16.
为提高无线传感器网络(Wireless Sensor Networks,WSNs)数据处理效率和降低网络能耗,提出了一种基于自适应智能优化和分簇压缩感知的WSNs稀疏数据采集方案。首先,建立分簇WSNs稀疏数据通信模型,通过定量分析节点密度与网络数据通信总跳数的关系,给出网络自适应分簇结果,并采用簇内观测矩阵测量数据获取和簇间多跳通信方式完成WSNs压缩感知数据采集;其次,采用StOMP算法进行稀疏信号重构,针对网络节点数据包丢失等链路不可靠情况,引入相关性矩阵变换策略,以降低错误数据传输对数据重构的影响,针对数据稀疏度未知特性和StOMP算法参数配置难的缺陷,将一种新型自适应智能优化(Improved Adaptive Intelligent Optimization algorithm,IAIO)算法应用于CS重构算法中,在理论分析IAIO全局寻优能力的基础上,实现对稀疏数据的可靠重构。最后,仿真结果表明,该方案能够实现稀疏信号的精确重构,而且降低了网络通信总量,提高了网络生存时间。  相似文献   

17.
模糊C均值算法(FCM)是一种用于聚类的最流行的技术。不过,传统的FCM使用欧氏距离作为数据集的相似准则,从而导致数据集的划分有相等的趋势。而数据集的形状和簇的密度对聚类性能有高度影响。为了解决这个问题,提出基于簇密度的距离调节因子以修正相似性度量。同时,针对模糊C-均值(FCM)聚类算法对初始聚类中心选择敏感,易陷入局部最优的问题,采用量子粒子群优化算法以获取全局最优解。仿真实验证明,改进的聚类算法(QPSO-FCM-CD)具有良好的性能。  相似文献   

18.
针对目前交通拥堵致使出行打车难的问题,设计并实现一种基于云计算的手机智能出租车呼叫系统。该系统由云服务器和Android手机客户端组成,服务器利用云计算环境下的Map-Reduce并行编程模型对K-means聚类算法实施并行化,提高推送信息的质量和效率;客户端分别利用LocationClient、MapView和MKOfflineMap接口实现定位服务、图层展示更新和百度离线地图服务功能,通过Android智能手机平台为用户提供及时、准确的信息服务。在客户端和服务器之间,利用RPC服务推送Protocol Buffer协议序列化的信息。实验结果表明,与滴滴打车软件相比,该系统的搜索推荐效率提高了20%左右,离线地图展示及定位流量比在线方法减少了90%以上,快速响应性能较好。  相似文献   

19.
针对模糊C均值(Fuzzy C-Means,FCM)聚类算法对初始聚类中心和噪声敏感、对边界样本聚类不够准确且易收敛于局部极小值等问题,提出了一种K邻近(KNN)优化的密度峰值(DPC)算法和FCM相结合的融合聚类算法(KDPC-FCM)。算法利用样本的K近邻信息定义样本局部密度,快速准确搜索样本的密度峰值点样本作为初始类簇中心,改善FCM聚类算法存在的不足,从而达到优化FCM聚类算法效果的目的。在多个UCI数据集、单个人造数据集、多种基准数据集和Geolife项目中的6个较大规模数据集上的实验结果表明,改进后的新算法与传统FCM算法、DSFCM算法对比,有着更好的抗噪性、聚类效果和更快的全局收敛速度,证明了新算法的可行性和有效性。  相似文献   

20.
各种集成位置服务(LBS)的社交和旅游类APP的广泛应用,产生了大量轨迹空间数据,利用这些轨迹数据挖掘游客聚集密度高的热门景点区域,对景区的智慧服务和应急管理具有重要意义。为此,提出了一种基于轨迹停留点空间聚类的景区热点分析方法。重点研究了聚类速度快、能处理噪声、可以发现空间任意形状聚簇的DBSCAN算法,针对其参数需人工选择的不足,提出了一种根据数据统计分布特性来自适应确定参数的改进方法。分别采用人工合成二维数据集、四维Iris真实数据集和景区轨迹停留点三种不同的数据进行了DBSCAN聚类分析及对比实验,结果表明该方法可以自动产生合理的聚簇划分,优于传统DBSCAN和k-means等算法。最后,依据轨迹停留点的空间聚类结果,在ArcGIS软件中实现Getis-Ord Gi*热点分析与制图,并依据分析结果对不同旅游景点进行热度分级,形成的热门景点分布与景区掌握的实际热度信息基本一致,证实了提出方法的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号