首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 171 毫秒
1.
陈鹏  邹涛 《计算机系统应用》2015,24(12):243-248
针对被动毫米波(PMMW)图像成像质量差,边界模糊,不易识别的特点,在传统词袋模型图像分类的基础上,提出了利用减法聚类改进FCM聚类算法并将其运用到词袋模型上去,提取视觉单词,利用局部不变量SIFT方法对手枪、匕首和炸药进行了粗分类.实验结果证明,改进的词袋模型能够准确的对违禁品进行分类,识别率平均能达到90%以上,性能优于传统的K均值聚类和原始的FCM聚类算法.  相似文献   

2.
词共现文本主题聚类算法   总被引:1,自引:0,他引:1  
文本主题是文本聚类的关键,而文档中共现词对对文档主题的表现力非常强.因此,在对现有文本主题挖掘和共现词对抽取算法深入研究的基础上,提出了一种基于关联规则词共现的文本主题聚类算法(TCABARWC),即首先采用关联规则挖掘算法抽取文档共现词对,利用词共现提取文本主题信息,然后根据共现词对建模并实现共现词对相似度量,最后结合层次聚类算法实现文本聚类.实验结果表明,相比其他聚类算法,基于关联规则共现词对的层次聚类算法,大大降低了文本向量的维度以及算法复杂度,在聚类效率和准确性上都有显著提高,并获得了较好的聚类效果.  相似文献   

3.
高脂血症的辨证分型标准化研究是中医基础研究的热点与难点,利用计算机挖掘技术中的聚类算法对高脂血症临床中医症状数据进行分析,得到具有统计学意义的分类结果,同时寻找其与中医证候相对应的关系具有重要研究价值.通过编写适用于中医证候分类的聚类算法并提供设置相似度阈值等交互界面,实现了大规模样本的自适应分类,从而使聚类结果更加科学客观.将得到的每个类别中所对应样本的病症特征与所属中医的证候类别联系起来,为辨证分型标准化奠定了基础.  相似文献   

4.
针对微博文本内容短、稀疏、高维等特点,提出一种改进的半监督微博聚类算法。该算法利用词项间的关系丰富文本特征,通过定义词项文档间关联关系和词项文档内关联关系揭示词项间语义的关联程度,并由此自动生成有标记的数据来指导聚类过程。对词项先验信息进行成对约束编码,构建基于词项间成对约束的三重非负矩阵分解模型来实现微博的半监督聚类。实验结果表明,该算法可以减少繁琐的人工标记过程,并能高效地进行微博聚类。  相似文献   

5.
网络热点话题提取是网络舆情分析的重要手段,已成为信息检索领域研究的热点内容之一.传统聚类方法因其聚类结果不允许相交等因素,暴露了其在基于(主题)词聚类进行话题发现中的诸多缺点.本文基于小世界理论建立词的共现网络模型并去除大量冗余词,然后运用极大相容块技术并基于过滤后的词共现网络实现对相交话题的提取,获取网络热点话题.本文方法与传统聚类方法有本质区别,基于(主题)词聚类进行话题发现具有独特的优势,较好克服了已有方法的缺点.实验说明了本文方法对提取网络热点话题是有效和可行的,比同类算法具有更好的性能,且具有较好的可伸缩性.  相似文献   

6.
针对传统向量空间模型中的特征项孤立处理问题,首先通过χ2统计和特征聚类相结合的模式实现特征降维,然后使用图模型来建立词和词之间相互关联信息,最后运用KNN方法进行文档分类测试。该算法提高了稀有词对分类的贡献,强化了关联词的分类效果,并降低了文档向量的维数。实验证明,该算法提高了分类的准确率和召回率。  相似文献   

7.
通过计算机实现对文本主题合理提取、组合的过程,很多学者对此有着不同的研究.通过空间向量模型、文本聚类、遗传算法等成熟的技术尝试一种新的文本摘要方法.实验中通过空间向量模型的技术将文本表示成向量形式,通过聚类算法计算文本各种聚类的可能性,利用遗传算法全局寻优的特点对聚类结果进行计算、组合得到最优的文本摘要划分,最后通过实验,并让专家对实验结果进行打分证明方法的有效性.  相似文献   

8.
提出一种基于非负矩阵分解(NMF)的双重约束文本聚类算法。在正交三重NMF模型中,加入文本空间的成对约束信息和词空间的类别约束信息,将不同的特征词项进行分类。利用迭代规则对原始的词-文档矩阵进行分解,获得文本聚类结果。与多种传统半监督文本聚类算法的对比结果表明,该算法具有较高的聚类精度,能提供更准确和有效的聚类结果。  相似文献   

9.
为了实现在线推荐信息服务,要对网络号百用户的访问行为进行分析,荻取用户访问聚类模型,从而在聚类模型的基础上进行在线推荐.介绍获取用户访问路径信息的方法,对用户访问路径信息建立相似度矩阵,基于相似度矩阵改进K-means算法,据此进行用户模型聚类,给出分析案例,并说明算法实现过程.  相似文献   

10.
为了压缩基于词的统计语言模型的参数空间,以便构造模型空间更加紧密的ClassN-gram模型,该文研究了汉语词的自动聚类技术,提出了一种基于评价函数的汉语词的聚类算法,该算法采用词的相似度理论,并通过构造词的启发式候选词类链表,极大提高了聚类算法的工作效率。  相似文献   

11.
化工事故发生的根原因多是由人的不安全行为、机械或物的不安全状态等引发,其本质是企业管理上的缺陷。挖掘根原因间、根原因与事故间的关联关系是预防事故、提升企业安全管理水平的关键。由于事故调研根原因分析与安全管理指标体系存在稀疏关联现象,难以挖掘管理缺陷与事故演化间的关联关系。为此,本文通过协同过滤算法填补事故调研中缺失的评分数据;基于加权支持度计数的关联规则算法挖掘事故根原因间、根原因与事故属性间的强关联规则。实验结果表明,基于加权支持度的关联分析算法相比于现有的算法,能推荐更多危险程度高的企业潜在安全隐患及安全隐患与事故间的演化关联,从而能科学指导企业安全生产,实现面向生产过程的风险预警和事故预防。  相似文献   

12.
针对煤矿井下环境复杂、瓦斯爆炸事故频发、矿难事故搜救难度大等问题,设计一种基于ZigBee的矿井环境监测及人员定位系统。通过传感器采集井下温、湿度和瓦斯浓度等环境参数,采用CC2530构建数据传输及人员定位网络,将RSSI测距定位技术和三边定位算法相结合,实现井下工作人员的实时定位。根据井下环境的特点,采用均值滤波算法对RSSI值进行修正,提高了定位精度。实验结果表明,该系统环境参数监测准确、网络通信通畅可靠、人员定位精度较高,可满足煤矿安全生产管理及矿难事故搜救的需要。  相似文献   

13.
Reducing accident severity is an effective way to improve road safety. In this article, a novel multiobjective particle swarm optimization (MOPSO)-based partial classification method is employed to identify the contributing factors that impact accident severity. The accident dataset contains only a few fatal accidents but the patterns of fatal accidents are of great interest to traffic agencies. Partial classification can deal with the unbalanced dataset by producing rules for each class. The rules can be evaluated by several conflicting criteria such as accuracy and comprehensibility. A MOPSO is applied to discover a set of Pareto optimal rules. The accident data of Beijing between 2008 and 2010 are used to build the model. The proposed approach is compared with several rule-learning algorithms. The results show that the proposed approach can generate a set of accurate and comprehensible rules, which can indicate the relationship between risk factors and accident severity.  相似文献   

14.
故障树的割集分析技术是判定事故原因的常用技术,然而,基于割集的技术仅能通过基本事件的组合判定事故的发生,无法分析事故演化过程的中间事件.本文针对事故分析报告描述的事故成因机理,结合文本分类和故障树分析技术,提出一种面向故障树的事故报告分类方法,实现面向事故演化路径的事故报告的因果定位,能够自动关联事故报告与故障树结构演化信息,实现借鉴专家经验的事故因果演化的精确分析.  相似文献   

15.
单冬红  史永昌  赵伟艇  张敬普 《计算机科学》2017,44(5):166-169, 188
为了提高云数据的安全存储性能,需要对数据进行优化属性聚类归集。针对传统方法采用模糊C均值聚类进行云数据存储归类设计具有对初始聚类中心敏感、容易陷入局部收敛的问题,提出一种基于分段融合模糊聚类的云数据安全存储模型构建方法。建立云数据安全存储的网格分布结构模型并进行数据结构分析,进行云数据属性集的向量量化特征分解,对海量的云存储数据流采用分段匹配检测方法进行特征压缩,实现冗余数据自适应归集合并,挖掘云数据信息流的高阶谱特征。在模糊C均值聚类算法的基础上采用分段数据融合进行数据分簇模糊聚类,提高数据存储的安全性,同时降低云数据存储的负荷。仿真结果表明,采用该方法进行云数据聚类和优化存储设计,能降低数据聚类的误分率,提高云数据存储的吞吐量,确保云数据的安全存储。  相似文献   

16.
运用数据挖掘技术进行铁路事故类型预测及成因分析, 对于建立铁路事故预警机制具有重要意义. 为此, 本文提出一种基于梯度提升决策树(Grandient boosting decision tree, GBDT)的铁路事故类型预测及成因分析算法. 针对铁路事故记录数据缺失的问题, 提出一种基于属性分布概率的补全算法, 最大程度保持原有数据分布, 从而降低数据缺失对事故类型预测造成的影响. 针对铁路事故记录数据类别失衡的问题, 提出一种集成的GBDT模型, 完成对事故类型的鲁棒性预测. 在此基础上, 根据GBDT预测模型中特征重要度排序, 实现事故成因分析. 通过在开放数据库上进行实验, 验证了本文模型的有效性.  相似文献   

17.
A case study including the discrimination of traffic accidents as accident free and accident cases on Konya-Afyonkarahisar highway in Turkey using the proposed hybrid method based on combining of a new data preprocessing method called subtractive clustering attribute weighting (SCAW) and classifier algorithms with the help of Geographical Information System (GIS) technology has been conducted. In order to improve the discrimination of classifier algorithms including artificial neural network (ANN), adaptive network based fuzzy inference system (ANFIS), support vector machine, and decision tree, using data preprocessing need in solution of these kinds of problems (traffic accident case study). So, we have proposed a novel data preprocessing method called subtractive clustering attribute weighting (SCAW) and combined with classifier algorithms. In this study, the experimental data has been obtained by means of using GIS. The obtained GIS attributes are day, temperature, humidity, weather conditions, and month of occurred accident. To evaluate the performance of the proposed hybrid method, the classification accuracy, sensitivity and specificity values have been used. The experimental obtained results are 53.93%, 52.25%, and 38.76% classification successes using alone ANN, ANFIS, and SVM with RBF kernel type, respectively. As for the proposed hybrid method, the classification accuracies of 67.98%, 70.22%, and 61.24% have been obtained using the combination of SCAW with ANN, the combination of SCAW with SVM (radial basis function (RBF) kernel type), and the combination of SCAW with ANFIS, respectively. The proposed SCAW method with the combination of classifier algorithms has been achieved the very promising results in the discrimination of traffic accidents.  相似文献   

18.
In this study, the traffic accidents recognizing risk factors related to the environmental (climatological) conditions that are associated with motor vehicles accidents on the Konya-Afyonkarahisar highway with the aid of Geographical Information Systems (GIS) have been determined using the combination of K-means clustering (KMC)-based attribute weighting (KMCAW) and classifier algorithms including artificial neural network (ANN) and adaptive network-based fuzzy inference system (ANFIS). The dynamic segmentation process in ArcGIS9.0 from the traffic accident reports recorded by District Traffic Agency has identified the locations of the motor vehicle accidents. The attributes obtained from this system are day, temperature, humidity, weather conditions, and month of occurred traffic accidents. The traffic accident dataset comprises five attributes (day, temperature, humidity, weather conditions, and month of occurred traffic accidents) and 358 observations including 179 without accident and 179 with accident. The proposed comprises two stages. In the first stage, the all attributes of dataset have been weighted using KMCAW method. The aims of this weighting method are both to increase the classification performance of used classifier algorithm and to transform from linearly non-separable traffic accidents dataset to a linearly separable dataset. In the second stage, after weighting process, ANN and ANFIS classifier algorithms have been separately used to determine the case of traffic accidents as with accident or without accident. In order to evaluate the performance of proposed method, the classification accuracy, sensitivity, specificity and area under the ROC (Receiver Operating Characteristic) curves (AUC) values have been used. While ANN and ANFIS classifiers obtained the overall prediction accuracies of 53.93 and 38.76%, respectively, the combination of KMCAW and ANN and the combination of KMCAW and ANFIS achieved the overall prediction accuracies of 74.15 and 55.06% on the prediction of traffic accidents. The experimental results have demonstrated that the proposed attribute weighting method called KMCAW is a robust and effective data pre-processing method in the prediction of traffic accidents on Konya-Afyonkarahisar highway in Turkey.  相似文献   

19.
危险化学品行业属于高危险性行业,各类爆炸、火灾、泄漏和中毒事故时有发生.传统的基于因果关系的事故链分析方法受限于传统安全工程所依赖的技术基础和假定无法适应于今天所建造的复杂系统.本文以事故致因理论为基础,分析危化品事故形成的主要影响因素,构建了危化品事故状态向量,全面描述导致危化品事故发生的因素,并基于构建的状态向量进行危化品事故分析预测应用.利用高维向量对事故状态进行了定义,尽最大可能考虑了造成事故发生的众多因素,并利用支持向量机学习算法,建立事故预测模型.对已掌握的危化品事故进行的样本实验表明,本文提出的危化品事故预测方法,可有效快速的甄别事故状态,对危化品行业事故的预测预防具有积极意义.  相似文献   

20.
采样技术与ELM分类算法进行结合可提高少数类样本的分类精度,但现有的大多数结合ELM的采样方法并未考虑到样本的不平衡程度及样本内部的分布情况,采样技术过于单一,导致分类模型的效率低下,少数类样本的识别率不高。针对此问题,提出了一种基于DPC聚类的重采样技术结合ELM的不平衡数据分类算法,首先根据数据集的不平衡程度分2种情况构建一个混合采样模型来平衡数据集;然后在此模型上运用DPC聚类算法分别对多数类样本和少数类样本进行分析处理,解决数据中存在的类内不平衡和噪声问题,使得2类样本相对均衡;最后使用ELM分类算法对得到的数据集进行分类。实验结果表明,与同类型分类算法进行比较,所提算法的2个分类性能指标在实验数据集上都有明显提升。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号