首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 156 毫秒
1.
针对网络中海量的Web服务聚类时,因其表征数据稀疏而导致使用传统建模方法所获效果不理想的问题,提出了一种基于BTM主题模型的Web服务聚类方法。该方法首先利用BTM学习整个Web服务描述文档集的隐含主题,通过推理得出每篇文档的主题分布,然后应用K Means算法对Web服务进行聚类。通过与LDA、TF IDF等方法进行对比发现,该方法在聚类纯度、熵和F Measure指标上均具有更好的效果。实验表明,该方法能够有效解决因Web服务描述所具有的短文本性质而导致的数据稀疏性问题,可显著提高服务聚类效果。  相似文献   

2.
针对多扩展目标跟踪过程中量测集划分准确度低和计算量大的问题,提出一种基于改进K-means++聚类划分的高斯混合假设密度强度多扩展目标跟踪算法。首先,根据下一时刻目标可能变化的情况缩小K值的遍历范围;其次,利用目标预测状态选择初始聚类中心点,为正确划分量测集提供依据,从而提高聚类算法的精度;最后,将所提改进K-means++聚类划分方法应用到高斯混合概率假设滤波器中,联合估计多目标的个数和状态。仿真实验结果表明:与基于距离划分和基于K-means++的多扩展目标跟踪算法相比,该算法在平均跟踪时间上分别减小了59.16%和53.25%,同时其最优子模式指派度量(OSPA)远小于以上两种算法。综上,该算法能在大幅度降低计算复杂度的同时取得比现有量测集划分方法更为优异的跟踪性能。  相似文献   

3.
郝美薇  戴华林  郝琨 《计算机应用》2017,37(10):2946-2951
针对传统的K-means算法无法预先明确聚类数目,对初始聚类中心选取敏感且易受离群孤点影响导致聚类结果稳定性和准确性欠佳的问题,提出一种改进的基于密度的K-means算法。该算法首先基于轨迹数据分布密度和增加轨迹数据关键点密度权值的方式选取高密度的轨迹数据点作为初始聚类中心进行K-means聚类,然后结合聚类有效函数类内类外划分指标对聚类结果进行评价,最后根据评价确定最佳聚类数目和最优聚类划分。理论研究与实验结果表明,该算法能够更好地提取轨迹关键点,保留关键路径信息,且与传统的K-means算法相比,聚类准确性提高了28个百分点,与具有噪声的基于密度的聚类算法相比,聚类准确性提高了17个百分点。所提算法在轨迹数据聚类中具有更好的稳定性和准确性。  相似文献   

4.
杨天鹏  陈黎飞 《计算机应用》2018,38(10):2844-2849
针对传统K-means型算法的"均匀效应"问题,提出一种基于概率模型的聚类算法。首先,提出一个描述非均匀数据簇的高斯混合分布模型,该模型允许数据集中同时包含密度和大小存在差异的簇;其次,推导了非均匀数据聚类的目标优化函数,并定义了优化该函数的期望最大化(EM)型聚类算法。分析结果表明,所提算法可以进行非均匀数据的软子空间聚类。最后,在合成数据集与实际数据集上进行的实验结果表明,所提算法有较高的聚类精度,与现有K-means型算法及基于欠抽样的算法相比,所提算法获得了5%~50%的精度提升。  相似文献   

5.
杨威亚  余正涛  高盛祥  宋燃 《计算机应用》2021,41(10):2879-2884
针对汉越跨语言新闻话题发现任务中汉越平行语料稀缺,训练高质量的双语词嵌入较为困难,而且新闻文本一般较长导致双语词嵌入的方法难以很好地表征文本的问题,提出一种基于跨语言神经主题模型(CL-NTM)的汉越新闻话题发现方法,利用新闻的主题信息对新闻文本进行表征,将双语语义对齐转化为双语主题对齐任务。首先,针对汉语和越南语分别训练基于变分自编码器的神经主题模型,从而得到单语的主题抽象表征;然后,利用小规模的平行语料将双语主题映射到同一语义空间;最后,使用K-means方法对双语主题表征进行聚类,从而发现新闻事件簇的话题。实验结果表明,所提方法相较于面向中英文的隐狄利克雷分配主题改进模型(ICE-LDA)在Macro-F1值与主题一致性上分别提升了4个百分点与7个百分点,可见所提方法可有效提升新闻话题的聚类效果与话题可解释性。  相似文献   

6.
邹志文  秦程 《计算机应用》2021,41(3):733-737
现有的R-树空间聚类技术在通常通过随机指定或者计算空间数据间的欧氏距离来选取聚类中心,而未考虑空间数据间的主题相关度。这些导致聚类结果受初始k值影响,空间数据间的关联仅仅是基于地理位置的。针对此种情况,提出了一种基于k-means++的动态构建空间主题R树(TR-tree)方法。首先,在传统的k-means++算法上,通过聚类测度函数动态地确定k个聚类簇,并在聚类测度函数中引入潜在狄利克雷分布(LDA)模型来计算每个空间数据文本的主题概率,从而加强空间数据间的主题关联度;其次,通过主题概率选取概率最大的聚类中心;最后,构建TR-tree,并且在构建时动态分配空间数据。实验结果表明:虽然构建R-树的时间略有增加,但该方法在索引效率及节点间关联度上较仅仅基于地理位置聚类构建R-树的算法有明显提升。  相似文献   

7.
针对小区居民用电数据挖掘效率低、数据量大等难题,进行了基于云计算和改进K-means算法的海量用电数据分析方法研究。针对传统K-means算法中存在初始聚类中心和K值难确定的问题,提出一种基于密度的K-means改进算法。首先,定义样本密度、簇内样本平均距离的倒数和簇间距离三者乘积为权值积,通过最大权值积法依次确定聚类中心,提高了聚类的准确率;然后,基于MapReduce模型实现改进算法的并行化,提高了聚类的效率;最后,以小区400户家庭用电数据为基础,进行海量电力数据的挖掘分析实验。以家庭为单位,提取出用户的峰时耗电率、负荷率、谷电负荷系数以及平段用电量百分比,建立聚类的数据维度特征向量,完成相似用户类型的聚类,同时分析出各类用户的行为特征。基于Hadoop集群的实验结果证明提出的改进K-means算法运行稳定、可靠,具有很好的聚类效果。  相似文献   

8.
针对现有的基于统计特征的协议识别方法选择识别特征时未考虑不同协议个体之间的差异的问题,结合半监督学习和模糊子空间聚类(FSC)方法,提出了一种半监督子空间聚类协议识别方法(SSPIA)。首先,将有标签的样本流转化为成对约束信息,从而获取先验约束条件;其次,在此基础上提出半监督模糊子空间聚类(SFSC)算法,该算法利用约束条件指导子空间聚类过程;然后,建立类簇和协议类型的映射,以获取协议各个特征的权重系数,进而构建个体化的密码协议特征库用于后续协议识别;最后,针对5个典型的密码协议进行聚类效果和识别效果实验。实验结果表明,针对基于统计特征的协议识别问题,与传统K-means方法和FSC方法相比,所提SSPIA的聚类效果更好,且SSPIA构建的协议识别分类器更为精确,协议识别率更高,误识别率更低。所提SSPIA提高了基于统计特征的识别效果。  相似文献   

9.
在基于视角加权的多视角聚类中,每个视角的权重取值对聚类结果的精度都有着重要的影响。针对此问题,提出熵加权多视角核K-means(EWKKM) 算法,通过给每个视角分配一个合理的权值来降低噪声视角或无关视角对多视角聚类的影响,进而提高聚类的精度。EWKKM算法中,首先用核矩阵表示不同的视角,给每个视角分配一个权重;然后,利用信息熵计算出各个视角的熵权重;最后,按照定义的目标函数对各个视角的权重进行优化,使用核K-means进行多视角聚类。在UCI数据集及人工数据集进行实验,实验结果表明熵加权多视角核K-means算法能够为每个视角分配一个最优的权重值,聚类的精确度优于已有的聚类算法,具有更稳定的聚类结果。  相似文献   

10.
基于改进单类支持向量机的工业控制网络入侵检测方法   总被引:2,自引:0,他引:2  
针对单类支持向量机(OCSVM)入侵检测方法无法检测内部异常点和离群点导致决策函数偏离训练样本的问题,提出了一种结合具有噪声的密度聚类(DBSCAN)方法和K-means方法的OCSVM异常入侵检测算法。首先通过DBSCAN算法,剔除训练数据中的离群点,消除离群点的影响;然后利用K-means划分数据类簇的方法筛选出内部异常点;最后利用OCSVM算法为每一个类簇建立单分类器用于检测异常数据。工控网络数据集上的实验结果表明,该组合分类器能够利用无异常数据样本检测出工控网络入侵,并且提高了OCSVM方法的检测效果。在气体管道网络数据集入侵检测实验中,所提方法的总体检测率为91.81%;而原始OCSVM算法则为80.77%。  相似文献   

11.
网络货运平台运输服务订单的成交定价的预测结果是平台运营策略和承运人决策的直接体现,显著影响平台效益和承运人市场健康发展。以顺丰速递网络货运平台为例,通过缺失值处理和类别型数据转换进行数据预处理。针对网络货运平台成交定价预测精度问题,设计了基于双长短期记忆网络(LSTM)组合的网络货运平台成交定价预测模型,并采用K-means聚类分析预测结果。双LSTM组合模型相较于LSTM、支持向量回归(SVR)、两者相融合的LSTM-SVR以及基于灰色GM(1,1)和反向传播(BP)组合(GM(1,1)-BP)等模型,平均绝对误差(MAE)、均方误差(MSE)、平均绝对百分比误差(MAPE)最低且R2最高,分别为9.90、402.54、1.48和0.999 97。而K-means聚类分析对预测的订单成交定价进行评级的结果与实际情况一致。实验结果表明,所提出的双LSTM组合模型具备有效性和准确的网络货运平台成交定价预测效果。  相似文献   

12.
如何根据用户实时的情景高效地为其推荐最为合适的物联网服务,已经成为当前服务计算与物联网领域亟需解决的关键问题之一。针对这一问题,提出了一种基于情景感知的物联网服务推荐方法。首先基于改进的FolkRank算法生成当前用户可用的物联网服务列表;之后,依据用户当前关键的情景构建用户情景信息模型,根据用户的情景模型从服务列表中筛选出最能满足用户当前情景的物联网服务。实验结果表明,所提出的情景感知的物联网服务推荐方法是可行的与有效的。  相似文献   

13.
在物联网服务发现过程中,用户通常用自己的意图表达需求,而服务描述是对服务功能的说明,因此两者的不匹配会影响服务发现的准确率。同时随着服务的种类不断增多,服务发现的准确率不断降低。为了解决上述问题,提出在物联网服务描述中引入意图服务本体的方法,并在意图服务本体中扩展服务上下文和QoS。扩展后的意图服务本体存储在语义化服务描述OWL-S文件中,能够以意图的方式表达服务功能,丰富物联网服务描述的语义,提高服务发现的准确率。仿真结果表明,所提服务描述方法以及相应的服务发现算法相对于传统服务发现方法能提升6.7%的准确率。  相似文献   

14.
魏强  金芝  许焱 《软件学报》2014,25(8):1640-1658
针对物联网中服务数量的大规模性、服务描述的异构性以及设备服务的资源高度受限性和移动性等特点,提出了一种基于概率主题模型的物联网服务发现方法.该方法的主要特点是:1) 利用英文Wikipedia 构建高质量的主题模型,并对类似短文本的服务文本描述进行语义扩充,使主题模型能够更有效地估计服务文本描述的隐含主题;2) 提出利用非参数主题模型学习服务文本的隐含主题,降低模型训练时间;3) 利用服务隐含主题对服务进行自动分类和文本相似度计算,快速减少服务匹配数量,加速服务文本相似度计算;4) 提出能够同时支持WSDL-based 和RESTful 两种物联网服务的signature 匹配算法.实验结果表明:与现有的物联网服务发现方法相比,该方法的准确率(precision)和归一化折损累积增益(NDCG)都有较大幅度的提高.  相似文献   

15.
物联网服务作为信息世界软件服务通过物联网向现实世界的延伸,其在物联网系统具有重要的作用.然而,不同于传统Web服务,物联网服务具有现实感知、数据驱动、异构分布、时空相关等新特点,使得现有的服务模型不足以对物联网服务有效刻画,进而也不能满足物联网应用中的后续服务发现、服务卸载、服务组合等需求.在凝练分析物联网服务建模需求和已有物联网服务模型的基础上,提出了一种基于实体-数据的物联网服务建模框架,该框架提出了服务、实体、数据三元信息融合的物联网服务模型概念及概念关系,重点定义了服务、实体、数据的时空属性及时空依赖关系,以支持基于时空相关性的物联网服务关联表示与分析,并通过扩展OWL-S(ontology Web language for services)给出了基于实体-数据的物联网服务描述方式.最后,结合一个高速公路物联网应用案例对模型的使用方式和效果进行了讨论.  相似文献   

16.
基于SOA(service-oriented architecture)的物联网(Internet of things,IoT)把设备的功能服务化,以一种统一和通用的接口向外界提供服务。由于物联网中设备的海量性、移动性和资源高度受限性,以及无线网络自身的不可靠性,设备服务与传统的Web服务相比具有不同的特点,现有的Web服务发现方法不能有效地满足物联网中服务发现的需求。从Web服务发现体系结构和匹配策略两个方面对典型的Web服务发现方法进行了分析;结合物联网中服务提供的特点,从可扩展性、资源有限性、异构性和环境的动态变化性四个方面,分析了将Web服务发现方法应用于物联网服务提供中所面临的问题,并讨论了可能的解决思路;探讨了物联网中服务发现需要解决的问题。  相似文献   

17.
In recent years, the number of Web services has increased significantly. Web service discovery has drawn much attention with the development of Web service applications and big data analysis. Under this circumstance, traditional Web service discovery strategies cannot adequately meet high user requirements due to the efficiency and precision of service discovery is low. In order to improve the accuracy and efficiency of service discovery, a user requirement oriented Web service discovery approach based on Petri nets is proposed in this study. A data preprocessing strategy of Web service is first designed. Then, a service clustering method is proposed based on Petri nets, which can conduct service cluster head generation, service cluster composition, and service discovery. The proposed method utilizes a superior data preprocessing method. Using simulation experiments, the efficiency and precision of Web service discovery are illustrated. Finally, the application value of the approach on real Web service is discussed.   相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号