首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 359 毫秒
1.
随着语义网数据的迅猛增长,RDF大数据存储成为数据存储领域研究的热点问题,而分布式存储是解决RDF大数据可扩展性的一种有效途径,数据分割则是实现分布式存储的关键。利用图聚类思想实现RDF数据的有效分割,基于RDF数据模型的图特性,首先利用PRank节点相似度算法计算RDF图结点间的相似度,然后使用AP聚类算法对相似度矩阵进行聚类,进而实现RDF数据的分割和分布式存储。实验结果表明:该方法能有效完成RDF数据的聚类分割,使得聚类结果中类间相似度较小,而类内相似度较大。  相似文献   

2.
考虑网络事件的时间距离,基于半结构化网页中不同位置特征项重要程度的不同,提出改进的single-pass文本聚类算法single-pass*,优势在于对Web文本不同位置特征项的加权处理,仅需计算新文档与同类别种子文档间的相似度。实验结果表明,相比single-pass,改进算法极大减少了漏检率和错检率,降低了由于新文本流内文档进行相似度计算导致系统性能的下降,平均提高Web文本聚类效率40%。将聚类后的Web文本应用于网络舆情分析,进行主题关注度分析和话题热度特性分析。  相似文献   

3.
采用传统标签传播算法实现网络聚类时,由于标签初始分配过程随机、节点选择过程随机、且标签更新顺序随机的原因,影响聚类结果。为此,提出一种新的基于改进标签传播算法的网络聚类方法,即用图对网络进行描述,并为网络聚类提供基础。改进标签传播算法过程如下:求出网络中任意两节点拥有最大公共邻居的平均阶数,把相似性最高的节点和邻居节点看作初始核心社团,为其分配初始标签;引入基于随机游走的相似度矩阵,令节点选择和自身相似度最高的节点拥有的标签;通过H指数对标签算法更新顺序进行改进;依据改进后结果,按照标签传播算法网络聚类过程实现聚类。实验结果表明,本文所提的网络聚类方法具有更高的准确性和稳定性。  相似文献   

4.
为了解决网络延迟检测点的有效放置问题,根据网络节点之间的网络延迟,使用系统聚类法对网络节点进行聚类,并使用递归去除1度异常节点算法提高聚类效果.提出动态距离和最小算法,在聚类结果的类中选取对应的类中心,检测点放置在类中心上.仿真结果表明,系统聚类法中类平均法更适合对网络节点进行聚类,递归去除1度异常节点后能表现出更好的聚类效果,通过动态距离和最小算法能找到放置检测点的最佳位置.使用系统聚类法中的类平均法、递归去除1度异常节点算法、动态距离和最小算法,能有效地解决网络检测点的放置问题.  相似文献   

5.
为了提高文本聚类的有效性,提出一种基于网络社团结构的文本聚类算法。基于语义知识库理论,利用文本集与词语间的关系,引入文本相似度概念,再结合Newman社团聚类算法特性,将文本集作为独立社团,用文本相似度表示社团联系的紧密程度,对网络文本进行聚类。实验结果表明,该方法有效可行。  相似文献   

6.
针对多个服务提供方提供相似Web服务的状况,在功能属性服务发现研究的基础上,尝试基于QoS的按需服务发现过程研究,其核心是先聚类后排序.首先利用FCM聚类思想将用户QoS需求信息和Web服务资源的QoS信息进行合并聚类,再通过相似度计算确定同一分类内聚类对象的次序,最后以一个算例说明了该过程可以根据用户的QoS需求发现服务.  相似文献   

7.
在复杂网络中节点相似度度量以及密度峰值聚类算法的基础上,提出了一种基于点距离和密度峰值聚类的社区发现方法。首先,提出了基于节点相似度和节点间最短距离的节点距离度量。然后,应用密度峰值聚类方法探究网络中的社区结构,密度峰值聚类算法不仅能够检测出各个社区中心并进行相应的社区扩展,而且能够避免参数选择过程。最后,通过与经典算法在真实数据集和人工合成数据集上的比较实验,充分验证了本文方法的可行性和有效性。  相似文献   

8.
研究了节点聚类系数与网络社区结构之间的关系.直接使用节点聚类系数不易刻画社区子图的高聚集特性,定义了一些基于节点聚类系数的社区度量,据此识别网络中的社区.首先,给出了基于聚类系数增大的社区间边判定规则,简称CCE规则;然后,利用CCE规则引出相似度矩阵,即网络密度矩阵;最后,通过网络密度矩阵来构造Laplacian矩阵,并进一步推导出通过计算Laplacian矩阵的特征值以及特征向量来实现社区结构划分的算法.三个真实网络数据的实验结果表明,算法不仅获得了令人满意的划分结果,而且还提高了算法的时间效率.  相似文献   

9.
目前现场接触网吊弦缺陷图像严重不足,导致模型特征学习不充分,识别准确率难以得到有效提高,为此提出基于组合零样本学习的接触网吊弦线缺陷识别方法.采用以ResNet-50作为主干网络的视觉特征提取模块提取图像视觉特征;使用预训练的Word2Vec词向量对标签组合图中的节点特征进行初始化,并通过2层图卷积网络学习标签组合图中各节点之间的依赖关系,从而优化组合标签节点的语义特征,改善最终的识别效果;将提取到的视觉特征和优化后的组合标签节点的语义特征相对齐,构建相似度函数计算图像视觉特征与组合标签语义特征之间的相似度得分,并通过交叉熵损失完成图像组合标签的预测.仿真实验结果表明:所提方法对可见类样本的类平均检测准确率为93.5%,对不可见类样本的类平均检测准确率为86.5%.  相似文献   

10.
针对Internet网络延迟监测点的放置问题,将其转化为网络拓扑图聚类问题。根据网络层次结构特性,使用层次聚类法对网络节点进行聚类。利用网络节点的差异性,提出使用递归去除1度异常节点算法,在保证网络拓扑结构基本不变的前提下减少异常节点对聚类结果的影响。提出在聚类结果的每个类中选取度数最大的节点作为对应的类中心,监测点被放置在类中心位置上。实验结果表明,层次聚类法中最长距离法更适合对网络节点进行聚类,递归去除1度异常节点算法能够进一步提高聚类效果,有效地解决了监测点的放置问题。  相似文献   

11.
基于图理论的概念间语义度量方法,改进了语义相似度部分影响因素,提出一种结合设计良好的领域本体来计算自然语言概念间的语义相似度的算法.对自然语言与本体的关系进行分析,并通过本体对节点密度、节点深度与节点层次顺序等影响概念语义相似度的因素进行了改进,综合考虑概念的语义距离、概念间关系、概念的属性与概念所处的层次等影响因素,利用本体对相关领域的基本术语和关系的准确定义,改进了基于本体的概念间语义相似度的算法.实验结果表明,该算法对于提高概念间相似度的计算精度明显高于其他算法.  相似文献   

12.
随着网络发布的Web服务数量急剧增加,面对数量庞大的服务群,如何从海量的Web服务中快速、准确、高效发现满足用户需求的服务已成为亟待解决的问题。针对传统的服务发现准确性不高,发现方法效率低下的现状,本文提出了一个基于服务交互图的操作组群发现的方法。利用聚类技术,从服务行为相似的层面对服务进行聚类预处理,从而大大缩小服务检索范围,提高服务匹配的时间。并在服务匹配过程中,基于服务交互图的操作组群挖掘,从而可以提高查找的精确度。最后,利用仿真实验对所提出的方法进行验证.  相似文献   

13.
传统的结构化对等网络以分布式哈希表(DHT)为核心,只支持基于特定关键字的精确搜索,不支持语义搜索.而为支持语义搜索而提出的语义DHT网络存在路由层次多、查准率低等问题.为此,基于标准α稳定分布提出了语义相似哈希对Chord节点上资源进行标识符分配,使语义相似资源具有相近的标识符,从而可将语义相似资源存放在Chord中相同或相近的节点上,实现对语义搜索的支持.仿真结果表明,使用语义相似哈希分配资源标识符的Chord网络可以在1.07%的节点范围实现70%查全率和80%的查准率,在单层拓扑上实现了语义搜索功能.  相似文献   

14.
在原有基于归约图的Web服务自动组合方法基础上,引入Web语义,在对Web服务库及用户请求进行语义标注后,运用综合了名称相似度和语义距离的语义相似度实现对象间的语义转换与匹配。该方法具有原方法的优点,并能够处理对象间不存在完全匹配的情况,从而提高Web服务组合的成功率。  相似文献   

15.
针对传统P2P系统大多采用关键字匹配实现信息检索且不支持语义的问题,提出了一个基于本体的P2P语义检索框架。该框架采用超级节点拓扑结构,利用本体进行信息集成,将支持相似概念的节点聚类到同一语义对等组,组内节点依据本体定义使用语义链来连接,组之间语义关联则通过超级节点的组语义链来实现;同时增加语义快捷链实现不同语义组之间的节点连接。  相似文献   

16.
传统K-means聚类算法的性能依赖于初始聚类中心的选择。本文将复杂网络节点的属性值作为节点的度、聚集度与聚集系数的加权值,通过计算所有节点的加权综合聚集特征值,选取综合聚集特征值高,并且彼此之间无高聚集性特征的个节点作为聚类的初始聚类中心,然后进行聚类迭代过程。实验结果表明,新算法对初始聚类中心的选取更迅速有效,避免了传统K-means算法初始聚类节点选取的敏感性,进而提高K-means算法的聚类质量。  相似文献   

17.
为了实现XML Schema自动匹配,解决XML数据共享问题,提出一种基于语义和结构的模式自动匹配算法。首先采用基于单词网络(wordnet)的语义匹配算法及字符串结构匹配(n-grams)算法计算来自两个模式树中节点对名称相似度,然后获取包含此节点对的各自路径集,再通过计算对应路径集中每对路径的最大相似度获得此节点对的结构相似度。实验分析表明此方法具有较好的查全率和查准率。  相似文献   

18.
针对中文环境下的模式冲突问题,提出了一种利用元数据的模式匹配方法.该方法从数据字典中为模式提取特征向量,并采用聚类技术对其进行聚类,将语义相近的模式划分到相同聚簇中;对于同一聚簇中的不同模式,借助辅助词典计算属性间的语义相似度,并采用多种选择策略相结合的方法对结果进行过滤,为每个属性生成候选匹配集合.实验结果表明,该方法不仅可以提高模式匹配效率,而且具有较高的准确度.  相似文献   

19.
为了提高信息检索效率,在中文Web信息检索中引入了浅层文本分析技术。首先提取文本句子的谓词及与谓词直接关联的前置体词和后继体词。然后在将谓词转换成概念化表达的基础上,获取表达文本语义的语义向量。提出了一个语义向量相似度计算算法,用语义向量的相似度来度量文档之间的语义相似度。与主流网络搜索引擎比较,系统查准率方面有了较大提高。  相似文献   

20.
基于平均度与平均聚类系数的RWP模型的研究   总被引:1,自引:0,他引:1  
RWP模型作为节点仿真移动模型被广泛应用在传统移动自组织网络研究中,而机会网络作为移动自组织网络的一个分支,具有不保证连通的网络拓扑特性,这种特殊性可能导致RWP模型不适合作为仿真机会网络的节点移动模型.结合复杂网络理论中平均度与平均聚类系数的概念,对RWP模型仿真数据与实验数据进行了对比分析.分析结论指出,在平均度相近的条件下RWP模型的平均聚类系数与实验数据有明显的差异,因此RWP模型不适合作为描述机会网络的移动模型.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号