首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 126 毫秒
1.
王刚  钟国祥 《计算机科学》2010,37(9):222-224
为了改善文本聚类的质量,得到满意的聚类结果,针对文本聚类缺少涉及概念的内涵及概念间的联系,提出了一种基于本体相似度计算的文本聚类算法TCBO(Text Clustering Based on Ontology).该算法把文档用本体来刻画,以便描述概念的内涵及概念间的联系.设计和改进了文本相似度计算算法,应用本体的语义相似度来度量文档间相近程度,设计了具体的根据相似度进行文本聚类的算法.实验证明,该方法从聚类的准确性和聚类的关联度方面改善了聚类质量.  相似文献   

2.
本体构造就是利用各种数据源以半自动方式新建或扩充改编已有本体以构建一个新本体。现有的本体构造方法大都以大量领域文本和背景语料库为基础抽取大量概念术语,然后从中选出领域概念构造出一个本体。Cluster-Merge算法首先对领域文档先用k-means聚类算法进行聚类,然后根据文档聚类的结果来构造本体,最后根据本体相似度进行本体合并得到最终的输出本体。通过实验可证明用Cluster-Merge算法得出的本体可以提高查全率、查准率。  相似文献   

3.
介绍了一种应用于知识系统的基于领域的自然语言理解篇章理解的实现方法.该方法的核心是聚类和关联,本质上是关注概念和概念间的关联.以本体作为知识表示的方法,通过对基本概念的聚类,把底层离散的概念进行初步的集中,再通过分析底层概念间的相互关联,把整个篇章中的基本概念都联系起来,得到一个篇章层次上的本体模型.  相似文献   

4.
本文探讨了如何利用领域文本集来自动构建领域本体的技术,以辅助知识工程师方便快捷地构建领域本体.文中提出一种利用概念之间的语义相似度,通过蚁群聚类算法对概念集进行聚类,最后利用知网的义原层次结构抽取分类关系的算法,通过非对称簇分析函数评价概念间的关联度,以提取非分类关系,最终生成领域本体.实验证明了该本体学习系统的有效性.  相似文献   

5.
基于关系数据库的OWL本体构建方法的研究   总被引:3,自引:0,他引:3  
利用已有的数据资源以自动或半自动方式构建本体是实现语义Web的任务之一.在分析了现有研究成果及不足的基础上,给出了一个比较系统的基于关系数据库的OWL本体构建方法.介绍了如何从关系模式中识别实体、联系、继承关系、聚类关系及基数约束等语义,完成了从关系数据库语义到本体相应部分的转换,通过原型系统的实现验证了该方法的有效性.  相似文献   

6.
基于领域目标模型语义相似性计算,对领域资产库中的领域目标模型进行相似性聚类,然后根据领域中角色、目标、过程以及服务这四类模型之间的关联关系实现角色模型、过程模型以及服务模型的聚类.从而将一些在业务上存在因果联系、或者在功能上相互依赖、相互制约的模型组织在一起,形成一个领域问题.最后抽取每个聚类中的模型的基本信息生成领域问题本体,从而为利用领域问题本体实现对领域模型进行有效组织和管理奠定了基础,为云计算环境下面向服务的应用系统的构建提供了更便利的支撑.  相似文献   

7.
基于本体的智能信息检索系统的构建方法   总被引:1,自引:1,他引:0  
为了解决目前传统的信息检索工具返回大量无关的信息或漏检有用信息的问题,首先引入了本体的基本概念及其在信息检索中的用途,在此基础上提出了一种基于本体的智能信息检索系统模型.该模型首先使用基于SOM神经网络和分层聚类的两阶聚类算法自动的产生本体,免除了人工构造本体的繁琐,然后利用本体中概念及概念之间明确的关系描述,将用户提出的检索要求进行语义上的扩充,使信息检索过程更加智能化,大大提高了检索的查全率和查准率.  相似文献   

8.
在综述国内外学者有关聚类搜索引擎和本体技术研究成果的基础上,试图梳理出现阶段该领域的研究热点和难点问题,为后续研究奠定一定的研究基础。分别从聚类搜索引擎的定义、研究现状,本体技术,基于本体的中文环境下语义聚类搜索等方面对已有的研究文献进行了系统的综述,并提出基于本体的聚类搜索引擎总体框架和成员引擎的调度策略;在上面基础上提出对未来研究的展望。  相似文献   

9.
基于多个领域本体的文本层次被定义聚类方法   总被引:2,自引:0,他引:2  
传统的聚类方法常常将文本中关键词的相似度作为聚类的依据,丢失了很多重要的语义信息,导致聚类结果不够准确且计算量大。提出了一种基于多个领域本体的文本层次聚类方法,利用多个领域本体将用关键词表示的文本特征向量表示为与之匹配的概念向量集,定义文本相似度的计算公式,设计并实现基于多个领域本体的文本凝聚聚类算法。实验结果表明,该方法从概念层次上表示和处理文本,降低了聚类对象空间的维度,减少了计算量,提高了文本聚类的精确度和聚类效率。  相似文献   

10.
面向服务计算的网络化软件需求的交互与行为协作实质上是一个受约束的语义互操作性问题,其研究重点在于自组织过程及其群体行为涌现中的需求语义互操作性的约束、展开、聚类以满足涉众用户需求.针对上述问题,本文提出一个基于连接本体的网络化软件需求语义互操作展开方法.文中研究了面向本体的需求工程,实现了基于领域本体和需求资产重用的需求获取技术,同时面向网络化软件需求语义的互操作聚类,运用连接本体解决网络松散耦合、异域、异构下服务资源聚合的需求建模,给出了连接本体的形式化定义和连接本体生成算法,设计了基于连接本体的需求语义互操作展开自动化集成环境,探讨了国际上的相关前沿工作,为面向服务的网络化软件需求工程开辟了一条新的研究思路.  相似文献   

11.
设计了一种在中英文环境下、能够对Nutch的搜索结果进行聚类处理的搜索结果聚类系统,该系统基于k-means算法和后缀树聚类算法,是一个由Nutch搜索引擎、文本分词、TF-IDF权重计算以及文本聚类等模块构成的搜索引擎结果文档聚类系统,并通过实验对k-means算法和后缀树算法进行了对比。  相似文献   

12.
基于粗糙集的数据聚类方法研究   总被引:2,自引:0,他引:2  
RoughSets理论是一种新型的处理含糊和不确定性知识的数学工具,将RoughSets理论应用于知识发现中的聚类分析,给出了信息系统的约简、信息系统的可辨识属性矩阵和信息系统的辨识公式等定义,在此基础上提出了基于粗糙集的数据聚类算法RSDC,实验结果验证了该算法的可行性,并且对符号属性和数值属性数据都具有良好的聚类效果。  相似文献   

13.
针对DBSCAN密度聚类算法分析电力设备位置信息时需要手动设置超参数,在分析对象数量差异较大时,预设的超参数会对聚类结果产生显著影响等问题。本研究选择轮廓系数作为聚类结果评价指标,并引入粒子群优化算法(PSO)自动确定合理的Eps和MinPts参数值,使其更好地适应不同数据特征。通过PSO-DBSCAN对电力设备位置数据进行聚类分析,实验结果表明,所提出的方法在聚类效果上表现良好。该方法成功地克服了手动设置超参数可能引起的聚类结果不稳定性的问题,取得了显著的进展。这一研究为电力系统管理提供了一种更智能、自适应的密度聚类分析方法,克服了传统手动设置超参数的不足,为电力设备位置信息分析提供了可靠而高效的解决方案,为电力系统的管理和优化带来了新的思路和工具。  相似文献   

14.
陈曾  侯进  张登胜  张华忠 《自动化学报》2011,37(11):1356-1359
针对目前图像搜索引擎难以正确把握用户真正意图的问题, 从爬虫Web图像搜索引擎检索结果入手,提出三种聚类算法来提取海量Web图像中的语义区域. 这三种聚类算法包括确定初始化中心的K-means聚类、确定参数的最大期望聚类以及基于半监督的K-means聚类算法. 然后选取显著值较大的显著区域作为语义区域.实验分析比较了三种聚类算法的有效性, 最终实现的图像重排系统能比网络搜索引擎更好地反馈给用户精确而且有序的查询结果.  相似文献   

15.
K-means聚类算法可以实现对指纹库的软划分,提高定位系统的查询效率和定位精度。由于K-means算法聚类中心选择和聚类数设定的随机性,使其稳定性较差,影响定位系统的性能,在此提出采用融合聚类的方式对K-means算法进行优化。采用基于密度峰值的聚类算法得到指纹库中每一个指纹点的局部密度和局部距离,然后计算综合决策量γ;选取跳跃点前的前k个点作为K-means算法的初始聚类中心,同时确定最佳聚类数k。试验结果表明,融合聚类算法相较于传统K-means算法定位误差在1.5 m内的概率提高了约9%,定位系统的定位精度得到明显提高。  相似文献   

16.
针对异常入侵检测技术中传统聚类方法需要被检测类大小均衡的问题,在商空间粒度理论的基础上,论述了商空间粒度变换可以使复杂问题在不同的粒度世界求解,最终使整个问题得到简化。分析了商空间划分与聚类操作的相似性,提出了基于商空间的粒度聚类方法,并将该方法与入侵检测技术相结合,构建了基于商空间粒度聚类的入侵检测系统,用于对KDD CUP 1999数据集的异常入侵检测。实验结果表明,该入侵检测系统的性能明显优于基于传统聚类方法的入侵检测系统,从而证明了该方法的正确性和有效性。  相似文献   

17.
传统的聚类算法不适用于处理海量和高维数据。针对云计算环境下,利用集群系统的并行计算能力,实现海量数据的聚类问题,给出了云计算环境下基于分形维数的聚类融合算法。该算法首先对基于分形维数的聚类算法进行改进,使之更适用于并行计算,其产生聚类作为初始聚类成员;再结合投票算法的融合策略实现融合。最后,对基于分形维数的聚类融合算法在云计算环境下实现并行计算。通过在UCI数据集上的对比实验来验证该算法的有效性。  相似文献   

18.
多视图子空间聚类是一种从子空间中学习所有视图共享的统一表示, 挖掘数据潜在聚类结构的方法. 作为一种处理高维数据的聚类方法, 子空间聚类是多视图聚类领域的研究热点之一. 多视图低秩稀疏子空间聚类是一种结合了低秩表示和稀疏约束的子空间聚类方法. 该算法在构造亲和矩阵过程中, 利用低秩稀疏约束同时捕捉了数据的全局结构和局部结构, 优化了子空间聚类的性能. 三支决策是一种基于粗糙集模型的决策思想, 常被应用于聚类算法来反映聚类过程中对象与类簇之间的不确定性关系. 本文基于三支决策的思想, 设计了一种投票制度作为决策依据, 将其与多视图稀疏子空间聚类组成一个统一框架, 从而形成一种新的算法. 在多个人工数据集和真实数据集上的实验表明, 该算法可提高多视图聚类的准确性.  相似文献   

19.
模糊C-均值聚类算法是目前应用最广泛的聚类算法,但其仍然存在对孤立点敏感及对初始中心点依赖等问题.为此,提出了一种改进的基于样本加权的模糊聚类算法,该算法可以更加准确的获得初始中心点且去除噪声点.同时,针对Weka系统中聚类算法的薄弱性以及聚类问题在数据挖掘领域的广泛性,本文对此平台进行二次开发并对传统FCM算法与改进算法进行研究.研究发现,改进算法使得聚类结果稳定,且能准确获得聚类结果,提高了算法准确率.  相似文献   

20.
传统聚类算法由于单机内存和运算能力的限制已经不能满足当前大数据处理的要求,因而迫切需要寻找新的解决方法。针对单机内存运算问题,结合聚类算法的迭代计算特点,提出并实现了一种基于Spark平台的聚类系统。针对稀疏集和密集集两种不同类型的数据集,系统首先采用不同策略实现数据预处理;其次分析比较了不同聚类算法在Spark平台下的聚类性能,并给出最佳方案;最后利用数据持久化技术提高了计算速度。实验结果表明,所提系统能够有效满足海量数据聚类分析的任务要求。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号