首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
为提高本体映射的准确率,提出了一种改进的基于多策略的本体映射方法.综合考虑了本体结构特征和实例映射对本体相似度的影响.通过设计一种"编码"的方法,实现对概念节点结构的表述与测量,并在影响范围内利用祖先节点的相似性来判断节点相似性.在初始候选对的选取中,提出一种基于图论的1∶1映射方法.实验结果表明所提出方法提高了检索的查全率和查准率.  相似文献   

2.
为提高本体映射的准确率,提出了一种改进的基于多策略的本体映射方法.综合考虑了本体结构特征和实例映射对本体相似度的影响.通过设计一种"编码"的方法,实现对概念节点结构的表述与测量,并在影响范围内利用祖先节点的相似性来判断节点相似性.在初始候选对的选取中,提出一种基于图论的1:1映射方法.实验结果表明所提出方法提高了检索的...  相似文献   

3.
本体理论与信息编码技术的结合在制造企业领域内的应用,是解决制造企业信息集成的探索性方法.文章深入研究了基于信息编码本体化模型的本体映射方法,分析了映射执行机理,设计了语义相似度的计算方法和流程.①分析了信息编码本体化模型的特点及其失配类型,设计了映射模型的总体框架;②对映射模型的原理及构成要素进行了详细的分析设计;③从语义相似性分析、语义相似算法表达和语义映射与执行3个方面详细设计了本体模型的映射算法;④对映射流程的实现过程和实现案例进行了分析设计,验证了映射模型的有效性;最后,从模型特征、映射依据和映射执行能力3个方面,总结了基于信息编码本体化模型的本体映射技术的特点.  相似文献   

4.
针对已标记数据与未标记数据分布不一致可能导致半监督分类器性能降低的不足,提出了一种基于特征映射的半监督文本分类算法.首先通过不同的特征选择方法,分别在训练集的已标记数据、未标记数据以及测试集数据中选取各自的特征集,并初始化特征的权值;在此基础之上,分别建立已标记数据与未标记数据、已标记数据与测试集数据、未标记数据与测试集数据之间的映射函数,并利用这3个特征映射函数重新计算特征的权重;最后利用期望最大比(expectation maximization,EM)算法进行半监督文本分类.在标准数据集上的实验结果表明:提出的算法是有效的.  相似文献   

5.
随着领域内本体数量的不断增多,很多本体映射方法已经不适用于多本体映射任务。为此,提出一种基于参考本体的多本体映射方法 (multiple ontology mapping based on reference ontology,MOM RO)。在多本体映射过程中,方法MOM RO从源本体集合中提取共享概念集合并建立参考本体;然后利用参考本体来构建一个统一的向量空间模型;然后,将源本体中的概念表示成该模型中的向量,从而使用向量之间的欧氏距离来计算概念之间的相似度;最后,建立源本体之间的映射关系。实验结果表明,方法MOM RO可以有效地完成多本体映射的任务。  相似文献   

6.
为提高半监督分类的性能,提出一种基于SOM神经网络的半监督分类算法SSC-SOM。结合SOM的聚类特性,基于先聚类后标记的思想,充分利用有标记样本和未标记样本训练SOM分类器;将聚类的形成和有标记样本分配到各个聚类中同时进行,并根据有标记样本计算各个聚类的聚类中心;在整个未标记样本的范围内,根据聚类中心,使用K近邻算法对未标记样本进行标记,挖掘未标记样本的隐含信息。在UCI数据集中进行分类实验,其结果表明,SSC-SOM的分类率比SSOM提高2.22%,且收敛性较好。  相似文献   

7.
提出了一种新颖的基于实例的本体映射方法,即通过遗传算法确定最优实例间的映射集合,并通过相似度扩散算法获取高准确率的本体映射结果.文章描述了实例相似度度量技术和upPropagation算法,给出了本体映射问题的单目标优化模型,论述了使用遗传算法求解该问题的3个关键步骤,最后通过实验验证.实验表明,采用遗传算法实现基于实例的本体映射方法,可以获取高准确率的本体映射结果.  相似文献   

8.
已有的虚假评论识别方法主要采用启发式策略或简单特征建模,针对这些方法的不足,提出使用机器学习方法识别虚假评论。首先整合计算语言学与心理语言学的知识对评论文本进行建模,使用全监督学习算法来评价不同特征建模的性能,选出最好的特征组合。为了提高识别性能,设计两种半监督学习算法充分利用大量的未标注文本。实验结果证实所提算法超过当前的基准。  相似文献   

9.
提出利用贝叶斯理论计算实例相似度,定义集合相似度和概率相似度两个概念,推导出计算模型,得到一个完整的解决实例映射方案.用实例相似来优化映射,该方案的查全率和查准率比传统方法有所提高.  相似文献   

10.
随着信息技术与社交媒体的不断发展,用户情感分析在舆情监控、信息预测、产品评价上发挥着越来越重要的作用.然而,监督学习手工标签获取困难,无监督学习缺少标签的引导,因此本文基于社会学理论建立了半监督的情感分析模型,该模型主要分为标签添加和情感分析两部分.标签添加部分首先基于情感一致性和情感传染性两种被认可的社会学理论建立UR-S模型,然后通过用户关联度和文本相似度进行改进,建立TRS-SAT模型,增加标签数量.情感分析部分将TRS-SAT模型与卷积神经网络结合,通过卷积神经网络挖掘特征集合与情感分析标签之间的深层次联系,构建半监督学习模型改善情感分析性能.实验表明,本文提出的基于用户关联度和深度学习的半监督情感分析模型,与半监督的支持向量机模型相比,准确率、召回率、F值分别提升11.40%、5.90%、8.65%;与卷积神经网络模型相比,分别提升4.12%、4.17%、4.14%,均有较好的表现.由此证明,该模型能够为舆情分析与用户决策提供良好的理论基础,具有创新性和实用性.  相似文献   

11.
为提高半监督分类的性能,提出一种基于SOM神经网络的半监督分类算法SSC-SOM。结合SOM的聚类特性,基于先聚类后标记的思想,充分利用有标记样本和未标记样本训练SOM分类器;将聚类的形成和有标记样本分配到各个聚类中同时进行,并根据有标记样本计算各个聚类的聚类中心;在整个未标记样本的范围内,根据聚类中心,使用K近邻算法对未标记样本进行标记,挖掘未标记样本的隐含信息。在UCI数据集中进行分类实验,其结果表明,SSC-SOM的分类率比SSOM提高2.22%,且收敛性较好。  相似文献   

12.
文本相似度计算在专利信息分析系统中有着广泛的应用前景.传统的基于向量空间模型的文本相似度计算方法,一方面未能很好地考虑上下文信息对词语语义的约束,导致不能对不同语境中词语的语义进行有效区分;另一方面使用词典作为计算相似度的依据具有领域相关性,在特定领域未能给出有效的语义理解.提出一种使用领域本体作为文本相似度计算基础的方法,该方法中使用语义消歧来解决上下文对于词语语义的影响;使用领域本体概念意义相同关系来计算文本相似度.实验结果显示本方法的准确度相对于现有典型的相似度计算方法有所提高.  相似文献   

13.
专业领域词汇相似度计算是词汇语义相似度计算中的重要问题.通过分析专业领域词汇的构词特点,并结合领域本体概念模型,提出一种专业领域词汇相似度计算算法(domain ontology and morphology based algorithm,DOMBA).该算法将专业领域词汇构词法与领域本体的概念相似度影响因子相结合,融于词汇相似度计算中.实验结果表明,词汇相似度计算结果符合客观实际的判断认识,DOMBA算法可有效应用于专业领域词汇相似度计算中.  相似文献   

14.
&#  &#  &#  &#  &# 《西华大学学报(自然科学版)》2015,34(6):53-57
为提高网络入侵检测的分类效率,提出一种结合主动学习和半监督学习的入侵检测算法。结合入侵检测实际,对主动学习算法进行简化,用有标记样本训练生成2个分类器,实现对未标记样本的预测;将2个分类器预测不一致的未标记样本作为信息量丰富的样本,使用半监督学习算法进行标记;最后, 把新增加的新标记样本添加到主动学习和半监督学习的训练集中,训练各自分类器, 反复迭代直到未标记样本集为空, 并用最新的有标记样本集训练形成最终的分类器。使用KDD CUP 99数据集进行入侵检测实验,其结果表明,与SVM方法相比,其分类率提高了4.3%,且较好地缩减了问题规模。    相似文献   

15.
为了解决传统的入侵检测聚类算法准确率较低这个问题,结合半监督学习的思想,提出了一种面向入侵检测的半监督聚类算法。首先利用样本数据集中的部分标记数据,生成用于初始化聚类的种子集,通过计算样本数据集中标记点与每个类簇中标记点均值的欧氏距离,得到每类的初始聚类中心,实现了入侵检测数据的准确识别。该算法有效地避免了传统聚类算法中初始聚类中心选择的盲目性和随机性,提高了检测率。实验结果表明,在处理入侵检测数据时,该算法能够充分利用少量类标记信息进行半监督学习,较传统的K-means算法聚类效果更好,检测准确率更高。  相似文献   

16.
为了充分利用监督信息指导聚类过程,提出自适应半监督邻域聚类算法(adaptive semi-supervised neighborhood clustering algorithm,SSCAN).引入监督矩阵与距离度量结合,构造合理的相似矩阵;充分利用监督信息,通过标签信息矩阵与流形正则项结合调整模型,改善聚类效果.在...  相似文献   

17.
为提高半监督分类的性能,提出一种安全的基于分歧的半监督分类算法Safe Co-SSC。通过有标记样本训练3个有监督分类器,利用无标记样本的信息增加分类器的差异性,采取3个分类器加权投票的策略实现对无标记样本的伪标记;对伪标记样本进行二次验证,选用能使分类器误差减小的新增标记样本扩充标记样本集。保证新样本的添加既减小了分类器的分类误差,又提高了分类器的分歧性。对UCI数据集进行分类实验的结果表明,该算法具有较高的分类率和样本标记率。    相似文献   

18.
多标记学习中通常存在大量未标记示例,本研究结合协同训练(Co-training)方法充分利用数据集中的未标记示例,在数据集上选取局部k NN(k nearest neighbor)和全局k NN进行训练得到两个分类器,分类器分别标记未标记示例并相互更新训练集。协同训练过程不断迭代进行,直至训练完成。试验结果表明,该方法性能均优于其他多标记学习算法。  相似文献   

19.
为解决手姿态估计中标签数据的获取困难问题,该文提出了一种基于多视图投影的半监督学习方法,减少对标记数据的需求。首先,从单张深度图中分割出手部区域,将其投影至3个正交平面;而后,采用编解码模型学习两个投影视图在低维度隐空间中的关联表征;最终,结合标记数据,学习低维度隐空间表征到手姿态三维坐标的回归映射。实验表明,该方法减少了对标记数据的依赖,在NYU手姿态估计数据库上获得了较好的结果。  相似文献   

20.
服务匹配也被认为是基于本体概念的相似度计算。针对本体结构中概念之间的IS-A关系,通过对语义相似度相关算法的研究,提出了一种结合信息论模型和语义距离模型的相似度算法,并在此基础上上构建了二层服务匹配模型,从而实现了对服务的有效区分和匹配。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号