首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 20 毫秒
1.
流程工厂设计中的规则挖掘与智能预测   总被引:1,自引:0,他引:1  
流程工厂设计涉及不同的工程应用背景及专业知识,大量隐含的设计规则尚未提炼,因此建模过程存在效率低、模型质量不高等问题.结合流程工厂模型的领域特性,提出一种用于挖掘工厂设计规则的频繁类型树模型.该模型以大量实例工厂模型中各构件的属性及拓扑连接关系为依据构造频繁类型树;在后续模型的构建过程中,通过对该树的查询为当前工厂设计提供实时的智能预测.实验结果表明,文中模型能够挖掘到不同工程应用背景下的隐含建模知识,在未来模型的构建过程中,利用这些知识所提供的智能预测可以大幅缩小构件选择范围,有效地提升流程工厂模型的构建效率及设计质量.  相似文献   

2.
由于微博文本的长度较短,直接使用隐狄利克雷分布(LDA)模型会导致特征向量高维稀疏。为此,提出一种融合标签语义的热点话题挖掘方法。利用公共块算法计算微博标签的相似度,合并标签相似度较高的微博文本。采用LDA模型对合并后的文本建模,并通过K-means聚类算法挖掘微博热点话题。实验结果表明,与针对单一微博文本建模的方法以及直接合并相同标签的方法相比,该方法的困惑度较低,挖掘热点话题的准确性较高。  相似文献   

3.
语义相似度计算就是把词语间语言学上的信息映射为0到1之间的数值。基于知识本体的语义相似度计算方法,利用知识本体提供的信息,建立词语关系和语义相似度之间的函数关系,该方法可解释性强、使用简单,成为语义相似度计算的一类重要方法。提出了一种基于《同义词词林》的语义相似度计算模型,该模型运用遗传算法探索了《同义词词林》语义编码与语义相似度之间的内在联系,建立了更符合《同义词词林》中所蕴含的语义相似信息的函数关系式。该方法使用遗传算法搜索知识与语义相似度的函数表达式,克服了先验模型中函数形式及调节参数的局限性,所得计算结果与人工判定结果的皮尔逊相关系数为0.8645,为使用人工智能方法挖掘自然语言处理中的规律提供了一种新的思路和方法。  相似文献   

4.
基于子树匹配的文本相似度算法   总被引:1,自引:0,他引:1  
为降低文本向量维度,提高文本间语义相似度度量性能,综合利用统计方法与语义词典的优势,提出一种文本相似度算法.基于文本生成元数据特征向量,减少向量空间维度,设计基于子树匹配的文本相似度算法,借助子树加速对文本相似度的计算,并通过将文本元数据特征向量与子树进行相似度语义匹配,提高文本相似度计算时语义相似度度量的准确性.该算法考虑到对元数据中同义词的语义理解,加强文本之间相似度度量时的语义覆盖能力.实验结果表明文中所提出的方法是可行和有效的.  相似文献   

5.
相似度匹配是自然语言处理领域一个重要分支,也是问答系统抽取答案的重要途径之一.本文提出了一种基于正负样本和Bi-LSTM的文本相似度匹配模型,该模型首先为了提升问题和正确答案之间的相似度,构建正负样本问答对用于模型训练;其次为了解决分词错误引起的实验误差,采用双层嵌入词向量方法进行预训练;再次为了解决注意力机制导致的特征向量向后偏移的问题,在特征提取之前,采取内部注意力机制方法;然后为了保留重要的时序特性,采用Bi-LSTM神经网络进行数据训练;最后为了能在语义层次上计算相似度,提出一种包含语义信息的相似度计算函数.将本文提出的文本相似度匹配模型在公共数据集DuReader上进行了仿真实验,并和其他模型进行对比分析,实验结果表明,提出的模型不仅准确率高且鲁棒性好,top-1准确率达到78.34%.  相似文献   

6.
传统文本表示方法通常基于词袋模型,而词袋模型是基于文本中词项之间是相互独立的假设。最近也提出一些通过词共现来获取词项之间关系的统计分析方法,却忽略了词项之间的隐含语义。为了解决传统文本表示方法词袋模型对文本语义的忽略问题,提出一种融合词项关联关系和统计信息的短文本建模方法。通过词语之间的内联及外联关系耦合得到词语关联关系,充分挖掘了显示和隐含的语义信息;同时以关联关系作为初始词语相似度,迭代计算词语之间及文本之间的相似度,改善了短文本的表示。实验证明,该方法显著地提高了短文本聚类的性能。  相似文献   

7.
提出了一种利用级联模型来计算本体中概念间相似度的新方法.在模型的第一阶段,采用了基于距离的语义相似度计算方法,计算出概念对在本体中的路径得分;第二阶段,采用IC (Information Content)算法精确计算概念对间相似度得分,并利用概念的公共子代集合对算法进行了扩展;第三阶段我们采用了特征整合策略,将所有的相似性得分构建成特征向量来描述概念对,并且使用权重来平衡第一阶段与第二阶段的相似度结算得分.最后使用BP神经网络确定两个概念的相似性.我们对新提出的语义相似度算法进行了评估,并与现有的方法相比.实验结果表明,该方法有效提高相似度算法的准确性和科学性.  相似文献   

8.
在MC环境下,为了使零件工时快速且准确的被估算出,以案例推理理论为基础,研究了零件相似度与工时之间的内在关系,提出了零件相似度的工时估算新方法。首先,通过CASE检索法和零件拓扑结构相似度在规范的案例库中检索并筛选出符合要求的相似零件样本;其次,根据零件相似性机理,确定零件相似度的内涵,构建零件相似度的计算模型,即零件拓扑结构相似度计算模型和零件特性相似度计算模型;最后,通过Matlab软件确定零件相似度与工时之间的关系函数,从而实现定制零件加工时间的快速估算,并用实例验证了该方法的有效性和可行性。  相似文献   

9.
《软件工程师》2019,(10):36-43
针对目前基于维基百科的相似度计算方法预处理过程烦琐、计算量大的问题,本文以维基百科为本体引入基于特征的词语语义计算,提出了一种基于维基百科的快速词语相似度计算方法。根据维基百科页面链接结构的特点,该方法把页面的入链接和出链接作为页面特征值构建特征向量模型,通过计算页面的特征向量相关系数计算对应词语的语义相似度。本文还改进了维基百科消歧处理算法,在一词多义的处理中减少社会认知度低的义项页面的干扰,进一步提高了计算准确度。经Miller&Charles(MC30)和Rubenstein&Goodenough(RG65)测试集的测试,测试结果表明了基于维基百科链接特征的方法在计算相似度方面的可行性,也验证了本文的计算策略和消歧改进算法的合理性。  相似文献   

10.
模型驱动工程中,模型合成技术能降低软件复杂度,提高开发效率和质量.提出基于语义和结构进行模型匹配并按规则进行合成的方法,首先建立形式化的中间数据模型,用于统一模型合成过程中的模型表示方式;然后结合元素名称设计语义相似度函数,并基于元素属性和元素之间的关系计算结构相似度,提高模型匹配精度;根据相似度值确定匹配元素,对于完全匹配和完全不匹配的元素,自动确定合成规则,对于相似元素对,经过少量的人工分析可判定合成规则;根据合成规则能自动产生合成模型;设计校验规则和验证框架检验合成模型的正确性和一致性.最后用实例说明了方法的有效性和可行性.  相似文献   

11.
针对已有实体相似度计算方法在实体对齐任务上准确率较低的问题,提出一种多信息加权融合实体对齐算法.分别采用动态规划求解最小编辑距离及Doc2 vec模型训练文本获取包含语义信息的特征向量等方法,对实体的结构化属性及非结构化文本进行相似度求解;通过加权平均获取实体综合相似度,完成实体对齐任务.对比实验表明,所提出算法有效提高了实体对齐的准确率,并具有更好的算法迁移性.  相似文献   

12.
于扬  邢镔  曾骏  文俊浩 《计算机科学》2021,48(10):160-166
服务发现旨在解决服务信息爆炸的问题,找到定位满足服务请求者需求的服务.由于服务描述信息主要由带有噪声的短文本组成,并且具有语义稀疏的特征,因此很难提取服务描述文档的隐含上下文信息,此外,传统的服务发现方法在获取服务的特征表示后,直接进行相似度计算,其使用的度量函数是不符合人类感知的.针对上述两个问题,文中提出了一种基于知识图谱和神经相似网络的服务发现框架(KSN).它使用知识图谱来连接服务描述和规格中的实体以获得丰富的外部信息,从而增强服务描述的语义信息,使用卷积神经网络(Convolutional Neural Network,CNN)提取服务的特征向量,并将其作为神经相似网络的输入,神经相似网络会学习一个相似度函数,用于计算服务和请求之间的相似度以支持服务发现过程.通过对ProgrammableWeb爬取的真实服务数据集的大量实验结果表明,就多种评估指标而言,KSN优于现有的Web服务发现方法.  相似文献   

13.
<正>针对城市地下综合管线和专业管线空间数据匹配中语义表达不足、语义相似性计算方法简单及匹配质量不高等问题,提出一种顾及管线空间特征的概念语义相似性方法.首先列举管线概念属性项以表达概念语义,分析管线实体拓扑特征确定实体空间关联情况,融合其他特征建立管线本体;然后从管线信息概念内涵出发,提出基于概念语义的管线空间数据匹配模型,其中利用概念属性、空间特征及本体层次结构匹配指标,结合权重信息计算管线实体相似度大小确定匹配实体.实验结果表明,该方法能更合理地计算管线实体间的相似度,明显提升管线空间数据匹配的质量.  相似文献   

14.
潜在狄利克雷分布(LDA)以词袋(bag of words,BOW)模型为基础,简化了建模的复杂度,但使得主题的语义连贯性较差,文档表征能力不强。为解决此问题,提出了一种基于语义分布相似度的主题模型。该模型在EM(expectation maximization)算法框架下,使用GPU(generalized Pólya urn)模型加入单词—单词和文档—主题语义分布相似度来引导主题建模,从语义关联层面上削弱了词袋假设对主题产生的影响。在四个公开数据集上的实验表明,基于语义分布相似度的主题模型在主题语义连贯性、文本分类准确率方面相对于目前流行的主题建模算法表现得更加优越,同时该模型提高了收敛速度和模型精度。  相似文献   

15.
语义异构是异构数据库信息集成中要解决的关键问题.为了使关系数据库的表和字段具有语义信息,将数据库元数据自动标注成语义元数据成为研究的热点.基于概念名和概念结构的语义相似度计算,提出了一种数据库元数据自动语义标注方法.首先从关系数据库的元数据中提取隐含的语义信息,并据此创建领域本体,然后通过计算元数据与本体实体间的语义相似度对提取的元数据进行自动语义标注,提出的相似度算法综合考虑了概念名称和结构的相似性,并采取了必要的优化措施进行改进.经实验测试证明,该方法具有较高的标注正确率,是一种行之有效的语义标注方法.  相似文献   

16.
一种本体概念的语义相似度计算方法   总被引:1,自引:0,他引:1  
概念语义相似度已广泛应用于 Web 服务发现、本体映射等领域, 但现有的概念语义相似度计算方法对概念间语义相似程度的区分不够细致. 本文从本体结构出发, 首先提出了自底向上的本体概念出现概率计算方法, 并在此基础上改进了基于节点信息量的概念语义相似性度量方法; 然后又设计了基于边计算的本体概念语义相似度计算方法; 最后对上述两种方法线性加权, 提出了一种加权的本体概念语义相似度计算方法. 实验结果表明该方法能进一步正确区分本体中父子概念及兄弟概念间的相似程度.  相似文献   

17.
基于加权语义网和有效信息的个性化用户兴趣建模*   总被引:1,自引:0,他引:1  
为了提高个性化用户兴趣建模的准确率,对用户建模过程进行了优化。在计算文档相似度时,综合考虑特征词的语义关系以及在文档中的分布情况,引入加权语义网,提高了文档相似度计算精度;在计算兴趣度权值时,引入有效信息的概念及量化方法,以解决用户兴趣类权值计算过于主观的问题,并提出具体权值算法,提高了权值计算的准确性。实验结果表明,改进的方法在用户兴趣聚类和兴趣类别权值计算的准确率上都较以往方法有较大提高。  相似文献   

18.
针对概念语义相似度计算的片面性和不完善性问题,该文提出了一种综合的概念语义相似度计算方法。首先,基于传统的语义距离模型,综合考虑了有向边的类型、深度、密度、方向等因素,计算概念相似度;然后,根据本体的五元组组成元素,分别计算概念相似度;最后,使用sigmoid阈值函数求得各个相似度对应的调节因子值,并进行综合,实现了调节因子与各个相似度的自适应。实验证明,该方法有效且精确。  相似文献   

19.
一种结合词项语义信息和TF-IDF方法的文本相似度量方法   总被引:14,自引:0,他引:14  
黄承慧  印鉴  侯昉 《计算机学报》2011,34(5):856-864
传统的文本相似度量方法大多采用TF-IDF方法把文本建模为词频向量,利用余弦相似度量等方法计算文本之间的相似度.这些方法忽略了文本中词项的语义信息.改进的基于语义的文本相似度量方法在传统词频向量中扩充了语义相似的词项,进一步增加了文本表示向量的维度,但不能很好地反映两篇文本之间的相似程度.文中在TF-IDF模型基础上分...  相似文献   

20.
针对目前的领域概念查询聚类方法中未见考虑用户偏好,提出一种支持用户偏好查询的领域概念图模型.该图模型主要包括两部分:基于概念本身考虑,利用综合语义相似度计算方法构建概念的语义关系图;基于用户查询偏好考虑,采用改进的互信息计算用户生成数据间隐含的查询偏好,将其结果用于补全领域概念的语义关系图.这一处理过程使得原有领域概念...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号