首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 234 毫秒
1.
陈千  桂志国  郭鑫  向阳 《计算机应用》2015,35(2):456-460
针对网络大数据时代文本流的主题演化研究大多基于经典概率主题模型,以词袋假设为前提导致主题的语义缺失问题和批处理问题,提出一种在线增量的基于特征本体的主题演化算法。首先,基于词共现和通用本体库WordNet构建特征本体,用特征本体对文本流主题进行建模;其次,提出一种文本流主题矩阵构建算法,实现在线增量主题演化分析;最后,依据该矩阵提出文本流主题本体演化图构建算法,利用特征本体的子图相似度计算主题相似度,从而获得文本流中主题随时间的演化模式。在科技文献上的实验上,满意度同传统在线潜在狄利克雷分配模型(LDA)不相上下,但时间复杂度降低到O(nK+N)。所提出的方法引入了本体,加入了语义关系标注,可图形化展现主题的语义特征,并在此基础上在线增量地实现了主题演化图的构建,在语义解释性和主题可视化方面更具有优势。  相似文献   

2.
在研究文本倾向性识别方法的基础上,分别实现基于文本分类、基于语义规则模式和基于情感词的倾向性分析算法.研究情感本体构建和基于HowNet与主题领域语料的情感概念选择方法,两者结合能提高情感本体中概念的全面性和领域针对性.利用情感本体抽取特征词并判断其情感倾向度,结合句法规则及程度副词影响,用特征情感倾向度作为特征权重,采用机器学习的方法对主题网络舆情web文本进行倾向性分析.实验表明,其分析结果有更高的准确率和召回率,实现方案的普遍性和稳定性值得进一步研究.  相似文献   

3.
在社交网络时代,自媒体已成为群众发布、获取信息的重要渠道,网络舆情研判已经成为各级政府部门的主要任务之一。自媒体在反映个人情感和意见思潮的同时,也会汇聚群众的情感共鸣,因此对舆情文本的情感进行分析并获取其主题成为关键。通过爬虫工具对相关舆情文本进行抓取,将获取的数据使用Python的SnowNLP模块进行情感倾向划分,结合无监督的机器学习算法LDA主题模型进行文本关键词聚类,从而确定舆情规模、情感演变规律和舆情的热点主题词,为完善舆情应对机制提供科学支持。  相似文献   

4.
基于顶层本体的电子对抗领域本体构建方法   总被引:1,自引:0,他引:1       下载免费PDF全文
针对大型领域本体的可扩展问题,提出一种基于顶层本体的领域本体构建方法MBECO。通过最大范围地继承顶层本体框架,构建规范化的传感器领域、信息对抗领域、指挥控制领域等子领域本体模型,并将其嫁接入顶层本体,在顶层本体框架下进行子领域本体的集成,构建语义本体ECSON。实例表明,该方法将为系统级的分布式电子对抗仿真提供完善的战场空间本体。  相似文献   

5.
面向Web信息资源的领域本体模型自动构建机制的研究   总被引:1,自引:1,他引:0  
金鑫 《计算机科学》2012,39(6):213-216
领域本体的构建是本体工程研究与应用的重要内容。面向网络Web信息资源,获取领域相关文本信息,通过对文本的概念分析,构建领域本体模型。提出一套本体自动构建机制,该本体构建基于数据挖掘和机器学习技术,内容主要包括基于贝叶斯(Bayes)分类原理;提出多个分类器方式的概念分类过程和算法;提出概念关联分析和概念自学习算法,建立本体原型;提出面向OWL本体模型的转换映射机制,构建基于OWL的本体模型。此外,还提出了从网络资源获取、领域本体建模到本体实施应用的一套完整的本体构建和应用实施的解决方案。  相似文献   

6.
海量的网络信息中包含着丰富的情感信息,基于情感计算的网络信息分析技术有着广阔的应用前景.目前,网络信息分析的研究工作,有些已取得很多成果.然而基于情感计算的网络信息分析研究却刚刚起步.中文自然语言处理技术的不断发展,为基于情感计算的网络中文信息分析提供了重要的技术支撑.对基于情感计算的网络中文信息分析相关技术,包括中文情感词汇本体的构建、中文词语的情感倾向性判断、中文文本情感倾向性判断作了概述总结,并提出了今后的研究方向.  相似文献   

7.
微博立场检测是判断一段微博文本针对某一目标话题所表达的观点态度是支持、中立或反对.随着社交媒体的发展,从海量的微博数据中挖掘其蕴含的立场信息成为一项重要的研究课题.但是现有的方法往往将其视作情感分类任务,没有对目标话题和微博文本之间的关系特征进行分析,在基于深度学习的分类框架上,扩展并提出了基于Bert-Condition-CNN的立场检测模型,首先为提高话题在文本中的覆盖率,对微博文本进行了主题短语的提取构成话题集;然后使用Bert预训练模型获取文本的句向量,并通过构建话题集和微博文本句向量之间的关系矩阵Condition层来体现两个文本序列的关系特征;最后使用CNN对Condition层进行特征提取,分析不同话题对立场信息的影响并实现对立场标签的预测.该模型在自然语言处理与中文计算会议(NLPCC2016)的数据集中取得了较好的效果,通过主题短语扩展后的Condition层有效地提升了立场检测的准确度.  相似文献   

8.
基于语义Web的网络学习资源库本体实现   总被引:8,自引:0,他引:8       下载免费PDF全文
将语义Web技术引入网络学习系统,构造了一个基于语义Web架构的网络学习资源库本体,实现对网络学习系统中学习资源的管理。在分析本体建模方式以及网络学习资源库基本功能的基础上,定义了由学习资源本体和用户本体组成的学习资源库顶层本体,并给出系统类图,在Protégé3.1中实现了本体建模,给出了基于OWL的本体描述,对定义的本体进行了评估,并用基于本体的推理实例验证了本体的有效性。  相似文献   

9.
文本倾向性分析已成为当前自然语言处理领域的研究热点,其研究成果具有极高的应用价值。针对网络在线中文评论的特点,基于领域本体与情感词典对商品评论倾向性进行分析。其主要思想是首先构建面向商品论坛的领域本体;其次利用情感词典与上下文极性算法计算情感词极性;再次通过将本体与SBV算法相结合,实现评价对象和评价词的二元组抽取;最后完成句子的倾向性分析。实验结果表明,有效提高了句子级倾向性分析的准确率。  相似文献   

10.
主题检测近年来在文本挖掘和自然语言处理领域得到了广泛的应用,对主题进行结构建模是主题检测的基础。为了对文本流中的多粒度主题进行建模,提出一种基于语义层次树的主题结构模型。该模型利用领域本体的特点,将主题同本体作一一映射,结合概率理论,将概念集里的概念用主题树的叶子节点表示,每一层中的节点均是下一层节点的多项分布,使之更适合描述文本流中多粒度的主题结构。为了便于构建主题的空间结构,提出主题的相似度和事件相关度计算方法。该文结尾设计了实验构造真实新闻文本流数据上的主题树。实验结果表明,该结构模型能够体现主题丰富的多粒度空间语义特征。  相似文献   

11.
分析海洋生态领域知识体系特点,提出了海洋生态知识组织模型;借鉴工程领域文献中的“功能”概念描述海洋生态功能过程;参照〗已有研究提出的功能知识表示框架,确定“设备功能”视点,提出海洋生态领域上层本体,指导构建了海洋生态本体模型和海洋生态形式化本体。扩展基于描述逻辑的Web本体语言OWL-DL,提出了面向过程的OWL-Process模型,构建了海洋生态功能过程-光合作用过程本体的实例。基于海洋生态本体设计开发了海洋生态知识管理系统,实现了海洋生态领域知识的查询和生态危机预警功能,该本体应用系统也验证了海洋生态领域本体构建的有效性、合理性和正确性。  相似文献   

12.
为满足综合战场环境建模的需求,提出一种基于上下文的综合战场环境本体建模方法。针对模型各种应用领域,分别抽取不同处理过程中共有的以及关键处理过程中特有的视角,形成上下文。对概念进行上下文限定,并在各自上下文中确定概念间的关系,构建上下文限定本体模型。应用结果表明,该模型检索效率较高,能够表述复杂关系。  相似文献   

13.
陈德彦  赵宏  张霞 《软件学报》2020,31(9):2855-2882
由于本体具有强大的知识表示和推理能力,本体已经在很多领域得到了广泛应用.然而,本体的深入应用还面临着很多深层次的共性语义映问题,已有的本体建模方法仅仅提出了一些简单的指导原则和基本步骤,使得知识工程师仍然无从下手.在基于领域专家知识构建领域语义知识库时,针对领域专家知识中的一词多义、多元关系和安全需求等3类共性语义映射问题,从5个方面展开了深入研究,提出了相应的语义映射方法,总结了10条本体建模约定.最后构建了一个完整的应用案例,并对所提出的5类语义映射方法进行了评价.  相似文献   

14.
网络安全分布式预警体系结构研究   总被引:8,自引:0,他引:8  
文章提出了一个网络安全分布式预警体系结构,对实现该体系结构所涉及的相关技术和方法进行了研究。将整个受保护网络划分为若干安全域。每个安全域由若干探测器代理、一个预警中心和其它网络节点组成。在每个安全域中,处在不同网段的探测器代理负责收集网络数据,并通过建立适应性异常检测模型和采用异常评估方法,能够对网络中可能发生的异常行为进行实时分析。预警中心接收本安全域各探测器代理的异常分析结果,结合其它安全信息进行数据融合,生成预警信息并根据被预警行为的目的IP地址传送到目的安全域。同时,预警中心也接收其它安全域传来的预警信息(包括入侵信息),进而在网络上实现分布式预警。通过分布式预警,能够使安全监管系统在攻击发生前预先采取一些防护措施,增强网络的安全。  相似文献   

15.
Compared to building a single requirements view, modeling stakeholder viewpoints and then merging them is shown to improve the understanding of the problem domain, but also very time-consuming. How has the situation changed? This paper reports our replication of a case study, where we take advantage of theoretical replication to mitigate one of the original study design’s threats and to embrace an important evolving factor, namely automated tool support for producing \(i*\) models. Our replicate study updates the prior results by showing the time saving enabled by the tool and verifies the rich domain understanding gained through viewpoint-based modeling. In an attempt to explain why viewpoints lead to richer domain understanding, we examine in a posteriori way the role that traceability plays in building individual and team-wide requirements models. Our post hoc analysis results suggest that better traceability from the sources makes team-level requirements modeling more focused, whereas the lack of traceability makes it less fruitful. Our work not only shifts the case study from an exploratory to an explanatory nature, but also proposes the integration of conflict-centric views into viewpoint merging to further improve the understanding about stakeholder requirements’ trade-offs.  相似文献   

16.
翟东升  黄焱 《计算机工程》2008,34(21):247-249
借鉴多目标决策树中规范化的思想,提出将一般指标体系结构规范化为由一个根节点和若干叶子节点构成的2层多叉树。根据领域本体的建模方法论,建立基于描述逻辑的指标体系本体模型,并利用本体编辑工具Protégé3.1.1将本体形式化,给出了基于RDF+OWL的形式化表示。利用Jena开发包和Agent开发平台Able开发了预警原型系统,从实验上论证了指标体系本体建模的正确性和其在预警系统中的应用可行性。  相似文献   

17.
电力电网系统在电力传输控制中节点分布具有动态性,容易产生热线预警,为了提高电力热线预警检测能力,提出一种基于小波变换的电力热线预警信息盲检测方法。构建电力热线预警的信号模型,采用随机线性时间序列分析方法构建电力热线预警的统计信号分析模型,对电力热线预警信号采用相关性检测方法进行时频分解,采用小波分析方法将电力热线预警信号从时域向频域转换,根据接收到的两路电力热线预警信息的关联性进行特征匹配和自动分离,实现对电力热线预警信息的盲分离和噪声干扰抑制,采用小波变换和谱特征检测方法,实现对电力热线预警的盲检测。仿真结果表明,采用该方法进行电力热线预警检测的盲分离性能较好,检测准确概率较高,提高了电力热线预警能力。  相似文献   

18.
传统联机分析处理(OLAP)系统存在着形式化业务知识参与不足的状况,对深度推理分析造成了制约和局限。为了克服上述缺点,提出一种领域本体驱动的OLAP系统构建方法。首先,通过分析现有本体构建方法的局限性,依托实体类多特征加权相似度判断算法,提出先全局设计后局部抽取的半自动本体构建模式,实现矿山生产领域知识形式化;接着在此基础上,以矿山生产能力关键指标为度量,完成负载业务概念多维本体(MDO)建模;最后,在实际矿山决策系统项目建设中,进行了方法检验。实验结果表明,该方法充分发挥领域本体形式化表达与推理优势,有效整合多源异构信息和明晰多维分析过程,实现内隐知识与关联规则深度挖掘;同时借助高频通用概念视图定义,避免重复维度建模,改进了传统OLAP效能。  相似文献   

19.
Adapting to user's requirements is a key factor for enterprise success. Despite the existence of several approaches that point in this direction, simplifying integration and interoperability among users, suppliers and the enterprise during product lifecycle, is still an open issue. Ontologies have been used in some manufacturing applications and they promise to be a valid approach to model manufacturing resources of enterprises (e.g. machinery and raw material). Nevertheless, in this domain, most of the ontologies have been developed following methodologies based on development from scratch, thus ontologies previously developed have been discarded. Such ontological methodologies tend to hold the interoperability issues in some level. In this paper, a method that integrates ontology reuse with ontology validation and learning is presented. An upper (top-level) ontology for manufacturing was used as a reference to evaluate and to improve specific domain ontology. The evaluation procedure was based on the systemic methodology for ontology learning (SMOL). As a result of the application of SMOL, an ontology entitled Machine of a Process (MOP) was developed. The terminology included in MOP was validated by means of a text mining procedure called Term Frequency–Inverse Document Frequency (TF–IDF) which was carried out on documents from the domain in this study. Competency questions were performed on preexisting domain ontologies and MOP, proving that this new ontology has a performance better than the domain ontologies used as seed.  相似文献   

20.
Key concept extraction is a major step for ontology learning that aims to build an ontology by identifying relevant domain concepts and their semantic relationships from a text corpus. The success of ontology development using key concept extraction strongly relies on the degree of relevance of the key concepts identified. If the identified key concepts are not closely relevant to the domain, the constructed ontology will not be able to correctly and fully represent the domain knowledge. In this paper, we propose a novel method, named CFinder, for key concept extraction. Given a text corpus in the target domain, CFinder first extracts noun phrases using their linguistic patterns based on Part-Of-Speech (POS) tags as candidates for key concepts. To calculate the weights (or importance) of these candidates within the domain, CFinder combines their statistical knowledge and domain-specific knowledge indicating their relative importance within the domain. The calculated weights are further enhanced by considering an inner structural pattern of the candidates. The effectiveness of CFinder is evaluated with a recently developed ontology for the domain of ‘emergency management for mass gatherings’ against the state-of-the-art methods for key concept extraction including—Text2Onto, KP-Miner and Moki. The comparative evaluation results show that CFinder statistically significantly outperforms all the three methods in terms of F-measure and average precision.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号