首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 62 毫秒
1.
结构化文档是云计算环境中实现信息交互与传播的载体,针对已有研究工作缺乏能够描述这种载体的结构化文档模型的问题,在深入分析云计算环境中结构化文档特征的基础上,对文档元素、原子文档元素、连接、文档片段、复杂文档元素等进行形式化定义,建立能够满足这种特征的结构化文档形式化模型。最后,指出云计算环境中结构化文档进一步的研究方向。  相似文献   

2.
一个基于关联规则的多层文档聚类算法   总被引:3,自引:0,他引:3  
提出了一种新的基于关联规则的多层文档聚类算法,该算法利用新的文档特征抽取方法构造了文档的主题和关键字特征向量。首先在主题特征向量空间中利用频集快速算法对文档进行初始聚类,然后在基于主题关键字的新的特征向量空间中利用类间距和连接度对初始文档类进行求精,从而得到最终聚类。由于使用了两层聚类方法,使算法的效率和精度都大大提高;使用新的文档特征抽取方法还解决了由于文档关键字过多而导致文档特征向量的维数过高的问题。  相似文献   

3.
基于知识模式的文档描述构建方法   总被引:1,自引:0,他引:1  
鉴于传统文档分析方法不能有效获取弱结构文档的知识描述,提出基于知识模式的文档描述构建方法。该方法综合考虑知识的行文模式与上下文结构特征,从而能够比传统方法更为有效地获取弱结构文档的知识描述。  相似文献   

4.
针对应急决策中的不确定性,在传统区间代数方法的基础上,采用对区间时间断点模糊化处理并设定其取值范围的方法实现了应急领域不确定时态知识的表达,在此基础上,研究时态推理中的证据合成,通过时间区间集合,时态关系集合以及概率指派函数合成后的更新,给出了解决方案,结合应用算例进行分析。验证了该方法的有效性。  相似文献   

5.
基于案例推理的应急辅助决策方法研究*   总被引:4,自引:1,他引:4  
将案例推理的方法应用到应急决策中,为应急决策提供了一种实用的科学辅助方法。在分析了应急案例特征的基础上设计了一种基于概念树—突发事件本体模型—事件元模型三层架构的应急案例通用的案例描述与组织方法;根据应急案例属性复杂及属性值缺失的问题设计了基于结构相似度和属性相似度双层结构的案例全局相似度计算算法,避免了传统最近相邻算法中的属性值缺失问题;最后通过基于案例推理的应急辅助决策原型系统的开发使设计方法得以实现,证明了该方法具有较好的实用性。  相似文献   

6.
基于“知识元”的知识组织与检索   总被引:19,自引:0,他引:19  
文章提出了知识组织与检索中的知识元与向导信息的导航变换理论与方法,对建立知识元的理论基础认知元做了研究,给出了文本中的知识元抽取的模块图。该理论方法已采用软件实现,展现出了光明的前景。  相似文献   

7.
研究表明合理考虑术语之间的关系可以提高检索系统的性能。采用共现分析的方法从文档集合中学习得到术语之间的关系,并应用到结构化文档检索中,提出了一个基于贝叶斯网络的结构化文档检索模型,给出了其拓扑结构、概率估计以及推理过程。实验表明该模型的检索性能要优于没有考虑术语之间关系的模型。  相似文献   

8.
知识管理建模是构建组织知识管理系统的基础.组织知识管理建模远比信息管理建模复杂,迫切需要建模工具的支持.从知识内容和管理两个层面分析提出知识管理的建摸需求,以此为依据建立知识管理元模型.组织知识管理元模型包括组织战略、组织结构、组织流程和组织知识地图四个子模型.为了方便建模工具的开发,用组织知识管理对象建模语言集成各子模型对应的建模语言.在此基础上实现了一个知识管理建模工具.  相似文献   

9.
基于知识元本体的知识统一表示   总被引:1,自引:0,他引:1  
分析描述逻辑和本体论语义,提出知识元本体论点,并用Web本体语言OWL详细地构建了知识元本体的初步版本.提出基于知识元本体的知识表示方法.从而为构建具有更小知识单元共享粒度和知识语义推理的知识库系统提供统一的知识元本体定义.  相似文献   

10.
基于知识元语义网格平台的知识发现研究   总被引:6,自引:0,他引:6  
文章讨论了Internet的增长和普及带来的科学研究对象和方法的巨大变化,科学家在跨领域合作研究过程中对数据的语义和复杂度要求越来越高,寻找关联方式发现知识成为科学家所面临的最严峻的挑战。面对这一挑战,文章提出构建知识元语义网格平台,实现以知识元为知识单位的知识发现服务体系结构。文章对基于网格的知识发现概念、网格的知识服务结构、基于知识元的语义网格知识发现基本模型作了研究。  相似文献   

11.
基于本体的知识建模方法有很多,在某些特定领域采用传统的本体建模方法存在着一些不足。以突发事件领域为例,提出了基于事件本体的知识建模方法。该模型分为上层事件类、下层事件类和事件实例,上层事件类描述的抽象的事件的分类体系,下层事件类是通过事件类关系组成的事件格结构。该模型不仅可以描述事件的时间、地点、对象等要素,还能描述事件类之间的关系。采用本体建模工具Protégé来构建突发事件领域本体,并以“恐怖袭击”作为实例验证了该模型的可用性。研究结果表明,该模型可以清晰地描述事件类的完整性,语义清晰,扩展性强。  相似文献   

12.
Web文本表示方法作为所有Web文本分析的基础工作,对文本分析的结果有深远的影响。提出了一种多维度的Web文本表示方法。传统的文本表示方法一般都是从文本内容中提取特征,而文档的深层次特征和外部特征也可以用来表示文本。本文主要研究文本的表层特征、隐含特征和社交特征,其中表层特征和隐含特征可以由文本内容中提取和学习得到,而文本的社交特征可以通过分析文档与用户的交互行为得到。所提出的多维度文本表示方法具有易用性,可以应用于各种文本分析模型中。在实验中,改进了两种常用的文本聚类算法——K-means和层次聚类算法,并命名为多维度K-means MDKM和多维度层次聚类算法MDHAC。通过大量的实验表明了本方法的高效性。此外,我们在各种特征的结合实验结果中还有一些深层次的发现。  相似文献   

13.
基于大规模真实文本的数值知识元挖掘研究   总被引:2,自引:0,他引:2       下载免费PDF全文
探讨了从海量文献中挖掘知识元的背景,并详述了从海量年鉴文本中抽取宏观数值知识元的基本流程和各主要环节的算法,并重点对数值知识元主体抽取的效果进行了分析,实验结果表明在特定领域内知识元挖掘要达到实用水平是可行的。  相似文献   

14.
钟征燕  郭燕慧  徐国爱 《计算机应用》2012,32(10):2776-2778
在数字产品日益普及的今天,PDF文档的版权保护问题已成为信息安全领域研究的热点。通过分析PDF文档的结构及相关数字水印算法,针对当前一些大容量文本水印算法存在增加文档大小的缺陷,提出了一种基于PDF文档结构的数字水印算法。该算法利用行末标识符不会在文档中显示的特性,通过等量替换PDF文档中具有固定格式的交叉引用表的行末标识符,来实现水印信息的间接嵌入。实验结果表明,该算法水印容量能满足数字版权保护的要求,隐蔽性好,能抵抗统计等攻击。  相似文献   

15.
D.  Y.  B.  J. -M. 《Data & Knowledge Engineering》2003,46(3):345-375
The main contribution of this paper is to lay down a conceptual framework for document semantics modeling. This framework provides a generic graphical knowledge representation model based on Sowa’s conceptual structures. Modeling primitives are introduced to represent factual and ontological knowledge that can be expressed in electronic documents. Binding features are proposed so as to keep knowledge representation and knowledge formulation linked together.

This framework may be applied to various domains and may accept, for this purpose, many different ontological extensions. Thus an extension is provided so as to properly handle the particular kind of knowledge encountered in the legal domain.  相似文献   


16.
面对海量数据的管理和分析,文本自动分类技术必不可少。特征权重计算是文本分类过程的基础,一个好的特征权重算法能够明显提升文本分类的性能。本文对比了多种不同的特征权重算法,并针对前人算法的不足,提出了基于文档类密度的特征权重算法(tf-idcd)。该算法不仅包括传统的词频度量,还提出了一个新的概念,文档类密度,它通过计算类内包含特征的文档数和类内总文档数的比值来度量。最后,本文在两个中文常见数据集上对五种算法进行实验对比。实验结果显示,本文提出的算法相比较其他特征权重算法在F1宏平均和F1微平均上都有较大的提升。  相似文献   

17.
评价智能答疑系统优劣的重要指标是准确率和召回率.系统结合Q/A库和文档库搜索技术的优势实现,利用成熟的Q/A技术回答常见问题,保证了系统的准确率和高效率.利用智能文档搜索技术解答非常见问题,提高了系统的召回率,又因为事先对文档作了预处理,使搜索效率明显提高.同时系统基于课程开发,关键词的词汇量少而精确,使得语义理解的处理得以简化.  相似文献   

18.
文本挖掘是发现文本中所包含的内容和意义的过程。向量空间模型是文本挖掘中成熟的文本表示模型,而特征项的选择对其性能有着重要的影响。但以前的研究都把目光聚焦于文本中出现的特征项,忽略了文档之间的相关性。这种局限使这些特征项不能提供丰富的语义信息。始于2005年的Web2.0大潮席卷了整个互联网,在此背景下应运而生的社会化标注成了相关文档的语义桥梁,此文本挖掘带来了新的生机。据此本文利用IRF(Iterative Reinforcement Framwork)模型为文档产生了丰富的特征项,大大提高了文档的检索率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号