首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 171 毫秒
1.
基于潜在语义索引的文本分析方法   总被引:1,自引:0,他引:1  
本文分析是文本处理领域中的重要内容,它可以有效地改进文本检索、文本过滤以及文本摘要的精度.本文简要描述了文本的物理结构和逻辑结构以及文本分析的背景,将潜在语义索引引入文本分析中,提出了基于潜在语义索引的层次分析方法.该方法保证了层次划分的有序性和聚合性,可操作性强,便于解释,并给出了在文本检索、文本过滤和文本摘要中的应用.  相似文献   

2.
为了完善问答系统、搜索平台等信息检索系统对本体的应用需求,提出了一种基于网站结构的领域本体学习方法,该方法对网站结构进行分析,通过挖掘网站结构中所隐藏的知识进行本体学习,实践证明该方法可以更快、更准确地获取特定领域中的概念、概念层次以及概念间的非分类关系,最终帮助构建本体。  相似文献   

3.
文本层次分析与文本浏览   总被引:7,自引:2,他引:5  
本文简要描述了文本的物理结构和逻辑结构以及相应的向量空间模型。研制了具有导航机制的文本浏览系统。提出了文本结构分析中的层次分析方法,它采用有序划分层次的方法。并在此基础上,给出了文本结构中各单元的标记信息,由此形成了文本的可视化表示。利用文本、层次、段落的超文本连接,根据浏览的需要,逐级展现文本细节,帮助用户有目的、有选择地浏览文本。最后给出评价的结果。  相似文献   

4.
Semantic Web研究综述   总被引:10,自引:0,他引:10  
近年来,Semantic Web逐渐成为WWW领域的研究热点以及智能化网络服务和应用开发中的关键技术之一。归纳了Semantic Web技术的研究背景和主要发展历史。在分析了典型的Semantic Web概念后,给出了Semantic Web的定义。通过讨论Semantic Web构想的层次框架模型,指出了各个层次扮演的角色,并着重分析了Semantic Web的重要研究领域,指出了它们在Semantic Web构架中的核心作用。通过分析Semantic Web的应用领域和相关开发工具以及面临的问题和挑战,指明了Semantic Web研究和实践的方向。作为总结,给出了Semantic Web领域下一步的研究趋势。  相似文献   

5.
文本连贯性分析是计算机辅助评估中的重要内容,是对文本的表达质量进行评估的基础.提出一种将潜在语义分析方法与基于有序聚类的层次分析方法相结合的文本层次结构分析方法,该方法保证了层次划分的有序性,可操作性强,不依赖于具体领域.基本思想是:对于输入文本,首先识别文本物理结构,然后将文本依据主题划分为若干层次,最终获得文本的逻辑结构.实验结果表明,该方法是有效的,其准确率达到74.96%.  相似文献   

6.
由于对象模型和关系模型存在阻抗不匹配,实现对象和关系的映射已成为软件开发领域的关键问题。本文提出了ORM系统的三层模型,在业务逻辑层和关系数据库的物理存储结构中间增加一个O-R映射,并给出了各个层次的详细设计和分析,最后验证了该模型在实际应用中的有效性。  相似文献   

7.
一种新的通用概念层次编码方法   总被引:1,自引:0,他引:1  
概念层次是目前数据挖掘和知识发现的前沿性方法。为了把概念层次用于数据挖掘,需要解决如何从现有数据集自动生成概念层次,如何存储和处理网状概念层次结构及如何提高概念层次结构的搜索效率等问题。文章提出适用于任何数据挖掘功能的通用编码方法——基于层次域的概念层次实数编码法,该方法有效地解决了概念层次的存储和检索问题,并在微机电系统领域进行了与典型算法的对比分析。  相似文献   

8.
经过分析本体原型系统中存在的关键问题,提出基于FCA的本体原型系统来弥补缺陷,并阐明了系统的主要特色是采用FCA技术进行本体的构建、合并、三维可视化展现,其中为了在本体展现中简化概念格的显示,提出子概念格的判定方法。最后通过实例,从领域中生成了所有隐含的本体概念,形成了概念之间的上下级关系,结合相关性几率模式给出了非层次级概念之间的相似性以及概念与对象之间的相关度,从而提高了用户在本体中的查询效率。  相似文献   

9.
本体可以提供强大的知识表示方法,是信息检索领域中的重要内容。传统的本体概念相似度计算方法大多采用特定于描述语言的通用推理服务来进行匹配,这些方法忽略了概念的语义信息。通过设计一个基于OWL本体的语义检索模型,介绍了如何通过概念的属性以及层次关系来表达概念的语义,计算概念间的柔性相似度。实验结果表明,该方法能充分利用OWL属性特征与层次关系来计算相关概念之间的柔性相似度,可以根据需要动态地调节匹配范围,并给出其在文本分类中的应用。  相似文献   

10.
文章主要对高职教学管理系统中的数据库设计进行分析,通过对系统数据库概念结构、逻辑结构、物理结构的设计,阐述了系统数据库设计过程及原理.  相似文献   

11.
Automated text categorization has witnessed a booming interest with the exponential growth of information and the ever-increasing needs for organizations. The underlying hierarchical structure identifies the relationships of dependence between different categories and provides valuable sources of information for categorization. Although considerable research has been conducted in the field of hierarchical document categorization, little has been done on automatic generation of topic hierarchies. In this paper, we propose the method of using linear discriminant projection to generate more meaningful intermediate levels of hierarchies in large flat sets of classes. The linear discriminant projection approach first transforms all documents onto a low-dimensional space and then clusters the categories into hier- archies accordingly. The paper also investigates the effect of using generated hierarchical structure for text classification. Our experiments show that generated hierarchies improve classification performance in most cases.  相似文献   

12.
基于信息论的潜在概念获取与文本聚类   总被引:7,自引:3,他引:4  
李晓光  于戈  王大玲  鲍玉斌 《软件学报》2008,19(9):2276-2284
针对词、潜在概念、文本和主题之间的模糊关系,提出一种基于信息论的潜在概念获取与文本聚类方法.方法引入了潜在概念变量和主题变量。根据信息论中熵压缩编码理论,定义了一个全局目标函数,给出一种类似于确定性退火算法的求解算法,用以获得概念层次树以及在不同层次概念上的文本聚类结果,是一种双向软聚类方法.方法通过基于最短描述长度原则的概念选择方法,最终确定概念个数和对应的文本聚类结果.实验结果表明,所提出的方法优于基于词空间的文本聚类方法以及双向硬聚类方法.  相似文献   

13.

Formal concept analysis is a method of exploratory data analysis that aims at the extraction of natural clusters from object-attribute data tables. The clusters, called formal concepts, are naturally interpreted as human-perceived concepts in a traditional sense and can be partially ordered by a subconcept-superconcept hierarchy. The hierarchical structure of formal concepts (so-called concept lattice) represents a structured information obtained automatically from the input data table. The present paper focuses on the analysis of input data with a predefined hierarchy on attributes thus extending the basic approach of formal concept analysis. The motivation of the present approach derives from the fact that very often, people (consciously or unconsciously) attach various importance to attributes which is then reflected in the conceptual classification based on these attributes. We define the notion of a formal concept respecting the attribute hierarchy. Formal concepts which do not respect the hierarchy are considered not relevant. Elimination of the non-relevant concepts leads to a reduced set of extracted concepts making the discovered structure of hidden concepts more comprehensible. We present basic formal results on our approach as well as illustrating examples.  相似文献   

14.
基于概念空间的文本检索系统   总被引:10,自引:3,他引:10  
当前信息检索存在着信息过载和词汇不匹配的问题。文章提出了一种新的检索方式缓解这两个问题。这种检索方法在文本聚类的基础上,基于概念空间并与传统的关键词检索相结合能够帮助用户快速、准确地定位所需要查找的信息。文章将对这种检索方式进行介绍,并且着重介绍利用共现分析以及Hopfield网络生成概念空间。  相似文献   

15.
在面向属性归纳(AOG)的数据挖掘中,属性归约及概念归纳都离不开概念层次.而概念层次一般都是先验的,当出现概念层次中没有的新的概念时,无法进行归纳.以属性论为基础的概念相容测度,将概念层次单纯的文字表示转换为其定性基准的表示,给出了名称型属性的概念层次树的动态生成算法.当有新的属性值出现时,可以不用重新生成概念树,只需调用该算法,将新的属性值插入已有概念层次树即可.从而可以让概念归纳与修改概念层次同时进行,使AOG具有了动态归纳的特性.  相似文献   

16.
提出了一种基于模糊形式概念分析的文本分类模型,通过概念化文本到一个更加抽象的概念形式,以概念而非文本作为训练样本,最终结合近邻分类算法实现文本分类决策。实验结果表明该算法有很好的性能。  相似文献   

17.
Recently research on text mining has attracted lots of attention from both industrial and academic fields. Text mining concerns of discovering unknown patterns or knowledge from a large text repository. The problem is not easy to tackle due to the semi-structured or even unstructured nature of those texts under consideration. Many approaches have been devised for mining various kinds of knowledge from texts. One important aspect of text mining is on automatic text categorization, which assigns a text document to some predefined category if the document falls into the theme of the category. Traditionally the categories are arranged in hierarchical manner to achieve effective searching and indexing as well as easy comprehension for human beings. The determination of category themes and their hierarchical structures were most done by human experts. In this work, we developed an approach to automatically generate category themes and reveal the hierarchical structure among them. We also used the generated structure to categorize text documents. The document collection was trained by a self-organizing map to form two feature maps. These maps were then analyzed to obtain the category themes and their structure. Although the test corpus contains documents written in Chinese, the proposed approach can be applied to documents written in any language and such documents can be transformed into a list of separated terms.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号