首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 218 毫秒
1.
基于Web数据的本体概念抽取   总被引:1,自引:0,他引:1  
本体论(Ontology)在知识管理及语义网(Semantic Web)中越来越重要,但建造本体往往需要耗费大量的时间,且建造完成后本体的维护对知识管理者来说也是费时的工作。自动创建领域Ontology可以克服手工方法的不足,成为当前的研究热点之一;而概念是本体中最重要的组成部分之一,从半结构化的Web文档中自动抽取概念的效率和准确度的高低,直接决定了自动建造的本体的质量,提出一种自动的本体概念抽取模型,此模型不依赖于领域词典或核心本体,并且能达到快速有效地通过对中文Web文本挖掘自动地构建及更新领域本体概念的目的。  相似文献   

2.
随着数据挖掘应用的深入,非结构化和半结构化数据的挖掘,将成为下一个数据挖掘应用的热点。文本挖掘是一种典型的非结构化数据挖掘,而Web挖掘则是典型的半结构化数据挖掘。所以将信息处理技术中的汉语分词、信息抽取、语义分析等技术应用到Web挖掘研究技术是必然的发展趋势。本文根据Web挖掘的特点,运用数据抽取进行数据结构转换并把语义分析技术应用到数据抽取的过程中的思想,以便使数据提取更加准确。  相似文献   

3.
为了使得广大高校教师和学生能够快速准确地进行信息检索和知识获取,以便了解本学科前沿领域知识,研究开发了一个基于语义Web的教研辅助系统平台,本文就该平台中图像的本体构建问题进行了探讨.按照图像所属的学科专业、课程和图像所表达的主题对图像进行分类,并用Web本体语言OWL来对本体进行描述.  相似文献   

4.
作为一种能够在语义层和知识层上描述信息系统的概念建模工具,本体在许多领域得到了广泛应用。由于本体的构建和维护工作费时费力,本体的构建方法研究成为了实现语义Web应用的最重要技术。综述了从不同的结构化信息源(数据库、XML文档以及Web表格)构建本体的方法,进行了详细分析与对比,并给出其存在的不足之处以及未来可能的研究方向。  相似文献   

5.
唐攀  王红卫  王喆  刘丹 《计算机应用研究》2011,28(11):4160-4165
目前,应急预案是分布于多个单位的非结构化文档,缺乏统一的建模方法,造成对预案描述的领域知识进行表示和利用存在困难。为解决以上问题,提出一种基于本体的知识建模方法,对应急预案文本进行建模,并实现应急领域知识共享。根据对应急预案文本结构特征进行分析,在重用现有本体模型的基础上提出了各主要要素的本体模型,形成一种应急预案本体模型(emergency plan ontology model,EPOM)。通过利用该方法对某区域防汛应急预案进行本体知识建模,开展应用研究。应用结果表明,该方法能够有效建模应急预案描述的  相似文献   

6.
吴江  赵宗涛 《计算机科学》2005,32(9):145-148
本文提出一种基于本体的非结构化知识管理系统框架.在该框架中,知识库由知识体和应用本体两部分组成,可解决知识的重用和共享问题.知识检索可以通过知识地图导航和自动检索两种方式完成,有一定的智能性.知识管理门户采用XML和XSL相结合的开发方法,具有动态特点.本文还对知识库的安全管理方法进行了初步研究,提出了一个可用的知识库安全管理解决方案.  相似文献   

7.
研究了从数据密集型Web页面中自动提取结构化数据并形成知识表示系统的问题。基于知识数据库实现动态页面获取,进行预处理后转换为XML文档,采用基于PAT-array的模式发现算法自动发现重复模式,结合基于本体的关键词库自动识别页面数据显示结构模型,利用XML的对象-关系映射技术将数据存入知识数据库,由此实现Web数据自动抽取。同时,利用知识数据库已有知识从互联网抽取新知识,达到知识数据库的自扩展。以交通信息自动抽取及混合交通出行方案生成与表示系统进行的实验表明该系统具有高抽取准确率和良好的适应性。  相似文献   

8.
Web上的数据量急剧膨胀使得进行Web数据挖掘成为数据挖掘技术研究的热点.而XML能够为Web挖掘提供半结构化的数据模型,解决了Web挖掘中的数据源问题.介绍了XML的和Web文本挖掘的概念,提出了一种基于XML的Web文本挖掘模型,剖析了该模型的各个组成部分,给出了该模型的特点.  相似文献   

9.
针对Deep Web查询界面集成问题,定义了一种面向专门领域的域序列模式图(FSRG)模型,用于表示和发现同一领域查询界面中的所有域序列模式.该模型将领域内不同查询页面的域序列模式统一到一个有向有环图中.基于序列模式图进行研究可发现领域模式中域的结构化组织排列规律.还论述了域序列模式图的构造、域子序列模式划分和领域所有域的整体序列模式发现方法.在有限领域下封闭测试表明,该模型及其算法对结构化Web界面分析有较大应用价值.研究为实现智能化的Web数据模式处理提供了域序列分析方法,对大规模智能集成和搜索应用有一定参考价值.  相似文献   

10.
语义Web中基于SKOS的知识组织模型   总被引:2,自引:0,他引:2  
语义Web中的知识组织问题越来越引起人们的关注,领域知识本体是理想的知识管理方案,但构建领域本体是件费时、费力的工作.为提供一种更为简单、易用的知识管理方案,采用W3C颁布的SKOS(simple knowledge organization system)构建领域知识组织系统,通过对模型中类与属性的扩展增强对知识的描述能力,研究模型与语义Web的结合问题,并分析了SKOS模型在语义Web中发挥的作用.  相似文献   

11.
支持智能搜索的自扩展知识库模型的研究和设计*   总被引:1,自引:1,他引:0  
利用自然语言处理和理解技术,提出并实现了一种可以对网页中的中文信息进行处理,获取并存储知识,具有自我扩展特性和支持中文智能搜索功能的知识库系统模型。该知识库模型将语义Web技术与智能搜索技术结合,支持自然语言的搜索请求,采用OWL本体描述语言来表达知识,支持知识的应用与推理,具有一定的实用和研究价值。  相似文献   

12.
一种基于预分类的高效SVM中文网页分类器   总被引:4,自引:0,他引:4       下载免费PDF全文
中文网页分类技术是数据挖掘研究中的一个热点领域,而支持向量机(SVM)是一种高效的分类识别方法。首先给出了一个基于SVM的中文网页自动分类系统模型,详细介绍了分类过程中涉及的一些关键技术,其中包括网页预处理、特征选择和特征权重计算等。提出了一种利用预置关键词表进行预分类的方法,并详细说明了该方法的原理与实现。实验结果表明,该方法与单独使用SVM分类器相比,不仅大大减少了分类时间,准确率和召回率也明显提高。  相似文献   

13.
Internet上个性化信息的重组与发布是Web个性化技术的一个重要组成部分,这一领域目前存在的主要问题是:并非没有信息重组和发布的工具,而是缺乏能够使这类工具高效工作的支持技术。本文提出一种将流数据处理技术引入Web点击流、IP地址流及页面文本流挖掘和分析过程,研究基于Web数据流挖掘的用户行为和需求分析方法;将本体和领域知识引入Web内容挖掘过程,研究领域知识指导下的Web内容挖掘方法;将基于Web数据流挖掘的用户行为和需求分析与领域知识指导下的Web内容挖掘相结合,研究Internet上Web信息模式和Web用户模型及其相互关系的建立;将上述研究成果应用于实际,以期达到高效地支持Internet上满足用户个性化要求的信息重组与发布的目的。  相似文献   

14.
研究Web文档服务的准确性和快速性,网络信息抽取成为处理海量网络信息的重要手段,而大量异构信息的有效抽取是非常困难的,为了改进和提高系统对于海量异构网页信息的抽取查全率和查准率,提出了一种新的信息抽取的方法,算法利用了隐马尔可夫模型在处理规则知识上的优势对每个页面构建HTML树,并利用Shannon熵来定位数据域,再用Maxi-mum Likelihood方法实现隐马尔可夫模型的构建,实现对Web信息的抽取。仿真结果表明,通过对大量学术论文头部结构信息的抽取,应用算法可以使信息抽取在召回率和准确率方面有明显的提高。  相似文献   

15.
在分析Deep Web中不相容知识的单调性、动态性、模糊性的基础上,提出了基于tableau的不完备知识处理的模型生成方法IK-tableau。该模型采用非经典逻辑表示方法,将Deep Web信息表示为逻辑公式集合,采用模型生成算子对逻辑公式进行扩展。通过IK-tableau方法,能够找出Deep Web搜索中的不完备知识,并可以进行修正,生成知识模型;同时利用该模型可以进一步指导Deep Web搜索。  相似文献   

16.
罗玲    李硕凯    何清    杨骋骐  王宇洋恒  陈天宇 《智能系统学报》2021,16(4):819-826
传统信息检索技术已经不能满足人们对信息获取效率的要求,智能问答系统应运而生,并成为自然语言处理领域一个非常重要的研究热点。本文针对中文的冬奥问答领域,提出了基于知识图谱、词频-逆文本频率指数 (term frequency-inverse document frequency,TF-IDF)和自注意力机制的双向编码表示(bidirectional encoder representation from transformers,BERT)的3种冬奥问答系统模型。本文首次构建了冬奥问答数据集,并将上述3种方法集成在一起,应用于冬奥问答领域,用户可以使用本系统来快速准确地获取冬奥内容相关的问答知识。进一步,对3种模型的效果进行了测评,测量了3种模型各自的回答可接受率。实验结果显示BERT模型的整体效果略优于知识图谱和TDIDF模型,BERT模型对3类问题的回答可接受率都超过了96%,知识图谱和TDIDF模型对于复合统计问答对的回答效果不如BERT模型。  相似文献   

17.
Ancient Chinese architecture is an important aspect of traditional Chinese culture and has been studied by many scholars around the world via historical documents, photographs, and three-dimensional models. In this paper, a building information model (BIM) and virtual reality (VR) and video analysing technology are used to develop a maintenance and virtual training system for ancient architecture. A digital ancient architecture model that includes a three-dimensional model and attributes is established, and the model can be visualized using a VR video processing system. Based on this system, we propose a method of fire detection in the maintenance system to ensure the safety of ancient buildings. After performing lightweight processing of the three-dimensional model, the Forge platform, which can achieve high-speed browsing via Web browsers, is used to perform the virtual construction, dismantling and other functions. By providing an immersive experience, users will develop a deeper understanding of ancient architectural structures and construction processes, which will accelerate research on ancient architecture.  相似文献   

18.
本体论研究综述   总被引:175,自引:3,他引:175  
起源于哲学的本体论(ontology)在信息科学领域受到广泛关注,其重要性已在许多方面表现出来,如知识工程、数据库设计和集成、信息检索与获取、软件工程、自然语言处理等.尤其是本体论在Web上的应用导致了语义Web的诞生,有望解决Web信息共享时的语义问题,实现世界范围的知识级信息集成.综述计算机科学中本体论的研究和应用现状,主要内容包括:本体论的起源和发展,本体论的定义,本体论的描述语言以及构建方法论,本体论与语义Web,以及本体论的应用等.  相似文献   

19.
一种新的语言信息计算模型   总被引:1,自引:0,他引:1  
语言的可计算性问题是理论计算机科学的一个基本问题,字母文字信息的计算模型已经有数十年的历史,而适合汉语信息的计算模型尚未见到.中文信息处理与信息安全的研究迫切需要有适合汉语信息的数学计算模型,提出了两个新的字符串计算模型.在模型1的基础上定义了几个函数运算.利用这两个模型可以将任何汉语信息的处理转换为相应的数值进行处理,对汉语信息处理、汉语程序设计理论的建立和信息安全的研究具有一定的实际意义。  相似文献   

20.
网络翻译系统中的格式信息流处理方法研究   总被引:5,自引:0,他引:5  
随着国际互联网络技术的迅速发展 ,网络机器翻译技术应运而生 .但由于网上信息流格式具有多样性和多变性等特点 ,使得网络机器翻译技术面临新的困难和挑战 .以网络实时翻译系统为问题研究背景 ,对网络格式信息流处理方法进行了深入研究和探索 ,提出了基于动态知识获取和上下文相关分析的格式信息流处理方法 .该方法在使用机器翻译系统中对 HTML格式信息流处理取得了令人满意的效果 .  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号