首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
针对多信息源网站中化学物质信息的获取与数据库的更新查询问题,运用网络爬虫技术和包装器方法实现数据的抽取;采用自定义XML文件的方式,提出了任务分割、动态更新检查、失败重试机制方法,实现了动态信息源网站中化学物质信息的持续、实时抽取,并进行异常处理和监控。将抽取的数据运用正则表达式和排序算法进行预处理并构建全面而准确的化学品环境安全数据库,最终实现了对原有数据的更新查询,在一定程度上保证了可靠性、可用性、可扩展性、可维护性。  相似文献   

2.
为了解决已有信息抽取系统中方法不具有重用性及不能抽取语义信息的问题,提出了一个基于领域本体的面向主题的Web信息抽取框架.对Web中文页面,借助外部资料,利用本体解析信息,对文件采集及预处理中的源文档及信息采集、文档预处理、文档存储等技术进行了分析设计,提出了文本转换中的分词及词表查询和命名实体识别算法,并给出了一种知识抽取方案.实验结果表明,该方法可以得到性能较高的抽取结果.  相似文献   

3.
多本体中子本体抽取的研究   总被引:3,自引:2,他引:1  
企业各部门中存在大量的知识源本体,在实际应用中,往往需要使用多个知识源本体的部分内容,即子本体。当前的子本体抽取方法大都是针对单一本体,分析了多本体中抽取子本体的主要问题,提出了一种可以从多本体中抽取所需子本体的有效方法。该方法降低了子本体抽取的复杂性。  相似文献   

4.
对网络多个信息源跨库检索的结果进行Ontology建模,实现异构分布式数据源的数据抽取与合并.数据抽取首先将信息源的检索结果页面映射成有限标号树,其次应用抽取规则得到所需数据;给出按库合并算法,使得网络多数据源返回的结果得以高效合并.实验数据表明将Ontology建模应用于跨库检索结果处理有效而且正确,抽取准确率可以达到100%.  相似文献   

5.
针对油井工程领域异构数据源,提出了一种基于语义的虚拟视图集成方法。通过本体抽取和本体合并分别构造数据源局部本体和全局本体实现基于语义的数据访问视图,并利用全局本体、局部本体和数据源模式之间的映射关系,将基于语义的查询转换为底层数据源的访问请求,提供统一、透明的数据访问视图,以避免数据加载和更新等问题。通过油井决策支持数据集成平台,该方法取得了很好的应用效果。  相似文献   

6.
在基于关系数据库的本体构建过程中,由数据表抽取的原始本体的质量直接影响到最终生成本体的质量,而传统的抽取方法中将单个数据表映射为单个本体概念的方法忽略了数据表中元组数据所提供的语义信息,造成抽取的原始本体质量不高的问题。本文提出一种了基于数据表的原始本体抽取方法。应用FCA(形式概念分析)方法对单个数据表的元组数据进行分析,形成概念格,进而产生原始本体。该方法使得数据表中的元组数据得到了有效的利用,提高了原始本体的抽取质量,有利于最终本体生成质量的提高。  相似文献   

7.
为了在企业知识管理中获得更准确全面的知识,提出了一种基于语义的检索方法.该方法采用映射关系数据库、概念抽取和本体编辑工具半自动构建企业知识本体,并运用该本体对用户查询进行语义处理,实现了基于语义的知识检索系统.实际应用表明,该系统能有效返回含有语义信息的检索结果,实现对企业知识的智能化检索.  相似文献   

8.
针对传统的基于关键词的搜索与数据检索存在的弊端,本文提出基于本体的Web信息抽取框架。该框架首先获取Web页面,将其转换为格式良好的HTML文档,然后利用HTML解析器将该文档转化为DOM树,再根据XPath表达式获取用户感兴趣的数据块,由此生成抽取规则,最后通过OntPMatch算法实现数据的抽取,并以RDF数据格式储存信息。本文以棉花信息为研究对象加以实证研究,实现Web生物信息数据抽取原型系统,为方便用户发现有价值的Web生物信息资源提供一个有效的工具。  相似文献   

9.
微博情感分析是对微博内容进行细粒度的挖掘,有着重要的研究价值。微博评价对象的抽取是微博情感分析研究的关键问题之一。为了提高中文微博评价对象抽取的准确率,该文在中文微博特征分析和微博评论本体构建研究的基础上,尝试从词、词性、情感词以及本体四个方面进行特征选择,采用CRFs模型对评价对象进行抽取。该文将提出的方法运用到COAE2014测评的Task5评价对象抽取任务中,宏平均准确率达到61.20%,在所有测评队伍中居第一。实验结果表明,将本体特征引入到CRFs模型中,能够有效地提高评价对象抽取的准确率。  相似文献   

10.
信息抽取是-种帮助人们在海量信息源中迅速找到真正需要的信息的技术.该文从信息抽取的概念出发,辨析了与信息检索两者的不同之处,评述了信息抽取技术的发展趋势,并提出了信息抽取存在的问题和解决策略.  相似文献   

11.
基于本体的工作流知识管理系统设计   总被引:1,自引:0,他引:1  
武凌  马季 《计算机工程》2010,36(11):61-63
针对工作流系统应用在企业知识管理时面临着流程数据整合不易、文件内容词汇关系不明确与存取控制不便等问题,提出一种基于本体的工作流知识管理系统架构。该系统采用XML作为流程文件交换与存储格式,利用本体论的方法将不同知识领域包含的概念及关联特性整合进工作流程中,设计基于角色继承的授权管理机制进行精确的文件存取控制。介绍工作流系统的体系架构,并分析工作流引擎的设计及实现机制。该系统架构为工作流程中的知识管理提供一种新的管理及控制模式,利用该架构开发的工程设计检验系统运作良好。  相似文献   

12.
对共同变化的识别有利于软件维护人员对软件变化的理解和控制。传统的软件共同变化识别方法通过对软件版本控制系统中的数据挖掘,进而识别源程序文件或者类之间的共同变化,但这种方法不适合对构件化软件中构件间共同变化的识别。为此,本文在基于构件的软件配置管理模型的基础上,设计了构件化软件演化信息本体模型以及两者间的映射规则,并提出了构件化软件共同变化模式(基本模式和复合模式)和相应的本体推理规则,开发了原型支撑系统。  相似文献   

13.
14.
郭静  陈英武 《计算机工程》2008,34(12):162-163
基于本体的共享与重用性以及谈判过程的动态性,提出谈判协议过程本体,将语义Web应用到自动谈判中,利用描述逻辑和本体编辑器Protégé 3.2.1对1-多交互协议本体进行形式化描述,并得到相应的OWL文件。  相似文献   

15.
家庭数码照片管理领域的本体建模研究*   总被引:1,自引:0,他引:1  
数码相机的迅速普及对照片管理技术提出了严峻的挑战,传统的基于文本关键字的标注和检索系统已不能满足人们的需求。因此,基于语义的图像检索技术正在快速兴起,但语义知识的组织和表达问题始终未能得到有效解决。针对上述问题,提出了一种新的基于领域本体的照片管理方法。该方法的关键技术是对照片管理领域进行本体建模。实验表明了该方法的有效性。  相似文献   

16.
王浩  武凌  张海  徐勇 《微机发展》2008,18(6):23-27
知识管理已成为企业在信息化条件下提高竞争力的必要手段,工作流系统是支持工作流定义、执行和监控的计算机软件系统。针对工作流系统应用在企业知识管理时面临的流程数据整合不易、文件内容词汇关系的不明确与存取控制不便等问题,提出了一种基于本体的工作流知识管理系统架构,并介绍了其设计及实现机制。该系统以XML作为流程文件交换与存储格式,流程中的知识可以结构化地保存下来,便于在各部门的异质系统间传递;并利用了本体论的方法将企业内的组织、计划、人员等不同知识领域所包含的概念及关联特性整合进工作流程中,改善了部门间的语意差异,更好地实现了工作流中知识的应用效率与一致性。  相似文献   

17.
在利用本体进行信息抽取的基础上,提出了一个基于个人信息领域的语义信息抽取系统框架,将语义抽取从WEB领域扩展到个人信息领域;系统对个人信息领域内的网页,电子邮件,本地数据库和本地文件夹建立本体,根据本体之间的语义关联,实现个人信息领域内数据的交流。系统详细描述了语义信息抽取系统的实现过程,并以电子邮件为例重点介绍了语义信息抽取的算法。  相似文献   

18.
A lack of surveillance system infrastructure in the Asia-Pacific region is seen as hindering the global control of rapidly spreading infectious diseases such as the recent avian H5N1 epidemic. As part of improving surveillance in the region, the BioCaster project aims to develop a system based on text mining for automatically monitoring Internet news and other online sources in several regional languages. At the heart of the system is an application ontology which serves the dual purpose of enabling advanced searches on the mined facts and of allowing the system to make intelligent inferences for assessing the priority of events. However, it became clear early on in the project that existing classification schemes did not have the necessary language coverage or semantic specificity for our needs. In this article we present an overview of our needs and explore in detail the rationale and methods for developing a new conceptual structure and multilingual terminological resource that focusses on priority pathogens and the diseases they cause. The ontology is made freely available as an online database and downloadable OWL file.  相似文献   

19.
基于P2P计算的教育资源库共享系统研究   总被引:1,自引:0,他引:1  
E-learning的有效实施需要将现有异构教育资源库进行集成,提供一个大规模的资源共享平台.深入分析了e-learning对资源共享的目标和教育资源库管理系统的发展趋势,介绍了P2P计算的分类和JXTA开发平台的技术优势.在此基础上,设计了一种混合P2P结构的教育资源库共享系统,给出了基于JXTA平台的系统体系结构与实现方案,详述了利用XML元数据与本体实现数据库与文件资源发布的机制及支持元数据搜索的查询算法.应用P2P技术和本体解决了分布式异构性教育资源的共享问题.  相似文献   

20.
对于文件恢复,通常是利用文件内容的地址和文件大小两个参数,找到文件的内容后进行相应的复制。在对移动存储设备的ExFAT文件格式进行了详尽的分析后,发现在连续存储的数据文件被删除时,只对文件对应的属性表和簇位图表进行了改变,从而给出了恢复数据的方法——修改特征法,给出了对应的五个公式,并通过实验证明了这种方法的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号