首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 93 毫秒
1.
吴正洋  汤庸  方家轩  董浩业 《计算机科学》2015,42(9):204-207, 225
协同过滤推荐是一种基于用户偏好的个性化推荐方法,一般包含两个步骤:首先根据用户或项目的标注信息计算出用户或项目的相似度,确定邻居集合;然后根据相似度进行排序推荐,其核心问题在于相似度的计算。为了更好地达到这一目的,近年来关于将用户社交网络信息融入相似度计算的方法受到广泛关注。用户的注册信息、项目评分和社交信息都可以作为用户比较的依据。基于此提出了通过构建用户本体,计算本体之间的语义相似度,从而找到相似用户集合,最终实现目标用户的推荐方法。该方法为本体技术与推荐系统的结合提供了一种思路,实验表明 它能够在一定程度上提高推荐的准确度。  相似文献   

2.
基于描述逻辑的扩展预测模型标记语言EPMML   总被引:1,自引:0,他引:1  
预测模型标记语言PMML正被许多数据挖掘组织作为标准化的数据挖掘模型描述语言.然而,由于数据挖掘技术的不断发展,参与建立PMML的数据挖掘厂商的经验有差异,PMML本身含有的大量语言元素不可避免地带来基于PMML的数据挖掘元数据的语义不一致问题.为解决这个问题,提出了一种基于描述逻辑的扩展预测模型标记语言EPMML,详细分析了EPMML的描述逻辑基础SOIN,设计EPMML的语言元素.基于EPMML描述的数据挖掘元数据可以转化为基于SOIN的知识库,进而进行知识推理以自动发现数据挖掘元数据的内在语义不一致问题.Racer推理实例验证了EPMML语言的良构性,良好表达能力和推理有效性.  相似文献   

3.
基于领域本体的数据挖掘服务发现算法   总被引:3,自引:0,他引:3  
随着数据库的广泛应用,数据挖掘技术面临数据的海量化、分布化问题。采用面向服务的架构构造数据挖掘系统是解决该问题的方法之一。提出一种基于领域本体的数据挖掘服务发现算法,通过引入领域知识,定义数据挖掘本体,有效地解决了数据挖掘服务发现问题。首先给出了结合领域知识的数据挖掘服务发现框架,提出了数据挖掘方法本体和质量本体的定义,并给出了根据领域知识及用户需求进行数据挖掘服务发现的算法,为数据挖掘服务选择提供了较为完善的方案。  相似文献   

4.
传统中文领域本体构建多采用手工构建的方法,这种方法费时费力且重用率不高。针对这种情况,提出一种把中文领域知识文档半自动化地转化为OWL(Web Ontology Language)本体的方法。该方法以武器装备领域为例,先使用分词工具ICTCLAS5.0对中文文档进行分词等预处理,然后使用TF-IDF算法、基于模板匹配算法挖掘领域核心概念、聚类概念等级关系,再使用Jena将聚类后的三元组文档形式化为OWL本体,最后使用Protégé工具对OWL本体进行可视化管理。实验结果表明,该方法可以有效地节省中文本体构建的时间和人力成本,为全面解决中文领域本体的自动化构建提供了一个新的思路和尝试。  相似文献   

5.
随着计算机、数据仓库等技术的发展,数据挖掘在电信、银行等行业中得到了越来越广泛的应用.本文提出了应用PMML标准实现不同数据挖掘模型、工具间数据的传递的方法,同时将工作流应用到数据挖掘系统中,实现了由用户定制数据挖掘过程和选择算法的功能,解决了多个数据挖掘模型、算法间的互操作问题,同时运用工作流增强了数据挖掘系统用户自主定制和选择的能力.  相似文献   

6.
Kohonen自组织特征映射网络SOM因其能够将高维数据映射为二维特征图而广泛应用于数据探索分析活动中。预测模型标记语言标准PMML是一个与平台及系统无关的数据挖掘模型表示语言,但其中并未包含SOM元模型的定义。通过对SOM模型的应用需求分析,提出了基于PMML的SOM元模型定义,可使模型生成与模型存储相分离,使用户在脱离模型生成系统的情况下进行模型的可视化及利用。  相似文献   

7.
针对传统推荐系统中存在的冷启动、数据稀疏、语义缺乏、推荐精度较低等问题,提出一种基于事件本体的推荐算法。结合新闻的分类结构和新闻语料构建事件本体,对用户浏览的新闻进行要素抽取并构建用户兴趣模型。基于事件本体的分类结构计算新闻事件之间的相似度,通过用户兴趣模型计算用户兴趣相似度,根据事件本体非层次结构的语义半径寻找相关新闻事件。综合事件本体相似度、用户兴趣相似度和非层次结构相似度3个方面得出新闻个性化推荐结果。实验结果表明,该算法的推荐结果优于协同过滤推荐算法和基于内容的推荐算法。  相似文献   

8.
通用知识网格下以用户为中心的数据挖掘本体研究   总被引:2,自引:0,他引:2  
分布异构的海量数据挖掘是数据挖掘领域急待解决的课题,通用知识网格(UKB)架构模型用于在网格环境下创建大规模的分布式知识发现和知识集成系统。本体服务器是整个架构的核心模块,负责本体的管理和查询。数据挖掘本体服务是本体服务器提供的主要服务。本文主要介绍通用知识网格下以用户为中心的数据挖掘本体的设计和OWL实现。数据挖掘本体可满足各种不同领域、不同层次用户的知识发现服务,使系统具有开放性、可扩展性和高用户可用性。还介绍了一个反洗钱领域数据挖掘解决方案实例。  相似文献   

9.
本文阐述了平面几何定理机器证明的基本原理及方法,针对几何定理机器证明过程中可读证明的产生,及推理信息快速增长的问题,提出了一种基于本体推理的几何定理机器证明方法。通过具体案例,描述了以Protégér软件为工具, 基于WordNet重用的领域本体半自动构建方法,构建几何本体模型的过程, 并结合Prolog规则进行双向推理,结果表明将本体引入几何定理机器证明是可行的,且本体推理脱离了代数形式,使得推理过程更接近自然语言的描述,同时推理效率更高  相似文献   

10.
为降低用户寻找旅游资源时的负担,更好地处理用户的需求和偏好,从用户角度出发,提出了一种基于本体的二次推荐方法。该方法引入本体来描述旅游资源,实现了用户的直接需求及偏好兴趣信息与推荐中过滤条件的关联,用户可对推荐结果进行评价。理论分析和实验表明,该方法可行,推荐结果能够覆盖绝大部分用户的选择,具有较好的效果。  相似文献   

11.
面向Web信息资源的领域本体模型自动构建机制的研究   总被引:1,自引:1,他引:0  
金鑫 《计算机科学》2012,39(6):213-216
领域本体的构建是本体工程研究与应用的重要内容。面向网络Web信息资源,获取领域相关文本信息,通过对文本的概念分析,构建领域本体模型。提出一套本体自动构建机制,该本体构建基于数据挖掘和机器学习技术,内容主要包括基于贝叶斯(Bayes)分类原理;提出多个分类器方式的概念分类过程和算法;提出概念关联分析和概念自学习算法,建立本体原型;提出面向OWL本体模型的转换映射机制,构建基于OWL的本体模型。此外,还提出了从网络资源获取、领域本体建模到本体实施应用的一套完整的本体构建和应用实施的解决方案。  相似文献   

12.
陈英  徐罡  顾国昌 《软件学报》2007,18(10):2507-2515
在数据挖掘中使用本体和上下文知识能够将普遍的知识和特定的知识引入数据挖掘的决策因素中,是增进数据挖掘准确性的有效手段,同时也是数据挖掘领域研究的热点和难点之一.针对该问题,首先探讨了本体与上下文知识的集成化表示方法,包括上下文知识分类方法、如何在本体描述方法上扩展上下文知识及上下文知识转化方法.其次,以层次化结构的本体与上下文知识为例,构建了一个依据于本体和上下文知识集成的归纳学习算法并验证了该算法的有效性和准确性.  相似文献   

13.
关于Web Page语义挖掘的目的主要是在现有网络挖掘的基础上对挖掘内容加上语义的表述从而达到提高挖掘的效果.主要先处理挖掘的数据源,然后对数据进行语义标注,建立本体,将本体实例化,形成语义数据库,利用现有的挖掘算法实现挖掘结果.最终得到相对于现有挖掘效果得到提高的结论.  相似文献   

14.
模糊集与本体结合的数据挖掘方法得到了广泛的关注。为了丰富数据挖掘效果以及数据挖掘得出的规则的完整性,本文在模糊本体的挖掘算法基础上,提出了模糊本体中叶子结点的相似度定义以及不同语义层次所含项目集的数目定义多重最小支持度,提出了基于模糊本体的广义关联规则算法。对比实验证明,基于模糊本体的广义关联规则算法的挖掘具有更强的可读性,获得的语义关联规则更加丰富,促进了在广义关联规则挖掘过程中使概念泛化更加合理,提高了算法效率。  相似文献   

15.
网格技术的发展使网格数据挖掘成为处理分布异构海量数据的重要手段。该文将本体引入到网格数据挖掘中,讨论了网格数据挖掘本体的结构,并提出了网格数据挖掘本体的建立过程,最后讨论了网格数据挖掘本体实现。  相似文献   

16.
网格技术的发展使网格数据挖掘成为处理分布异构海量数据的重要手段。该文将本体引入到网格数据挖掘中。讨论了网格数据挖掘本体的结构,并提出了网格数据挖掘本体的建立过程,最后讨论了网格数据挖掘本体实现。  相似文献   

17.
数据挖掘方法本体研究   总被引:5,自引:0,他引:5  
数据挖掘是包含多个阶段的知识发现过程。一个简单、但典型的数据挖掘过程可能包括数据预处理阶段,数据挖掘算法的应用阶段,以及对挖掘结果的可视化处理阶段。在每个阶段,都会有多个算法或方法供数据挖掘工作者选择,但仅有一些算法和方法组合是有效的。即使是数据挖掘领域的专家,也可能会忽略一些重要的、有助于知识发现的数据挖掘算法或方法。本文中,我们将讨论使用本体的方法来协助数据挖掘工作者在实施数据挖掘过程中对众多可供选择的算法和方法进行选择。  相似文献   

18.
Stack Overflow是一个计算机领域的IT技术问答网站,为了获取问答网站中的专家示例并将其应用于API挖掘中,首先采用Scrapy爬虫框架技术获取Stack Overflow问答网站中的结构化数据,并存储在关系模式中;再使用本体建模工具Protégé构建本体,然后使用D2RQ工具实现对关系数据库的知识抽取,将关系模式转换为三元组形式的本体模型;同时,提出了一个面向专家示例的子本体抽取算法,用于从原本体中抽取出专家示例推理相关的子本体,并提出了若干条专家示例推理规则,能推导出专家所编写的代码示例。实验结果证明,从Stack Overflow本体模型中抽取的专家示例能提高API调用序列挖掘的准确率。  相似文献   

19.
A data warehouse is an important decision support system with cleaned and integrated data for knowledge discovery and data mining systems. In reality, the data warehouse mining system has provided many applicable solutions in industries, yet there are still many problems causing users extra problems in discovering knowledge or even failing to obtain the real and useful knowledge they need. To improve the overall data warehouse mining process, we present an intelligent data warehouse mining approach incorporated with schema ontology, schema constraint ontology, domain ontology and user preference ontology. The structures of these ontologies are illustrated and how they benefit the mining process is also demonstrated by examples utilizing rule mining. Finally, we present a prototype multidimensional association mining system, which with intelligent assistance through the support of the ontologies, can help users build useful data mining models, prevent ineffective pattern generation, discover concept extended rules, and provide an active knowledge re-discovering mechanism.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号