首页 | 本学科首页   官方微博 | 高级检索  
     

Web数据挖掘中的可信数据来源
引用本文:鲍宇,曾国荪,管红杰. Web数据挖掘中的可信数据来源[J]. 计算机科学, 2009, 36(4): 211-214
作者姓名:鲍宇  曾国荪  管红杰
作者单位:同济大学计算机科学及技术系,上海,201804;中国矿业大学计算机科学与技术学院,徐州,221116;嵌入式系统与服务计算教育部重点实验室,上海,201804;同济大学计算机科学及技术系,上海,201804;嵌入式系统与服务计算教育部重点实验室,上海,201804;中国矿业大学计算机科学与技术学院,徐州,221116
基金项目:国家高技术研究发展计划(863计划),国家重点基础研究发展规划(973计划),国家自然科学基金,中国矿业大学青年基金 
摘    要:从大量Web信息中获取有用的信息是Web数据挖掘的关键问题.如何评价web信息是否可信,现在主要方法是通过BadRank算法进行内容评测,或是通过链接权重进行相关引用数计算.可信数据来源是数据挖掘的前提,在基于关键词的数据挖掘中,通过评价挖掘所涉及的不同数据域,以及数据域自身的可信性,对在不同域所获得的挖掘数据给以权重,从而对挖掘结果的序列产生影响,提高挖掘算法在获取可信结果方面的效率.并通过试验测试了可信域评价的效果.

关 键 词:Web数据挖掘  Web可信数据  数据挖掘
收稿时间:2008-05-05

Trusted Data Source in Web Data Mining
BAO Yu,ZENG Guo-sun,GUAN Hong-jie. Trusted Data Source in Web Data Mining[J]. Computer Science, 2009, 36(4): 211-214
Authors:BAO Yu  ZENG Guo-sun  GUAN Hong-jie
Affiliation:Department of Computer Science and Technology;Tongji University;Shanghai 201804;China;Department of Computer Science and Technology;China University of Mining and Technology;Xuzhou 221116;China;Embedded System and Service Computing Key Lab of Ministry of Education;China
Abstract:How to abstract the trusted information is a hot issue in Web data mining.The evaluation of information in Web is obtained by content evaluation,or by BadRank algorithm or by weighing the link of pages now.This essay from the viewpoint of data source gave a new approach to evaluate the trusted information by evaluating the domains that the search engine involved in,and we gave the domains different weight values.So the order of the search result sequence will be rearranged according to the weight.That will ...
Keywords:Web data mining  Web trusted data  Data mining  
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机科学》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号