排序方式: 共有9条查询结果,搜索用时 31 毫秒
1
1.
一个基于网格的文本复制检测系统 总被引:5,自引:0,他引:5
如何快速、及时地在大规模文集中发现剽窃文本是知识产权保护中的一个核心问题。我们利用Globus构建了一个文本复制检测网格系统,称之为DCDGrid。在DCDGrid原型中我们把单个巨型文集分解成多个中小规模文集,然后将其分布在网络上。通过网格计算的方式,我们可以同时在多台计算机上检测剽窃文本.可以动态增扩检测文集,缩短检测时间,整个系统具有很高的性价比。局域网上的模拟测试表明DCDGrid系统是比较实用的。 相似文献
2.
一个基于XML数据仓库系统的设计与实现 总被引:2,自引:0,他引:2
黄土高原数据仓库系统以分布式数据仓库为核心,包含多个异质数据源。系统采用中间件技术不仅提供多层次资源查询服务,并且还使用数据挖掘技术和信息检索技术对资源数据进行深加工,能够主动地为用户提供黄土高原生态环境咨询、评测、预测与决策支持服务。论文重点介绍了一种基于XML的统一模式查询语言———XUSQL,用以解决多数据源中多模式数据融合问题。XUSQL使得在数据仓库中的查询与数据源模式无关,把数据源和数据仓库隔离开,从而有利于构造分布式数据仓库,便于异质数据源之间数据融合以及数据源本身的结构调整。 相似文献
3.
文章探讨了模糊神经网络的基本构造和原理,结合蘑菇生长过程预测系统重点分析了FNNC摸型的推理和学习方法。并在此基础上提出了TPH学习方法。该方法吸收了梯度下降算法和随机搜索算法的优点,能够使生长过程预测系统的学习以很大概率快速收敛在系统误差的最优点附近。最后文章指出模糊神经网络以及TPH学习算法在农业生产过程的应用。 相似文献
4.
5.
用数据挖掘方法扩充知识库的研究及应用 总被引:1,自引:0,他引:1
讨论了数据挖掘与机器学习对于扩充知识库的异同,分析了知识库、数据库与数据挖掘在知识系统中的关系.提出了一种基于XML的知识表示方法XKR(XML-based Knowledge Representatlon).XKR用XML作为统一的形式描述语言,把产生式、框架、语义网络、过程表示法等等多种传统的表示方法融合到一起,由于XML本身包含语义并能够无限扩充,所以XKR可以描述不同背景不同类型的知识,实现知识融合,通过应用实践发现XKR知识库有优点也有缺陷,文章指出了改进思路. 相似文献
6.
7.
8.
9.
时序数据中的野值会直接影响数据挖掘算法的结果,甚至造成算法失效。传统的基于密度的带有噪声的空间聚类(DBSCAN)算法可以用来识别野值,但是却存在算法对参数敏感、时间复杂度高、精度不高等问题。针对时序数据的特点,提出了一种可自动进行多次识别的基于方差聚类的野值识别算法。该方法通过将传统的邻域密度转换为方差和均值、将密度阈值转换为时间窗口内的方差和阈值,在定义野值数据、野簇数据和异常簇数据的基础上,给出野值识别方法的判断规则。同时,针对一次野值识别不能将全部野值剔除的问题,通过定义多次野值识别的结束条件将算法扩展为多次野值识别算法。通过在某航天数据挖掘项目中的应用,验证了该算法具有较好的通用性、低的时间复杂度、可进行多次识别以提高精度等特点。 相似文献
1