排序方式: 共有27条查询结果,搜索用时 0 毫秒
1.
流数据产生速率具有不可预见性,当其速率超过系统处理能力时,部分数据元素不能被实时处理。降载技术是处理此问题的关键技术之一。分析了目前降载技术的不足,提出了一种面向挖掘流数据频繁项集的降载策略。该策略采用了基于元组出现频率的语义删除策略,优先删除出现频率相对较低的元组,从而有效解决了在挖掘流数据中的频繁项所遇到系统超载时所出现的问题,同时采用了根据流数据产生速率自动地控制是否启动降载策略,有效地解决了降载的适应性问题。最后,通过实验和分析,证明了该策略在流数据频繁项挖掘中有效性。 相似文献
2.
针对空气预热器间隙控制系统存在的问题,提出相应的改造措施,结果表明改进后的系统完全可以满足实际工作的需要,系统的自动调节品质及安全经济性都有了明显的提高. 相似文献
3.
基于属性重要度的ID3改进算法 总被引:8,自引:0,他引:8
ID3算法是数据挖掘中最经典的分类算法.该算法偏向于选择取值较多的属性,而属性值较多的属性不总是重要的,从而影响了分类预测的高效性.通过对ID3算法的研究,依据属性重要度粗糙集理论的思想,对经典的ID3算法做了相应的改进,改进后的ID3算法(AIID3),提高了算法的决策效率.最后的实例及应用表明,改进的算法更有效,更快速. 相似文献
4.
5.
6.
7.
8.
空间数据库中空间连接操作是最重要、最耗时的操作之一,基于BFRJ算法研究了一种对中间连接索引优化排序的空间连接算法OBFRJ,该算法使用广度优先顺序对两棵R树进行同步遍历,对生成的中间连接索引采用了一种空间填充曲线进行排序,使得在下一层的连接时出现页错误的次数减少。实验结果表明,该算法在磁盘访问次数以及CPU代价上都要小于DFRJ和BFRJ算法。 相似文献
9.
基于LBSN(基于位置的社交网络)中数据的地理和社交属性, 结合用户轨迹和好友关系, 有助于提高不确定轨迹聚类挖掘的效率。根据LBSN用户的好友关系特征, 引入评分函数, 对用户影响力进行排序, 找出其中的活跃用户; 在传统路网子轨迹匹配和对签到数据清理的基础上, 加入子轨迹匹配准确性监测, 并存储活跃用户匹配成功的路段, 进而减少路网匹配时间。最后综合R*树的空间索引机制和DBSCAN聚类算法对城市内的热点路径进行挖掘。理论分析和实验表明, 相比于已有方法, 改进的的聚类挖掘方法在LBSN环境中的时间效率和准确性都有较大的提高, 且有较好的可伸缩性。 相似文献
10.
云计算环境下的资源管理研究 总被引:1,自引:0,他引:1
首先提出高性能的大规模的云计算资源是实现云计算服务的基本条件,而对庞大的资源如何进行管理和分配,是云计算服务必须解决的后继问题。其次分析云计算资源管理主要分为数据存储的资源管理,存储层,基础管理层、应用接口层和访问层构成了云存储系统的4层结构模型,云安全是存储技术的重要方面,而云资源调度则包括资源发现、调度组织、调度策略、状态评估以及对资源的再调度等。最后针对目前亟需解决的信息存储安全、服务可靠性、大规模隐私泄露以及资源的可移植性和兼容性等问题提出了相应的资源管理技术方法。 相似文献