排序方式: 共有81条查询结果,搜索用时 31 毫秒
61.
特征选择是数据挖掘和机器学习等领域内重要的预处理步骤,近年来得到了广泛的关注。文本数据的高维性往往会影响分类等数据挖掘任务的效率,因此特征选择常被作为文本分类过程中的重要组成部分,以达到降维的目的。随着分类技术的快速发展,类别的日益细化,文本的多类分类问题为特征选择方法提出了更多的挑战。本文面向文本多类分类的应用背景,阐述了目前特征选择方法所面临的主要挑战,给出了多分类特征选择方法的主要种类。本文沿着相关研究的发展路线,由易至难,由浅入深,通过对目前多分类特征选择算法的应用情况进行总结,并进行综述评论,最后对全文进行了概括,提出了未来可能的研究方向。 相似文献
62.
针对LED情报板显示规模小、控制难、信息无法实时发布的问题,进行了显示方式、控制方法和通信模式的分析,提出了一种嵌入式LCD情报板网关系统的设计方案;该系统由智能显示模组、网关、后台数据库和WEB界面四部分组成,智能显示模组包括LCD显示屏、触摸屏、S3C2440嵌入式微处理器、人机界面处理系统和RS232通讯接口;网关是以嵌入式Linux操作系统OpenWrt和嵌入式微处理器RT5350为平台,实现了802.11 b/g/n高速无线局域网、以太网WAN和RS232串口通信相互转换的功能;后台数据库是以html和php语言为软件支撑,管理员可以通过WEB界面灵活的管理情报板内容和配置网关参数;在校园搭建情报板网关系统并进行测试,结果表明,该系统能够将底层服务与上层管理紧密结合,扩大信息覆盖面,提高信息利用率和发布效率,在信息发布技术的发展上有一定的参考、推广价值。 相似文献
63.
存在级不确定数据上的概率Skyline计算 总被引:1,自引:0,他引:1
概率Skyline计算是在不确定对象集合中找出Skyline概率大于给定阈值的对象,在多目标决策应用中有重要价值.现有的存在级不确定数据上的概率Skyline算法均需要预先建立索引,在数据量很大、维度很高或数据频繁更新时,建立索引往往不可行或者不会带来性能的提升,因此有必要设计通用的非索引算法.提出了存在级不确定数据上... 相似文献
64.
近年来,MapReduce并行计算模型受到工业界和学术界广泛关注.基于该模型的系统实现已在谷歌、雅虎、Facebook等大公司内部成功应用.然而,基于MapReduce的系统实现最初用于解决海量无结构、半结构化数据的批处理问题,例如生成倒排索引、计算网页的pagerank、日志分析等,在设计上缺乏针对海量结构化数据进行交互式分析处理的优化考虑,例如:它总是采用全数据集强力扫描的数据处理模式,这有悖于结构化数据管理中常用的操作模式———选择性查询分析处理.针对该问题,引入传统数据库管理领域中常用的全局索引技术,将其应用在基于MapReduce模型的开源项目Hadoop上,以block为粒度对Hadoop分布式文件系统上的结构化数据构建全局索引结构,并给出一种面向范围查询分析的作业编译与调度执行优化算法,主要目标是基于应用语义及辅助索引结构减少不必要的map任务数,进而优化作业的调度开销和执行开销.在实验验证阶段,给出了80%,50%,30%,10%四种数据选择率在3种集群规模下的优化效果,发现作业响应时间最高可提升5倍,I?O开销最高提升10倍,任务调度开销最高提升11倍. 相似文献
65.
66.
67.
68.
69.
70.
并行I/O是基于无共享结构的并行数据库系统提高性能的有效途径之一。它通过并行磁盘服务和网络传输并行化提供了高带宽I/O。文章设计实现了基于无共享结构的并行数据库系统的并行I/O,探讨了设计并行I/O时的几个关键问题及实现技术。 相似文献