共查询到20条相似文献,搜索用时 281 毫秒
1.
2.
数据集中数据之间往往相互关联,所有数据整体上呈现特定的模式结构,而传统分类方法(如支持向量机)忽略数据关联信息,仅仅利用数据的物理特征(如距离、相似性等)构建数据分类模型,并在分类阶段计算测试样本与所建立分类模型间的相似性来预测测试样本的标签类型。为了解决传统分类方法利用单一数据信息的问题,提出一种挖掘数据模式结构信息的混合数据分类方法。该方法融合了两种不同类型的分类技术,将使用单一数据物理特征的传统分类方法作为普通分类方法,将利用数据模式结构信息的分类方法作为高级分类方法。特别地,该方法不仅可有效地识别数据模式结构信息以提高数据分类性能,还能提高传统分类方法的泛化能力。在人造数据集和UCI真实数据集上的大量实验结果表明了该混合数据分类方法的有效性,其分类性能优于传统分类方法。 相似文献
3.
针对传统的大数据访问中信息传输冗余量消除方法存在查全率、信息传输冗余量消除效率以及速率较低等问题,提出了基于Hamming距离值的大数据访问中信息传输冗余量消除方法。利用滑动以及滚动相结合的窗口移动模式减少窗口计算量,将Rsync滚动校验算法以及MD5算法相结合,在文件任意位置开始计算滚动校验值,通过递进关系,获取连续数据块的校验值,根据不同数据块的校验值进行数据匹配。将经过匹配后的数据块利用CDC分块检测算法进行检测,根据余弦相似度计算公式以及Hamm距离值计算相似度,实现大数据访问中信息传输冗余量消除。实验结果表明,所提方法有效提高了冗余信息查全率、信息传输冗余量消除效率以及速率,能够快速、准确地消除多余的信息。 相似文献
4.
比例标签数据作为弱标签数据中的一种,近年来受到了广泛关注。针对现实应用中所获取的比例标签数据存在噪声污染而标注困难的局限性,提出将多视角学习应用到不确定比例标签学习中以提高分类器的准确率和稳定性。首先,所提出的方法利用核方法映射多视角信息到特征空间以及引入超实例标签表示比例标签信息,在将多视角信息与比例标签信息结合的同时将不确定比例标签数据的局限性考虑在内,以此构建基于不确定比例标签信息的多视角学习模型;而后利用拉格朗日方法将目标模型转换为对偶形式求解,并引入一个迭代框架解决目标模型以获取多视角分类器。最后,将所提出的方法应用于文本分类的数据集,实验结果表明提出的方法比已有的单一视角比例标签学习方法更具优越性,具体表现在所提方法更高的分类准确率和更不易受数据噪声影响等方面。 相似文献
5.
郑健 《计算机测量与控制》2017,25(7):298-301
为了提高医疗技术水平,加快医务人员对医疗信息数据的分析,使医疗信息数据运行更加顺畅,减少数据存储所占空间,需要对医疗信息数据存储系统进行设计;当前的医疗信息数据存储系统对医疗信息数据进行存储时,利用FPGA构建系统硬件,以硬件为基础将医疗信息数据存储,但在存储过程中,没有将冗余数据清除,导致存储空间易满,容量变小,存在正常医疗信息数据无处安放的问题;为此,提出一种基于模糊处理的医疗信息数据存储系统设计方法;该方法首先对医疗信息数据的来源进行统计,根据数据来源实现医疗数据的硬件构造,然后利用医疗信息数据中特征相似数据间的中介点实现数据聚类,完成对医疗信息数据的聚类存储,最后采用高斯混合模型对冗余医疗数据进行特征分析,以分析结果为基础,利用分数阶Fourier变换对冗余医疗信息数据进行删除操作,由此完成了基于模糊处理的医疗信息数据存储;实验结果证明,所提方法增加数据存储空间容量,减少对冗余数据的存储,加快医疗信息数据的存储速度,提高数据存储精度,为该领域研究发展提供强有力的依据。 相似文献
6.
7.
推荐技术已经应用到各行各业,然而在水利行业信息推荐的应用很少。提出一种基于混合策略的水利门户信息推荐模型。根据水利业务特点对水利门户信息分类,构建水利门户信息分类器。将基于时间和地理位置的热点门户信息推荐、基于信息内容的推荐、基于用户与信息类别的协同过滤推荐的结果线性加权混合,解决信息推荐的冷启动、数据稀疏性等问题。通过爬虫获取各水利门户信息以及调查获取用户行为数据来构建实验数据,将混合推荐方法与三种单一推荐方法对比,其准确率、召回率、F1-score等指标都有所提高。利用该推荐模型设计水利门户信息推荐原型系统的基本框架和功能。 相似文献
8.
9.
为提高智能电网信息异常数据挖掘性能,提出基于云计算的智能电网信息异常数据挖掘方法。根据智能电网信息流的特点,将异常数据的输入空间映射到特征空间内,构造了异常数据的线性判定函数。通过对偶问题的分布式求解,监测了智能电网的异常状态;利用智能电网信息异常数据分类的目标函数,提取出智能电网信息异常数据的特征,预处理了智能电网信息中的异常数据;利用异常数据波动系数,计算出智能电网信息异常数据的权值;利用云计算技术,挖掘出智能电网信息异常数据。实验结果表明,文中方法在挖掘智能电网信息异常数据时,可以提高异常数据挖掘的精度和质量。 相似文献
10.
有效地利用卫星遥感数据进行多类别识别并提高分类精度一直是遥感应用研究的前沿。以江苏南京江宁区为试验区,复合最佳指数提取的波段组合光谱信息、灰度共生矩阵提取的纹理信息和地理辅助数据及其派生信息,运用LM-BP神经网络实现遥感影像分类,并将分类结果与标准BP网络和传统分类方法进行了比较。研究表明,将卫星数据与地理辅助数据结合,发展多源多维信息复合的LM-BP方法可以大大提高分类的精度,是提高遥感应用性的有效途径。 相似文献
11.
郑轶 《计算技术与自动化》2015,(4):132-136
近年来,信息抽取成为自然语言处理的一个热点,同时也是难点。针对不同的问题,大家提出了不同的方法,而大多数的方法是基于启发式规则或者抽象成分类问题,本文将从人物百科中抽取人物信息看成是一个序列标注的问题,利用条件随机场对生语料进行序列标注。此外,文中详细介绍数据分析的方法以及特征选取方法,所提出的方法直接从生语料中抽取,节省了大部分方法的数据预处理部分,同时避开了大部分方法使用的句法分析的特征,有效地提高了信息抽取的效率。在文章的最后做了两组对比实验,实验结果表明,本方法能够非常准确地从HTML生语料中抽取出人物信息。 相似文献
12.
牛文杰 《计算机工程与应用》2004,40(35):80-83
论文在可视化插值过程中所遇到的精确数据点少,而先验信息比较丰富的情况下,以传统克里金插值法原理为基础,提出了基于先验信息的残余克里金插值法。该插值方法是一种精确的内插方法,在精确数据点密集的区域,插值的结果主要反映精确数据的变化,而在精确数据点少,先验数据多的区域,插值的结果反映的是先验数据的变化趋势。两个应用实例的结果验证了这一方法的特点。 相似文献
13.
数字高程模型数据的信息伪装和信息隐藏技术 总被引:2,自引:0,他引:2
提出了一种结合信息伪装和隐藏技术来保护数字高程模型(digital elevation model,简称DEM)数据的方法,保证了DEM数据的安全传输和存储.设计了DEM数据极低比特率压缩方法,压缩数据隐藏在伪装数据中.应用带参数整数小波变换,提出可嵌入隐藏信息的小波系数集合生成方法.扩展了只针对图像的基于视觉系统(human visual system,简称HVS)小波域量化噪声的视觉权重(just noticeable distortion,简称JND)分析方法,使其适用于DEM数据,自适应地确定信息 相似文献
14.
面向事务方法设计矿山信息系统数据库的研究应用 总被引:1,自引:0,他引:1
文章指出,企业的所有活动都可以用事务进行描述和定义,由此建立了相应的企业信息模型,以及事务内部数据流动普遍通用的控制方程;并提出了面向事务设计方法进行信息系统数据库设计的一些基本概念;以辨证思维和信息科学原理为指导,将面向事务方法划分为信息系统分解与综合两阶段。以喀拉通克铜镍矿为例,介绍了该方法进行企业信息系统数据库设计具体的操作方法与流程。实践表明,该方法可以实现开发人员与用户最大程度的交流与合作,较好地解决了目前信息系统开发过程中所遇到的瓶颈问题。 相似文献
15.
16.
提出了一种利用训练数据的类别信息改善分类效果的音频特征提取方法.与传统的利用独立分量分析进行特征提取的方法相比,在计算训练向量空间的基函数组时,特征向量各分量之间的互信息不是直接在全体训练向量上计算的,而是分别在各个不同类的训练向量上计算,然后求其统计平均值.实验结果表明,用这种方法得到的基函数组,能够进一步减小同一类音频的特征向量各分量之间的互信息.从而提高分类的成功率. 相似文献
17.
18.
本文以小波分析的原理与算法为基础,提出一种新的自由环境下网络数据采集与分析方法,使用这种方法可以监测网络的状态、数据流动情况以及网络上传递的信息。 相似文献
19.