首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
数据挖掘作为一种信息资源开发和数据处理的新技术,被广泛应用在各个领域,本文介绍了数据挖掘中的关联规则定义及其核心算法Apriori的思想,利用关联规则挖掘对高校图书馆的借阅流通数据进行了相关分析,并对高校图书馆的馆藏优化建设提出了科学的建议。  相似文献   

2.
随着高校图书管理系统建设的不断发展,广大师生的图书借阅活动产生了大量的浏览数据。为了对以上借阅信息进行数据挖掘以便为读者提供更高水平的服务,提出一种基于数据挖掘技术的图书馆个性化快速推荐算法。首先对数据挖掘的主要方法和组织结构进行了介绍;然后对经典关联规则挖掘算法中的Apriori算法进行改进,提高了关联规则的运算效率;最后采用改进的Apriori算法对图书借阅历史数据进行关联分析,从而对读者做出个性化的推荐。实验结果表明,提出的图书馆个性化快速推荐算法具有较高的准确度和运行效率。  相似文献   

3.
利用数据挖掘技术对中原地区古代陶器数据进行分析研究,会对探究古陶器的发展演变规律及中原地区各类型文化之间的传承源流、关系起到积极的推动作用。数据预处理作为数据挖掘过程的主要步骤,可提高数据质量和其后挖掘过程的准确率及效率。阐述了针对中原地区古代陶器数据具有的类型复杂、数据量大、不正确、不完整和不一致的特点,采用数据清理、数据集成和数据变换技术对其进行数据预处理,从而提高了数据挖掘模式的质量。  相似文献   

4.
《现代电子技术》2019,(1):166-170
针对传统方法存在对图书馆读者借阅行为数据利用率低、对读者图书借阅行为分析不准确的问题,提出基于数据挖掘的图书馆读者借阅行为分析方法。采用基于相似系数矩阵的聚类算法,对图书馆读者借阅行为实施分析,采用Jaccard相似系数度量高维度图书馆读者借阅数据的相似度,对高维度读者借阅数据进行聚类分析,解决图书馆读者借阅数据维度高的问题。构建聚类算法时塑造了新矩阵,当新矩阵中的所有元素都大于初始阈值时,说明数据聚类过程结束,聚类算法的构建实现图书馆读者借阅行为数据的有效分类,针对读者设计个性化专属图书推荐服务。分析了所提方法的应用过程,对图书馆读者借阅图书信息数据实施预处理后,进行读者借阅行为分析。实验结果说明,所提方法能提高图书馆读者借阅行为数据的利用率,具有较高的执行效率和CPU利用率,对读者图书借阅行为分析能力强。  相似文献   

5.
图书馆用户信息挖掘是提升图书馆管理效率,实现高质量用户管理与用户服务的有效方法。文中研究大数据环境下基于云计算的图书馆用户信息挖掘技术,构建图书馆用户信息挖掘技术结构体系。数据层包括用户基本信息、图书借阅历史数据、图书信息咨询记录等,采用降噪处理、遗漏数据处理等方式预处理用户信息数据;云计算层基于计算资源与存储资源,采用K-means聚类算法从用户借阅情况和用户兴趣类型两方面划分图书馆用户群体类型,依照划分后的用户借阅信息采用蚁群规则挖掘算法,获取用户信息关联规则,形成规则库;应用层依照云计算层的挖掘结果执行个性化推荐。用户信息挖掘结果显示,所研究技术能有效挖掘图书馆用户兴趣类型,以及用户群体信息和时间序列信息。  相似文献   

6.
陈天文  高洪臻 《移动信息》2020,(2):00107-00108,111
信息技术的不断发展,图书馆O2O借阅模式成为读者服务的重要渠道之一。随着数据量的暴增,现有的O2O模式并不能满足大量数据下图书馆资源建设的需求,结合大数据进行数据存储与管理成为图书馆界的热点。在大数据平台管理数据的基础上,运用数据挖掘、机器学习算法进行数据分析,挖掘隐藏知识,可为图书馆资源建设的发展提供强有力的借鉴。  相似文献   

7.
针对当前的云计算服务器缺少对不稳定数据的识别与检测,设计并实现一种云服务器中不稳定数据挖掘系统。介绍系统的总体结构,利用数据采样预处理模块实现从源数据到挖掘数据的映射,完成离散化、数据过滤等处理过程。依据2.0 mm ERmet Hard Metric连接器,采用Rapid IO协议,通过接口模块完成数据间的传输,以达到信号传输效率与稳定性的要求。通过数据挖掘模块对云服务器中不稳定数据的确认与挖掘,将挖掘结果传输至控制模块进行处理。软件设计过程中,对云服务器中不稳定数据挖掘系统进行了详细地分析,并给出不稳定数据挖掘的实现过程以及系统部分程序代码。实验结果表明,所设计的系统具有很高的实用性和可靠性。  相似文献   

8.
在大数据时代,如何使用现有的数据对学员进行培训管理,从而提高培训效率是当前培训管理中所面临的问题。本文分析了数据挖掘在培训管理中的应用主要表现在初步探索、数据预处理以及数据挖掘过程。其中数据预处理和数据挖掘是培训系统的核心功能。  相似文献   

9.
在网络技术高速发展的今天,Web技术得到普及,通过对Web的数据挖掘,用户能够获取到所需要的数据信息、知识,同时能够对用户的访问行为、内容进行深入分析.Web日志挖掘是数据挖掘中的重点内容,借助日志挖掘的数据预处理技术,获取到用户特征,将自身的Web的服务设计进行优化,开展针对性的网络活动.基于此,在本文中对Web日志挖掘中的数据预处理技术进行研究,提出预处理算法.  相似文献   

10.
数据挖掘是近几年发展起来的一种对信息资源进行开发和数据处理的新技术,而关联规则则是数据挖掘的核心技术。将关联规则应用于图书馆的流通数据,可以发现读者在借阅文献的过程中隐含的学科之间的关联,这对提高图书馆资源的利用率和为读者提供个性化服务有重要意义。本文从关联规则的定义入手,通过案例分析,阐述了关联规则数据挖掘在图书馆藏书建设中具有重要的意义。  相似文献   

11.
大数据就是用广泛存在的应用需求、浅显易懂的方式以及可展望的经济效益,成为云计算机和移动互联网等信息技术领域的又一大热点。然而,因数据安全与隐私等问题给大数据的发展造成了不小的影响。本文就大数据环境下的数据安全工作展开了相应的探讨。  相似文献   

12.
在千行百业数字化转型加快推进,数字经济时代全面到来的大背景下,数据要素的重要价值得到普遍重视,与此同时,个人隐私保护与数据安全问题也日益严峻。数据信托作为兼顾数据价值实现与数据权益保护的全新探索,受到国内外广泛关注,形成了数据治理与数据资产化两种不同视角下的发展思路,并加速从理论走向实践。结合我国法律制度环境与数字经济发展战略导向,提出未来我国数字信托发展的设想与建议。  相似文献   

13.
本文系统性的对大数据视角下数据加密技术方面易出现的的问题进行了详细阐述,力求做到发现问题、了解问题,并高效的解决一切已经出现或可能出现的新难题,并同时做到防患于未然.结果采用了有效的数据加密技术,的确是面对和解决大数据安全问题行之有效的方法,并对改进大数据视角下的数据加密技术进行了总结,提出了更加有用的建议.  相似文献   

14.
数据作为推动经济社会发展及数字化转型的新动能已成为社会共识,数据质量已成为影响数据要素发挥价值的重要因素。在政务领域,随着数据应用的深度和广度逐渐加强,数据质量问题已成为数据深化应用的制约因素。以数据质量管理相关理论为基础,以源头数据质量管控为手段,提出了基于智能化数据探索的数据质量管理方法,即通过数据质量管理激活数据资源价值,该方法在政务数据质量管理工作中具有借鉴意义。  相似文献   

15.
本文首先界定了敏感数据的内容以及脱敏原理,概述了敏感数据的学术研究现状;进而对大数据平台中敏感数据的来源及其面临的安全性问题进行分析总结.提出了从大数据采集、存储、服务和应用4个层面进行敏感数描保护的基本思路,以及大数据平台敏感数据的安全管理策略.  相似文献   

16.
大数据管理对传统的基于关系数据库管理系统为核心的数据管理服务平台提出了挑战,研究开发支持结构化和非结构化数据统一管理的数据管理与服务中心成为一项非常迫切并且重要的任务,汇总分析出大数据服务中心四项关键技术,采用可配置泛化表模型等技术,设计了基于Hadoop平台的数据服务中心系统原型BIG-DMS和基于BIG-DMS的数据综合服务平台应用方案,支持结构化和非结构化数据的统一存储、管理和访问服务。  相似文献   

17.
大数据背景下电力行业数据应用研究   总被引:4,自引:0,他引:4  
随着SG—ERP的建设推进,业务应用数据正以前所未有的速度增长,大数据时代正式到来。通过对大数据内涵和外延的深入理解,结合公司数据现状和业务需求,研究并提出了“电力大数据”的概念。为了预测公司业务趋势,挖掘电力大数据的数据价值,提取公司三集五大两中心业务大数据分析典型应用场景,利用数据集成管理、数据存储、数据计算、分析挖掘等方面核心关键技术,实现面向典型业务场景的模式创新及应用提升。电力大数据的应用将推动公司业务发展和管理水平提升,有效支撑公司三集五大两中心深入建设。  相似文献   

18.
为了适应新形势下高校对大数据统计、分析的需求,设计实现了一套基于数据仓库的高校数据统计服务平台的整体方案。对高校数据仓库的整体架构、数据仓库的建模进行了研究,并设计了一种基于数据仓库星型结构的统计数据模型;进一步探讨了统计服务平台在实现过程中ETL(extraction transformation loading)以及界面设计等方面的关键技术;为高校下一步搭建管理与决策支持平台提供了重要的实践基础和理论支撑。  相似文献   

19.
数据的有效组织及其变换过程是数据挖掘过程中首要且不可缺少的步骤.对三种适用于数据分析的主要数据结构:数据仓库、Web仓库和数据集市进行了介绍,并对它们的特点和数据组织方式分别进行了讨论.对主题数据库的数据矩阵表示形式及其典型的操作变换:频率分布、二值化等进行了探讨和分析.  相似文献   

20.
针对目前国内缺少专门分析快速记录存储器(QAR)数据的有效手段的情况,研究了一种新的基于数据挖掘的QAR数据的分析方法。首先结合聚类和概率分析对k-means算法进行改进,解决了聚类数目难以确定的难题,形成了良好的聚类效果;然后,在此基础上结合加权最小距离分类器及概率分析的方法,对待分类的QAR数据的类别属性进行判断以确定异常数据;最后给出了仿真实验,验证了该方法的可行性和有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号