首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 203 毫秒
1.
收集图书流通数据并对收集数据进行预处理,采用SPSS Clementine软件的两步聚类模型.以班级和科室为单位,对读者的借阅次数进行聚类分析,得出借阅频率信息,把读者分成借阅频率较高、一般和较低3个类型,为图书馆个性化服务提供了基础.实验结果验证明了该方法的有效性和可行性,提出改进图书馆管理工作的建议.  相似文献   

2.
通过对高校图书馆提供的借阅数据进行筛选、净化、转换等数据处理,研究了聚类支持下决策树分类技术及其在图书馆借阅数据中的应用。利用聚类得到决策树的训练样本,以期得到高质量的决策树并进一步提高推荐的准确率。以某高校图书馆借阅数据为例,将以上研究结果应用于该校图书馆借阅数据分析,分析的结果提供给图书馆管理者,作为馆藏政策、图书推荐、图书馆管理的参考依据。  相似文献   

3.
分析影响读者借阅量的因素,确定不同读者的借阅需求,进而依据需求定制差异化的借阅权限和服务。利用SPSS Clementine挖掘工具,采用C5.0决策树算法,对国际关系学院图书馆的读者借阅数据进行挖掘,建立读者决策树分类模型,将读者按借阅频度分为活跃读者、一般读者和沉默读者。结果表明,读者身份、专业、年级和性别对借阅量有重要影响,本科大三学生借阅需求较大,大四学生借阅需求小。决策树分类能对图书馆读者进行细分,可为调整读者借阅权限提供理论依据。  相似文献   

4.
读者借阅行为分析可以提高高校图书馆书籍利用率,为了解决传统高校图书馆读者借阅行为分析算法存在精度低、效率低等缺陷,以获得理想高校图书馆读者借阅行为分析结果为目标,提出了高校图书馆读者借阅行为分析的数据挖掘算法.首先分析高校图书馆读者借阅行为分析原理,然后采用数据挖掘算法——最小二乘支持向量机对高校图书馆读者借阅行为数据...  相似文献   

5.
当前图书馆借阅量预测方法无法描述混沌性等非平稳变化特征,导致图书馆借阅量预测错误差大,为了改善图书馆借阅量的预测效果,设计了基于小波支持向量机的图书馆借阅量预测方法。首先对当前国内外图书馆借阅量的预测研究现状进行分析,找到引起图书馆借阅预测误差大的原因,然后收集图书馆借阅量预测的历史数据,并通过混沌分析算法对历史数据进行重新构造,并引入小波支持向量机实现图书馆借阅量预测模型的建立,最后与其它图书馆借阅量的预测方法在相同环境进行对比测试。提出的方法可以对图书馆借阅量的变化特征进行深度挖掘,图书馆借阅量预测精度超过95%,高于对比方法图书馆借阅量预测精度,获得更加可靠的图书馆借阅量的建模和预测结果。  相似文献   

6.
文章用数据挖掘中的关联规则技术对高校图书馆学生的借阅数据进行挖掘分析,从而挖掘出读者的阅读兴趣,发现书籍借阅的关联规则,科学地进行建议借阅和图书推荐等服务,以提高图书馆管理效率。  相似文献   

7.
基于Clementine的图书馆流通数据挖掘   总被引:1,自引:0,他引:1  
数字图书馆改变了传统图书馆的服务模式,同时也积累了大量的读者信息,为个性化服务提供了数据基础。本文重点研究聚类分析技术及其在图书馆中的应用,利用Clementine的两步聚类模型实现对读者的聚类分析,将读者聚类为消极型、一般型和积极型三种类型,针对不同类型的读者,图书馆可以提供相应的个性化服务。  相似文献   

8.
该文将数据挖掘技术应用于图书馆数据库,挖掘主题确定后,依次进行了数据选择、数据转换和清理、数据再丰富、编程工作、数据挖掘。利用关联挖掘对图书馆的流通管理数据进行分析,发现读者借阅一类图书时的其他借阅行为,便于为读者推荐相关文献,也可以优化馆藏布局,并为图书馆管理人员提供技术和决策支持。其中数据挖掘是使用Clementine12完成。  相似文献   

9.
该文将数据挖掘技术应用于图书馆数据库,挖掘主题确定后,依次进行了数据选择、数据转换和清理、数据再丰富、编程工作、数据挖掘。利用关联挖掘对图书馆的流通管理数据进行分析,发现读者借阅一类图书时的其他借阅行为,便于为读者推荐相关文献,也可以优化馆藏布局,并为图书馆管理人员提供技术和决策支持。其中数据挖掘是使用Clementine12完成。  相似文献   

10.
以SAS数据挖掘系统EM模块中的Association节点为关联规则数据挖掘平台,对经过数据预处理的读者借阅数据进行关联规则数据挖掘,揭示数据间的关联关系,用来指导图书馆图书借阅工作和采购工作。  相似文献   

11.
计算机集群技术已经引起了石油地球物理界的广泛关注,如何将现有地震数据处理模块快速、高效地移植到集群上已成为地震数据处理需要解决的重大课题。本文将现有的基于消息传递(MPI)的并行地震处理模型与共享存储(OpenMP)模型相结合,实现了一个适合于SMP集群的并行地震数据支撑库,将涉及到消息传递的并行地震数据操作以直观的API的形式提供给开发人员。本文利用支撑库提供的API开发了一些测试模块。实验证明,支撑库可支持现有地震数据处理和显示模块的多种并行计算模型,并且能够获得较高的并行加速比和计算效率。  相似文献   

12.
面向移动数字图书馆的情境敏感型知识推荐研究   总被引:1,自引:0,他引:1  
随着移动通信的发展,数字图书馆的各种知识服务更多地在移动终端上实施,但现有的移动数字图书馆对于用户环境、场景等“情境”的感知能力不足,缺乏为用户提供适应当前情境的个性化知识推荐服务。因此提出基于信息嫡度量读者的情境敏感性。基于情境敏感度对读者进行相似性比较,并利用这种比较扩展了协同过滤算法。试验结果表明,该方法为移动数字图书馆具备情境敏感的能力,提高知识推荐的准确性提供了一种新的途径,有利于给读者提供既满足情境又符合其个性化需求的知识资源。  相似文献   

13.
崔伟  马捷 《计算机工程》2004,30(23):37-39
面向连接的简单机群通信协议BCL-SCOP为底层通信协议提供面向连接的协议接口,在目前的机群底层通信协议上实现高速可靠的数据传输,为应用程序提供简单高效的数据收发协议,并对底层协议透明,用户程序与底层协议无关能够方便地移植。应用程序对底层协议的透明使面向连接的协议接口能支持不同机制的协议,以及多协议的并行或高可用的通信。在曙光超级服务器的底层通信协议BCL上实现的BCL-SCOP协议具有较高的性能。  相似文献   

14.
通过结合知识进化论与生物进化论思想,提出了知识进化算法,给出该算法的基本原理和实现途径,并创建了知识的评价函数.把该算法用于图书馆读者满意度评价实例中,可获得成功的试验结果.这表明知识进化算法可促进知识的量与质的提升,为正确决策提供有效的辅助手段.  相似文献   

15.
In this paper, we describe the design and evaluation of a PC cluster system in which IEEE 1394 is applied. Networks for parallel cluster computing require low latency and high bandwidth. It is also important that the networks be commercially available at low cost. Few network devices satisfy all of the above requirements. However, the IEEE 1394 standard provides a good compromise for fulfilling these requirements. We have used IEEE 1394 devices, which support a 400 Mbps data transfer rate, to connect the nodes of a PC cluster system which we have designed and implemented. We have implemented two communication libraries. One is a fast communication library called CF for IEEE 1394. The other is a MPI layer library on the CF library. Experimental results show that CF achieves a 17.2 microsecond round‐trip time. On application benchmarks, the system was considerably faster than TCP/IP over Fast Ethernet. Even though the system was constructed at very low cost, it provides good performance. Using the IEEE 1394 standard is thus a good solution for low‐cost cluster systems. Copyright © 2004 John Wiley & Sons, Ltd.  相似文献   

16.
单一算法生成的识别器普适性不足,对不同种群安卓软件进行识别产生的效果不稳定.针对这种情况,提出一种基于模型库的安卓恶意软件检测方法.通过Python程序进行爬虫与权限提取工作,得到应用的权限信息;使用SMO按照应用的权限信息分类得到不同种群的数据;将应用的种群信息输入到模型库中,得到恶意检测结果,并根据结果对模型库进行...  相似文献   

17.
数字图书馆中基于机群的Web Server数据分布方法   总被引:1,自引:0,他引:1  
随着数字图书馆中信息量的急剧膨胀,一个WebServer已经很难满足众多用户并发查询的要求。文章用机群作WebServer,它由多个处理节点构成,多个节点协同工作,既增加了系统吞吐量,又减轻了每个节点的负担。因此,如何在多个处理节点上分布数据就成为数字图书馆研究的关键问题。该文提出了一种新的数据分布方法,既考虑了图书馆中数据的相似性,又考虑了多个处理节点的工作负载。该方法使一个查询在尽量少的处理节点上完成,减少了网络传输时间。在多个并发用户查询时,查询的效率远远高于传统的数据分布方法。该方法已经用于笔者自行研制的支持数字图书馆的并行文本数据管理系统PDoc中。  相似文献   

18.
Nonnegative matrix factorization provides a new sight into the observed signals and has been extensively applied in face recognition, text mining and spectral data analysis. Despite the success, it is inefficient for the large-scale data set, due to the notoriously slow convergence of the multiplicative updating method. In this paper, we try to solve the problem through the parallel computing technique. Considering the limitation of the shared memory platform, the parallel algorithms are implemented on the distributed memory platform with the message passing interface library. Moreover, we adopt the two-layer cascade factorization strategy to eliminate the network consumption. The parallel implementations are evaluated on a 16-node Beowulf cluster with two data sets in different scale. The experiments demonstrate that the proposed method is effective in both precision and efficiency.  相似文献   

19.
现有的基于密度优化初始聚类中心的k-means算法存在聚类中心的搜索范围大、消耗时间久以及聚类结果对孤立点敏感等问题,针对这些问题,提出了一种基于平均密度优化初始聚类中心的k-means算法adk-means。该算法将数据集中的孤立点划分出来,计算出剩余数据集样本的平均密度,孤立点不参与聚类过程中各类所含样本均值的计算;在大于平均密度的密度参数集合中选择聚类中心,根据最小距离原则将孤立点分配给离它最近的聚类中心,直至将数据集完整分类。实验结果表明,这种基于平均密度优化初始聚类中心的k-means算法比现有的基于密度的k-means算法有更快的收敛速度,更强的稳定性及更高的聚类精度,消除了聚类结果对孤立点的敏感性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号