排序方式: 共有45条查询结果,搜索用时 15 毫秒
1.
2.
3.
4.
加权关联规则的改进算法 总被引:7,自引:2,他引:7
论文讨论了加权关联规则问题,针对布尔类型的加权关联规则问题提出一种改进算法。该算法首先利用普通的关联规则算法产生频繁集,然后在该频繁集的基础上产生加权频繁集。同时,给出了最优的最小支持度设定方法,保证了普通关联规则算法所产生的频繁集为加权频繁集的超集。该算法有较高的效率,并且能够有效利用已有的关联规则算法。 相似文献
6.
7.
中国钢铁产业集中度相关产业环境的解析 总被引:2,自引:0,他引:2
钢铁产业集中度的提高不是钢铁产业自身的事情,它与中国经济体制改革进程、经济环境及政策息息相关,与中国各钢铁区域市场的整合、钢铁工业粗钢生产规模密切相关,与钢铁产业科技进步、规模经济、市场机制完善等因素紧密相联。本文试图从产业政策、产业发展周期、产业运行状况等角度分析中国钢铁产业集中度(即产业组织结构优化)所面临的基本产业环境。 相似文献
8.
建立快速有效的针对大规模文本数据的聚类分析方法是当前数据挖掘研究和应用领域中的一个热点问题.为了同时保证聚类效果和提高聚类效率,提出基于"互为最小相似度文本对"搜索的文本聚类算法及分布式并行计算模型.首先利用向量空间模型提出一种文本相似度计算方法;其次,基于"互为最小相似度文本对"搜索选择二分簇中心,提出通过一次划分实现簇质心寻优的二分K-means聚类算法;最后,基于MapReduce框架设计面向云计算应用的大规模文本并行聚类模型.在Hadoop平台上运用真实文本数据的实验表明:提出的聚类算法与原始二分K-means相比,在获得相当聚类效果的同时,具有明显效率优势;并行聚类模型在不同数据规模和计算节点数目上具有良好的扩展性. 相似文献
9.
10.
针对现有深度神经网络点击率预测模型在对用户偏好建模时,难以有效且高效地处理用户行为序列的问题,提出长短期兴趣网络(Long and short term interests network, LSTIN)模型,充分利用用户历史记录上下文信息和顺序信息,提升点击率预测精准性和训练效率。使用基于注意力机制的Transformer和激活单元结构完成用户长、短期兴趣建模,对用户短期兴趣进一步使用循环神经网络(Recurrent neural network, RNN)、卷积神经网络(Convolutional neural networks, CNN)进行处理,最后使用全连接神经网络进行预测。在亚马逊公开数据集上开展实验,将提出的模型与基于分解机的神经网络(DeepFM)、深度兴趣网络(Deep interest network, DIN)等点击率预测模型对比,结果表明提出的模型实现了考虑上下文信息和顺序信息的用户历史记录建模,接受者操作特征曲线下面积(Area under curve, AUC)指标为85.831%,相比于基础模型(BaseModel)提升1.154%,相比于DIN提升0.476%。且因区分用户长、短期兴趣,模型能够在提升预测精准性的同时保障训练效率。 相似文献