排序方式: 共有102条查询结果,搜索用时 15 毫秒
91.
多数据库中全局负关联规则挖掘研究 总被引:1,自引:0,他引:1
全局负关联规则挖掘是多数据库关联信息挖掘的重要研究内容,具有广泛的应用范围和使用价值.合并各子数据库的负关联规则是现有全局负关联规则挖掘常用的方法,但数据密度大、规则不全面及运算时间高等问题影响了已有全局负关联规则挖掘方法的效率.本文给出一种新的全局负关联规则挖掘算法,其具体步骤为:(1)扫描各子数据库,建立多数据库频繁模式树;(2)依据频繁项集全局一致性原则,对多数据库频繁模式树执行精简操作;(3)在此基础上产生全局极小非频繁项集;(4)依据极大频繁项集向上闭包原则,产生全局非频繁项集;(5)在规则相关度的基础上提取全局负关联规则.大量的对比实验结果表明,本文算法具有快速发现全局负关联规则的能力. 相似文献
92.
本文是关于我们获得2020年度吴文俊人工智能科学技术奖主要工作的一个介绍。该成果针对自适应学习中面临的教学资源表示困难、学习状态诊断困难以及学习策略设计困难等关键技术难题,首先构建数据驱动的教学资源无监督表示新框架,提高了教学资源质量评估和内容检索的精度和效率。其次提出基于深度学习的学习者认知诊断新方法,突破了以量表为基础的教育测量理论研究范式。然后设计基于知识匹配的个性化推荐技术以及多目标匹配的自适应推荐技术,满足了智能教育场景的复杂约束与学习者的多样目标需求。最后,本文成果研发了面向基础教育的智能教育系统——智学网,已在全国推广使用,对我国智能教育发展具有积极意义。 相似文献
93.
94.
单词嵌入是指运用机器学习的方法,将位于高维离散空间(维数为词典单词数目)中的每个单词映射到低维连续空间的实数向量的技术。在很多文本处理的任务中,单词嵌入提供了更好的语义级别的单词特征表示,从而为文本处理任务带来了诸多便利。同时,大数据时代海量的未标注文本数据,以及以深度学习为代表的机器学习技术的发展使高效的单词嵌入技术成为可能。本文将给出单词嵌入的定义以及实际意义,同时将综述目前单词嵌入技术的几种典型方法,包括基于神经网络的方法、基于受限玻尔兹曼机的方法以及基于单词与上下文共生矩阵分解的方法。本文将详细介绍不同模型的数学定义、物理意义以及训练方法,并给出他们之间的比较。 相似文献
95.
文本分类是将自由文本自动划分到若干预先定义类别的方法,在信息检索等领域有很重要的作用。其中,如何选择有效的文本特征是影响文本分类器分类性能的一个重要步骤 。很多应用中需要处理的文本信息包含了很多的命名实体,如某个行业的名人,往往能够在很大程度上影响着文本所属的类别。然而,现阶段的文本特征方法都只利用关键词
词的统计意义,而没有考虑关键词作为命名实体所含有的分类特征。针对这一问题,本文提出了一种将命名实体识别方法NER集成到文本分类特征选择中的方法,在保留关键 词统计特征之外,还保留了单词作为命名实体的分类特征。实验结果表明,相对于其他特征选择方法而言,本文提出的方法在一定程度上提高了文本分类的分类准确率。 相似文献
词的统计意义,而没有考虑关键词作为命名实体所含有的分类特征。针对这一问题,本文提出了一种将命名实体识别方法NER集成到文本分类特征选择中的方法,在保留关键 词统计特征之外,还保留了单词作为命名实体的分类特征。实验结果表明,相对于其他特征选择方法而言,本文提出的方法在一定程度上提高了文本分类的分类准确率。 相似文献
96.
众筹是一个新兴的互联网金融平台,项目的发起者可以通过使用互联网,征求大量平台用户的资金来资助他们的项目.但是由于众筹平台所具有的独特规则,只有在特定时间内收集了足够的资金,项目的筹资才会成功进行交易.为了防止项目发起者和投资者在可能失败的项目上浪费时间和精力,动态追踪众筹项目的筹资过程以及估算其融资成功概率便极为重要.然而,现有的一些工作既没有针对动态预测跟踪机制的研究,也没有考虑平台上的项目发起者和投资者之间的动态行为交互.为了解决这些问题,基于长短期记忆网络设计了一种新颖的动静态协同预测模型.该模型着重分析了用户行为,包括评论的情绪倾向以及融资过程中的动态增量信息,从而将融资项目与投资人之间的交互行为进行深度挖掘分析.首先,针对平台上的静态特征和动态用户行为数据,通过不同的Embedding方法得到他们的深度表征.在此基础上,进一步设计了基于注意力机制的协同预测模型,以便了解项目融资的时序信息对最终结果的影响程度.最后,在真实的众筹数据集上进行的大量实验结果表明,所提出的动静态表征预测方法相比其他预测方法更为有效. 相似文献
97.
面向云数据库的字符串型隐私信息的加密查询问题,提出了一个有效解决方案。为了确保字符串数据在不可信云数据库中安全性,在客户端,首先对其进行加密并为其构建特征索引。特征索引通过子字段划分、子字段值域分区、分区标识符分配等步骤,能有效地获取字符串的关键特征,而丢弃非关键特征,具有很好的安全性和有效性。然后,数据查询时,方案将定义在隐私字段上的用户查询转换为定义在索引字段上的新查询,使其可以在云数据库上正确执行,而无需解密数据,有效地提高了查询效率。最后,理论分析和实验评估验证了方案的安全性、有效性、高效性和灵活性。 相似文献
98.
一种优化初始中心点的K-means算法 总被引:13,自引:0,他引:13
针对K-means算法所存在的问题,提出一种优化初始中心点的算法.采用密度敏感的相似性度量来计算对象的密度,启发式地生成样本初始中心.然后设计一种评价函数——均衡化函数,并以均衡化函数为准则自动生成聚类数目.与传统算法相比,本文算法可得到较高质量的初始中心和较稳定的聚类结果.实验结果表明该算法的有效性和可行性. 相似文献
99.
信息技术的快速发展导致信息过载.推荐系统是解决信息过载最有效的方式之一.近年来,深度学习的快速发展也带动了推荐系统的进步,各种深度推荐算法层出不穷.然而由于候选物品数量巨大且用户兴趣动态变化,深度推荐算法的推荐复杂度巨大,难以在实际系统中单独使用.在深度推荐技术发展的同时,物品召回技术(也称近似搜索技术)也有了较大的发展与进步.本文先介绍基于距离最小化的物品召回的研究进展,再从向量索引、局部敏感哈希、哈希学习、向量量化四个方面来深入探讨基于内积最大化的物品召回技术的研究进展. 相似文献
100.