排序方式: 共有102条查询结果,搜索用时 15 毫秒
21.
面向Weblog的协同聚类算法具有同时发现用户聚类及与之对应的页面聚类的能力,已成为Weblog数据挖掘的重要研究内容。由于现有的面向Weblog的协同聚类算法大多采用硬划分方法将用户和页面分配到聚类,因此,无法很好地处理聚类边界的问题,即一个用户可能属于多个聚类,从而影响了聚类质量。该文给出了一种面向Weblog的模糊协同聚类FCOW(Fuzzy CO-clustering for Weblog)算法来解决协同聚类算法的边界问题,以提高聚类结果的质量。该算法首先利用矩阵Hadamard积运算发现Weblog中隐含的独立用户模式1={,,K}PA pa pa;其次,依据pa k所对应的页面子集将剩余用户分配到该独立模式中,从而产生协同聚类结果 {k,k}CS CP,k=1,,K;最后计算每个用户和页面与协同聚类之间的模糊隶属度,并以该隶属度作为个性化推荐的依据。实验结果表明,FCOW算法具有获得高质量聚类结果的能力。 相似文献
22.
代码表征旨在融合源代码的特征,以获取其语义向量,在基于深度学习的代码智能中扮演着重要角色.传统基于手工的代码表征依赖领域专家的标注,繁重耗时,且无法灵活地复用于特定下游任务,这与绿色低碳的发展理念极不相符.因此,近年来,许多自监督学习的编程语言大规模预训练模型(如CodeBERT)应运而生,为获取通用代码表征提供了有效途径.这些模型通过预训练获得通用的代码表征,然后在具体任务上进行微调,取得了显著成果.但是,要准确表示代码的语义信息,需要融合所有抽象层次的特征(文本级、语义级、功能级和结构级).然而,现有模型将编程语言仅视为类似于自然语言的普通文本序列,忽略了它的功能级和结构级特征.因此,旨在进一步提高代码表征的准确性,提出了基于多模态对比学习的代码表征增强的预训练模型(representation enhanced contrastive multimodal pretraining, REcomp). REcomp设计了新的语义级-结构级特征融合算法,将它用于序列化抽象语法树,并通过多模态对比学习的方法将该复合特征与编程语言的文本级和功能级特征相融合,以实现更精准的语义建模.最后,... 相似文献
23.
24.
搜索控制问题是大多数人工智能问题求解面临的一个根本间题,而约束满足是解决这一问题的常用方法之一它源于机器视觉领域中的情景标识任务,如今在人工智能的众多领域(如规划、调度、时序推理)中获得了广泛的应用,受到了人工智能界的高度重视.在近几期的UCAI和AAAI等国际人工智能会议上这方面的内容均占有一定的比重,《A币ficial In-telligence》杂志曾于1992年出了一期约束满足问题的专辑 相似文献
25.
为解决隐式反馈推荐问题,贝叶斯个性化排序(BPR)模型已经成为最具有代表性的对级(Pairwise)排序算法之一.在BPR模型中,存在一个严格的偏序假设:相较于未标记的物品而言,用户更喜欢已经有过标记行为的物品.本文提出了一种多重对级贝叶斯个性化排序(MBPR)推荐算法来进一步提升用户对物品的偏好预测能力.首先,基于BPR模型的排序关系设计了一种改进的多重对级偏序假设.具体地,对于每一用户,本文提出将未标记的反馈集细分为潜在的负反馈集和不确定性反馈集,并基于改进的对级偏序假设,提出了一种新的多重对级排序的优化目标来学习用户与物品之间的相关性.为实现MBPR模型的采样任务,本文设计了一种自适应采样策略来为模型更新动态地选取训练样本.最后,在公开数据集上开展了仿真推荐实验,并与基线算法对比.实验结果表明,MBPR算法能够取得更好的推荐效果. 相似文献
26.
基于扩展角分类神经网络的文档分类方法 总被引:10,自引:0,他引:10
CC4神经网络是一种三层前馈网络的新型角分类(corner classification)训练算法,原用于元搜索引擎Anvish的文档分类.当各文档之间的规模接近时,CC4神经网络有较好的分类效果.然而当文档之间规模差别较大时,其分类性能较差.针对这一问题,本文意图扩展原始CC4神经网络,达到对文档有效分类的效果.为此,提出了一种基于MDS-NN的数据索引方法,将每一文档映射至k维空间数据点,并尽可能多地保持原始文档之间的距离信息.其次,通过将索引信息变换为CC4神经网络接受的0,1序列,实现对CC4神经网络的扩展,使其能够接受索引信息作为输入.实验结果表明对相互之间规模差别较大的文档,扩展CC4神经网络的性能优于原始CC4神经网络的性能.同时,扩展CC4神经网络的分类精度与文档索引方法有密切关系. 相似文献
27.
为实现文本信息检索中的个性化推荐,本文以用户焦点作为用户个性特征的描述,设计了适用于快速分类的混合前向角分类神经元网络RealCC。以用户焦点作为样本数据训练该网络后,可以通过该网络对用户查询结果进行快速分类以获得每务查询结果的推荐优先级。给出了使用用户焦点训练该网络的算法。实验表明,RealCC可以在保持分类精度的同时快速的完成对数据的分类,同时,基于用户焦点的个性化推荐,可以有效地减轻用户因从包含大量无关信息的查询结果中筛选感兴趣信息而产生的负担,较好地满足了用户对文本信息检索的时间要求。 相似文献
28.
基于贝叶斯方法的知识发现 总被引:3,自引:0,他引:3
贝叶斯方法是概率统计学中一种很重要的。方法贝叶网络就是根据各个变量之间概率关系用图论方法建立的模型,本文概率统计图的贝叶斯规则应用于知识发现。建立图论模型进行数据挖掘,文章最后应用贝叶斯网络对于实际的数据库进行知识发现,其结果说明了这种方法的有效性。 相似文献
29.
互联网的蓬勃发展,在为用户提供便利的同时,其海量信息也为用户选择造成了困难,基于用户理解的信息推荐服务正成为应时之需.相较于面向单个用户信息的传统推荐技术,基于社交信息的推荐技术通过引入影响力建模,可以更真实地还原用户属性及行为.然而,已有的社交推荐技术往往停留于对用户影响的笼统归纳,并没有对其内在机制进行清晰分类和量化.针对这一问题,通过对用户评分行为中的信任关系进行分析,着重研究了信任用户间接影响用户偏好和直接影响用户评分两种不同机制,进而提出了基于用户间信任关系融合建模的概率矩阵分解模型TPMF,从而实现对上述两种机制的有效融合.在此基础之上,针对不同用户受两种机制影响权重不同的问题,通过借助评分相关性对用户进行聚类并映射到相应权重,实现了用户模型参数的个性化选择.公开数据集的多项实验结果表明:提出的TPMF及其衍生算法在各项指标上优于现有代表性算法,验证了所提出的影响机制及技术框架的有效性. 相似文献
30.
随着教育信息化进程的深入,学生在线学习数据得到不断积累,为数据驱动的教育评估和智能辅助教学提供良好条件.然而,已有的面向在线智慧学习的教育数据挖掘模型很难从海量、稀疏、高噪的数据中准确分析试题特征和学生学业水平,也较少考虑学生及教师的个性化需求.文中针对上述问题开展若干面向在线智慧学习的教育数据挖掘技术研究工作,以教育学习所涉及的试题、学生、教师为对象,以个性化推荐等技术同教育领域知识相结合为手段,以提高学生学业水平为目标.具体介绍用于试题分析和检索的试题文本表征模型、基于认知诊断的个性化学习资源推荐方法、针对教师的教学建议和指导等方法,以及这些技术所依托的应用平台——科大讯飞在线教育系统“智学网”.最后简单讨论面向在线智慧学习的教育数据挖掘技术未来可能的研究方向. 相似文献