共查询到20条相似文献,搜索用时 15 毫秒
1.
基于子树匹配的文本相似度算法 总被引:1,自引:0,他引:1
为降低文本向量维度,提高文本间语义相似度度量性能,综合利用统计方法与语义词典的优势,提出一种文本相似度算法.基于文本生成元数据特征向量,减少向量空间维度,设计基于子树匹配的文本相似度算法,借助子树加速对文本相似度的计算,并通过将文本元数据特征向量与子树进行相似度语义匹配,提高文本相似度计算时语义相似度度量的准确性.该算法考虑到对元数据中同义词的语义理解,加强文本之间相似度度量时的语义覆盖能力.实验结果表明文中所提出的方法是可行和有效的. 相似文献
2.
3.
郐媛媛 《计算机光盘软件与应用》2014,(9):302-303
文本相似度算法研究一直是文本挖掘领域非常重要的算法,指采用一定的策略比较两个文本之间的相似程度,目前文本相似度算法已经在文本分类、文本聚类、自然语言处理等多个领域崭露头角。本文主要就语义角度出发对文本之间相似度进行界定。 相似文献
4.
研究了一种新的协同过滤推荐方法。针对推荐算法中相似度存在的不足,提出了兼顾"形状-距离"的云模型综合相似度测算方法;考虑用户之间的兴趣匹配,提出了云模型熟悉相似度的概念;提出了基于云模型熟悉相似度的邻居用户选择方法,进而产生推荐。实验结果表明,本方法提高了推荐准确度。 相似文献
5.
传统的协同过滤推荐算法存在数据稀疏情况下分类准确性低的问题,针对于此提出一种基于改进余弦相似度的协同过滤推荐算法,将数据经嵌入层转换为特征矩阵,将对其计算后得到的改进余弦相似度矩阵和单位矩阵之间的均方误差作为损失函数,从而提高推荐算法在数据稀疏情况下的分类准确性。实验结果表明,该算法的AUC和对数损失函数指标均优于基线模型FM、FFM和DeepFM模型。 相似文献
6.
由于对文档进行分类有时并不能有效地满足信息检索的需要,文本提出了一种在文本分类的基础上的关键词分类算法,用于优化基于多关键词组合的搜索系统。 相似文献
7.
8.
在大量的文本数据中,针对不能快速有效地提取或查找有用信息及知识这个问题,以文本相似度计算为基础的文本数据挖掘成为数据挖掘研究领域里的一个重要的课题。论文主要研究两种不同的方法 VSM余弦算法和Simhash来实现文本相似度的计算,首先采用传统的VSM余弦算法和Simhash算法,按照余弦公式通过内积最终计算出文本间的相似度大小n(0相似文献
9.
10.
提出了一个新的相似度概念——元相似度,并在此基础上对标准的协同过滤算法进行了改进.元相似度即相似度的相似度,与相似度相比元相似度是基于相似度矩阵而不是相关矩阵计算得出的.即使是在相关矩阵中未购买过任何相同商品的两个用户也可以用元相似度反映他们之间的相似关系,这样在一定程度上解决了冷启动和矩阵稀疏性问题.综合考虑元相似度... 相似文献
11.
计算文本相似度常用基于向量空间计算夹角余弦的方法,该方法忽视了同一文本中词与词之间的语义相似度,因而造成了文本表示模型的高维性以及计算的高复杂性。为此,提出了一种文本相似度算法,利用HNC理论先计算特征词之间的语义相似度,进行必要的降维,进一步计算每个文本向量中的TF*IDF值,最后计算两个向量的空间夹角余弦值并将其作为两个文本之间的相似度。将实验结果与直接计算余弦值的结果比较发现,改进后的算法中VSM的维数明显比改进前小得多,改进后的算法提高了召回率和准确率。因此,改进后的算法是切实有效的。 相似文献
12.
针对移动服务推荐中用户上下文环境复杂多变和数据稀疏性问题,提出一种基于移动用户上下文相似度的张量分解推荐算法——UCS-TF。该算法组合用户间的多维上下文相似度和上下文相似可信度,建立用户上下文相似度模型,再对目标用户的K个邻居用户建立移动用户-上下文-移动服务三维张量分解模型,获得目标用户的移动服务预测值,生成移动推荐。实验结果显示,与余弦相似性方法、Pearson相关系数方法和Cosine1改进相似度模型相比,所提UCS-TF算法表现最优时的平均绝对误差(MAE)分别减少了11.1%、10.1%和3.2%;其P@N指标大幅提升,均优于上述方法。另外,对比Cosine1算法、CARS2算法和TF算法,UCS-TF算法在数据稀疏密度为5%、20%、50%、80%上的预测误差最小。实验结果表明UCS-TF算法具有更好的推荐效果,同时将用户上下文相似度与张量分解模型结合,能有效缓解评分稀疏性的影响。 相似文献
13.
为满足B2B电子商务平台下供应商选择个性化服务需求,引入云模型中云的相似性度量算法和基于资源相似度的数据权重,对基于项目的协同过滤推荐算法进行改进,并用于供应商推荐过程中。实验表明,改进后的算法可以在一定程度上解决数据稀疏性问题并及时反映用户兴趣变化,从而实现个性化推荐服务,帮助企业快速有效开发供应商伙伴关系,提高企业的生产效率和竞争力。 相似文献
14.
15.
16.
为了解决协同过滤算法推荐精度低的问题,提出基于用户相似度和信任度的药品推荐算法。该方法通过离线使用DBSCAN算法对药品进行聚类来降低时间复杂度。引入共同评分药品阈值使用户相似度计算更准确,同时设置相似度阈值来限定相似性邻居的选取以克服KNN算法选取邻居的缺陷。根据用户的推荐可信度和评分可信度建立信任计算模型,计算基于相似邻居集的可信邻居集。通过两次邻居选择策略为目标用户产生药品推荐。仿真结果表明,该算法与其他算法相比在平均绝对误差、准确率和召回率上有更好的性能,提高了系统推荐精度。 相似文献
17.
用户间多相似度协同过滤推荐算法 总被引:4,自引:1,他引:4
传统的User-based协同过滤推荐算法仅采用了单一的评分相似度来度量用户之间对任何项目喜好的相似程度。然而根据日常经验,人们对不同类型事物的喜好程度往往是不同的,单一的评分相似度显然无法准确描述这种不同。针对上述问题,提出了一种基于用户间多相似度的协同过滤推荐算法,即基于用户间对不同项目类型的多个评分相似度来计算用户对未评分项目的预测评分。实验结果表明,该算法可以有效地提高预测评分的准确性及推荐质量。 相似文献
18.
协同过滤算法是目前推荐系统中应用最广泛的技术,相似度的计算是该算法中关键的一步,它直接影响到后续的目标用户邻居集的选取及评分预测,最终决定着推荐的准确度。在传统的基于用户的协同过滤中,相似度的计算未考虑用户评分差异和商品的热度对相似度计算的影响。论文引入平均评分修正因子和热门商品惩罚因子,对传统的相似度计算公式加以优化。实验表明,改进后的相似度算法在电影推荐时,平均绝对误差(MAE)值较其他相似度算法更低,有着更好的推荐效果。 相似文献
19.
传统教学资源推荐方法无法处理大量过载信息且质量参差不齐,因此文章研究基于相似度算法的中国建筑史线上课程教学资源推荐方法。首先将兴趣与教学资源的相似度和知识之间连接度融合,构建线上教学资源推荐模型;其次利用信息检索与数据挖掘加权技术,完成相似度算法的增加和文本特征权重的计算;最后通过Apriori算法挖掘用户置信度,与用户相似度进行融合后,完成线上课程教学资源的推荐。测试结果表明:教学资源推荐方法增加相似度算法后,完成教学资源推荐的平均用时为14.8 s,平均准确率也可以达到99.431%,提高了教学资源推荐质量。 相似文献
20.
在用户对项目进行评分的时候,有时会出现不合理因素导致用户对项目做出不合理评分,使得推荐过程出现偏差。为修正这一偏差,采用评分矩阵的多种维度进行相似度比较以修正不合理评分,再用修正后的评分进行协同过滤推荐。而在采用变维度评分矩阵进行相似度对比时,主要利用同一用户对相似项目评分的相近性,对比2个用户对多个相似项目评分数组在不同维度下的余弦相似度。首先将多个评分构建成等维度的几个数组,对比2个用户的各个评分数组相似度,当某个相似度与其它相似度差别较大时,认为该相似度对应的2个用户的数组中至少有1个包含不合理评分;然后将2个数组按同样的方式均分为维度更低的数组,以此类推,最终确定不合理评分;最后以所有合理评分数组对应的相似度均值作为不合理评分数组对应的相似度,从而修正不合理评分。利用MovieLens和Bookcrossing数据库进行实验,结果表明:带修正评分的协同过滤算法相比未修正前的评分具有更高的推荐精度,其推荐评分MAE明显下降,本文算法相比对照算法获得了更优的MAE,Precision和Coverage。 相似文献