首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 78 毫秒
1.
提出一个深层次的问句语义分析算法,实现问句从文字空间到语义空间的映射。在问句语义分析算法的基础上,提出面向海量问答数据的检索模型,该模型采用搜索引擎的检索技术,利用问句语义分析的结果,将问句相似度计算结合到信息检索过程中,既保证了检索的效率又保证了检索的精度。  相似文献   

2.
基于链接的方法进行Web信息检索的TREC实验研究   总被引:1,自引:0,他引:1  
本文通过TREC实验研究基于链接信息的检索对Web信息检索的影响,包括使用链接描述文本,链接结构以及将基于链接的方法和传统基于内容检索的方法合并。得到如下结论:首先,链接描述文档对网页主题的概括有高度的精确性,但是对网页内容的描述有极大的不完全性;其次,与传统检索方法相比,使用链接文本在网页定位的任务上能够使系统性能提高96% ,但是在信息查询任务上没有帮助;最后,将基于链 接信息的检索与传统的基于内容检索技术合并,在网页入口定位任务上总能将系统性能提高48%到124.8% ,而对特定信息查询任务也能在一定程度上改善检索效果。  相似文献   

3.
链接信息在Web检索中的应用   总被引:1,自引:0,他引:1  
介绍了在Web检索中的应用链接信息的PageRank算法,Kleinberg算法,超链接相似度函数,SALSA算法,并给出了实验数据.  相似文献   

4.
链接预测是知识图谱的补全和分析的基础。由于位置相关的实体和关系本身拥有丰富的位置特征,该文提出了一种基于位置的知识图谱链接预测方法。该方法首先通过分析实体和关系的语义特征对关系进行分类,然后提出了一种基于位置的实体和关系位置特征和规则的挖掘方法;其次,通过挖掘出的实体位置特征和规则,对实体和关系的向量化方法预测结果进行约束,得到最终的结果。该文通过对WikiData、FB和WN数据集的实验,证明该方法针对基于位置的关系和实体链接预测拥有较好的效果。  相似文献   

5.
基于分类的链接预测方法中,由于链接未知节点对的大规模性与不确定性,选择可靠负例成为构造链接预测分类器的难点问题.为此,文中提出基于正例和无标识样本(PU)学习的链接预测方法.首先,提取节点对的拓扑信息以构造样本集.再利用社区结构确定候选负例的分布,基于分布进行多次欠采样,获得多个候选负例子集,集成多个负例集与正例集中构建的分类器选择可靠负例.最后基于正例与可靠负例构造链接预测分类器.在4个网络数据集上的实验表明文中方法预测结果较优.  相似文献   

6.
链接预测是社会网络分析中一个具有挑战性的问题。社会网络中的链接预测问题就是预测社会实体间未被发现的链接和即将演化产生的链接。已有的链接预测算法大多基于社会网络本身的拓扑结构,而忽视社会实体自身的个性化特征。针对以上问题,结合社会实体的个性化特征和社会网络的拓扑特征,提出一种基于概率矩阵分解模型的个性化链接预测算法。该算法整合了社会网络的拓扑特征和实体的个性化信息,建立概率矩阵分解模型,并通过基于梯度的优化算法对模型进行求解。在两个数据集上进行多组实验,一个是数据挖掘领域的合作者网络,另一个是电子商务消费者的信任网络。实验结果证明该算法较现有方法预测准确率有了较大提高。  相似文献   

7.
链接预测是社会网络分析领域的关键问题。传统的链接预测方法大多针对社会网络的静态结构预测隐含的链接或者将来可能产生的链接,而忽视了网络在动态演变过程中的潜在信息。为了能更好地利用网络演变的动态信息,从而取得更好的链接预测效果,提出了一种基于网络结构演变规律的链接预测方法。该方法使用机器学习技术对网络结构特征的动态变化信息进行训练,学习每种结构特征的变化并得到一个分类器,为每个分类器加权得到最终集成的结果。在三个现实的合著者网络数据集上的实验结果表明,该方法的性能要高于静态链接预测方法和一个相关的动态链接预测方法。这说明,网络结构演变信息有助于提高链接预测效果。此外,实验还表明,不同的结构特征对网络动态变化的刻画能力也有所差别。  相似文献   

8.
在社会网络分析中链接预测尤为重要。文章关注社会网络中有权图的链接预测问题,提出了一些针对有权图的链接预测度量指标。基于网络中的两个节点在相近时间发布相近内容则相似性更大的假设,文章提出一个基于时间信息的链接预测方法。通过在一个博客数据集上的实验显示该方法相对于传统方法效果更好。  相似文献   

9.
针对网络动态性和稀疏性的特点,在网络进化及链接预测过程中引入主动学习范式,提出了一种新的动态网络链接预测方法。首先为网络中每个结构特征的变化序列都生成一个分类器;再用这些分类器对每个未连接的节点对进行评分并把预测结果差异较大的节点对样本交于用户判别;一旦获取真实的标记(即节点间是否存在链接),系统采用更新的训练集重新训练各分类器并整合得到最终的模型。在三个现实的合著者网络数据集中的实验表明,在动态网络链接预测方法中引入主动学习在AUC值指标上有显著提高。  相似文献   

10.
本文提出了一种适用于中文文献索引数据的实体解析方法.区别于新近的属性 链接结构的聚类方法,本方依据实际问题的特点采用了先属性匹配,然后基于文献合作网络的结构解析的策略.该方法在真实的大数据量文献索引数据上运行获得了良好的效果,并已经运用于数字图书馆的检索系统.  相似文献   

11.
为了增加基于用户的协同过滤方法在预测Web服务质量时的相似性用户数目,进而提高Web服务的质量,首先构建一个用户相似性网络,并通过链接预测的方法找出潜在的相似性用户,最后综合应用相似性用户和预测出的潜在相似性用户预测用户的Web服务质量.实验表明,提出的方法在提高预测成功率的同时,还降低了预测的误差,因而适用于稀疏的Web服务质量预测.  相似文献   

12.
链路预测是图挖掘主要研究的问题,其研究重点是提取图的特征信息,现有研究方法大多只关注网络拓扑结构而忽略了节点属性信息.针对该问题,提出了基于图核的链路预测方法NGLP.该方法能挖掘有效、可用的元路径;基于元路径对预测对象生成带节点属性的子图,使用子图表示被预测的链路;然后利用图核方法计算子图之间的相似性;最后训练SVM得出链路预测结果.实验结果表明,提出方法与其他方法相比具有更高的精度和更强的稳定性.  相似文献   

13.
唐明虎 《计算机应用研究》2021,38(5):1393-1397,1408
针对基于拓扑结构相似性的链路预测算法中网络稀疏性和噪声问题,提出一种基于非负矩阵分解的链路预测模型。该模型从微观与宏观两个层面出发,融合网络内部和外部的辅助信息,减轻了网络稀疏性造成的影响,提升了算法预测的整体性能。提出的三种信息组合模式体现出宏观与微观角度下的信息融合策略。在13个真实网络数据集上的实验结果展示了算法预测性能上的优越性。  相似文献   

14.
现有的大部分基于非负矩阵分解的链路预测方法仅考虑网络拓扑结构信息而忽略节点与链接聚类信息.针对此问题,提出一个融合聚类信息的对称非负矩阵分解的链路预测模型.首先,该模型利用对称非负矩阵分解去捕获网络节点相似度信息;其次,使用基于Jaccard的节点和链接聚类系数去保持网络局部结构信息;最后,启用拉格朗日乘法规则去学习模型参数.在六个真实无向无权和四个加权网络上的实验结果表明,该方法在两种不同类型网络预测精确度分别提升了1.6%和8.9%.  相似文献   

15.
当前可用的生物数据在不断地迅速增长,仍有很多生物信息如蛋白质交互信息(protein-protein interac-tion,PPI)还未被发现,而这些潜在的或未知的信息对生物过程的研究是至关重要的。近年来,对未知生物信息的挖掘和研究吸引了很多人的关注。通过实验检测方法来发现这些信息是非常耗时耗力的,所以链接预测成为一种新的挖掘这些信息的指导方法。基于蛋白质交互网络并融合了基因表达数据信息,从拓扑和基因表达两个方面的信息来构建PPI权值网络,提出了一种在权值网络中基于相似度比较的链接预测的新方法来预测PPI网络中未知的交互信息。使用MIPS数据库评估了实验结果,表明了该算法有很好的准确率和良好的性能。  相似文献   

16.
基于半监督学习的链接预测算法的研究*   总被引:2,自引:1,他引:1  
针对链接挖掘中网络的结构难以预测这个难点问题,提出了一个关于链接预测的新型半监督学习方法——基于快速共轭梯度方法和链接相似性传递增殖原理的链接预测算法,利用节点相似性等辅助信息去预测未知结构。该算法利用张量的形式去表示多维的复杂的多关系数据,利用克罗内克积与克罗内克和去计算张量之间的相似性,利用向量特技方法降低了算法的时间和空间复杂度。在社会网络和生物信息网络等环境下,通过实验验证了算法的有效性和健壮性。  相似文献   

17.
18.
当前链路预测的研究主要集中在无向网络,然而现实世界中存在大量的有向网络,忽略链路的方向会缺失一些重要信息甚至使预测失去意义,而直接将无向网络的预测方法应用于有向网络又存在预测精度降低的问题。为此,提出了一个基于三元组的有向网络链路预测算法,该算法针对有向网络和无向网络三元组结构的不同,应用势理论对三元组进行筛选,通过统计分析不同三元组闭合的可能性,以网络整体三元组闭合指数作为权重计算节点间的相似性。在9个真实数据集上的实验表明,所提方法比基准方法的预测精度提高了4.3%。  相似文献   

19.
针对单机工作站环境下处理大规模动态社会网络图时执行效率低,以及动态社会网络发布中数据可用性较差的问题,提出基于预测链接的分布式动态社会网络隐私保护方法D-DSNBLP。该方法通过Pregel-like消息迭代更新模型,实现匿名大规模图数据的并行处理。首先通过快速迭代完成结点分组;其次根据各个组内的结点属性值并行构建候选结点集合;最后通过构建互斥边集合添加边,实现结点的隐私保护。实验表明,D-DSNBLP方法提高了大规模动态社会网络发布的效率,保证了匿名图的数据可用性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号