首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 109 毫秒
1.
刘海旭  郑岩 《软件》2012,33(12)
社会化标签正被广泛的应用在网页文本的描述和分类方面,能够直接反映用户兴趣和商品特征,因而可用于个性化推荐系统中.在进行标签推荐时,需要考虑到标签间的关联度,而现有的标签关联度算法都是基于标签之间的共现关系或者直接基于语义词典,这些算法未考虑到标签与资源的相关性和资源与资源的相关性.本文提出了基于语义的标签关联算法,首先通过潜层狄利克雷分配模型和向量空间模型求得资源间的相关度,然后通过概率模型求得标签与资源的相关度,最后求得标签间的关联度.实验结果表明:基于语义的标签关联算法能够有效的提升社会化标签推荐系统的性能,与语义词典在语义上基本一致且能够实现语义词典未登录词的关联.  相似文献   

2.
曹月芹 《计算机工程》2011,37(24):45-49
针对动态文本流中的话题线索检测问题,提出一种基于语义相关度模型的话题线索检测算法。利用改进的语义相关度模型计算消息文本与话题线索之间的语义相关度,将消息划分至相应的话题线索。在真实数据集上的实验结果表明,与现有算法相比,该算法的F1测度值较高。  相似文献   

3.
微博文本短小、特征稀疏、与用户查询之间存在语义鸿沟的特点会降低语义检索效率。针对该问题,结合文本特征和知识库语义,构建基于潜在语义与图结构的语义检索模型。通过Tversky算法计算基于Hashtag的特征相关度;利用隐含狄利克雷分布算法对Wikipedia语料库训练主题模型,基于JSD距离计算映射到该模型的文本主题相关度;抽取DBpedia中实体及其网络关系连接图,使用SimRank算法计算图中实体间的相关度。综合以上3个结果得到最终相关度。通过短文本和长文本检索对Twitter子集进行实验,结果表明,与基于开放关联数据和图论的方法相比,该模型在评估指标MAP,P@30,R-Prec上分别提高了2.98%,6.40%,5.16%,具有较好的检索性能。  相似文献   

4.
高一波  赵先章  孙硕  黄河 《计算机工程》2009,35(11):184-186
提出一种面向垂直搜索引擎的基于知识的语义关联算法,以知识表达技术及语义关联度计算为核心,建立语义关联规则,在语义扩展基础上提高查询招回率和语义相关度计算高检索的准确性,同时根据农产品物流领域的特点,设计并实现了用于农产品物流ASP平台的垂直搜索引擎。  相似文献   

5.
面向主题的概念检索研究   总被引:3,自引:1,他引:2  
该文提出了一种基于概念网络和主题概念树的面向主题的文本检索算法。依托概念网络建立主题概念树,利用主题概念树对用户的查询请求进行语义扩展,实现同义和语义蕴涵检索。关联度的计算模型考虑了词与词之间,句与句之间的语义激励。通过关联度在主题概念树上的传播模型,实现复合概念关联度的计算。检索结果按关联度大小降序排列。基于主题概念树的概念检索导航为用户检索提供了便利。  相似文献   

6.
提出了一种基于本体语义模型的信息检索方法。该方法充分利用领域本体提供的概念之间的语义相关性,从语义模型扩展、概念相似度、相关度计算,并以用户反馈等角度探讨了基于语义模型的自动推理方法在信息检索中的应用,文章介绍了系统实现框架。该系统将应用在学习资源的智能检索中。  相似文献   

7.
提出了词语相关度模型,作为在数据空间中发现数据源内容关联的一个基础。本模型基于HowNet,可以计算同种词性以及不同词性之间的相关度,融合了词语的相似度、关联度和实例因素,综合获得词语的内在相关性。通过对比实验发现,本模型所计算的词语相关度值更加符合人们主观上对词语相关性的认识。  相似文献   

8.
为提高智能检索系统的查准率和查全率,分析了目前查询扩展方法存在的不足,考虑计算有向边权重的因子对语义距离的影响,对基于语义相似度的计算方法进行优化,提出了一个计算用户查询与文档相关性之间关联度的表达式.利用构建的领域本体量化概念间的关联程度,通过计算合理的相似度与相关度的权重来进行查询扩展,并设计了一个基于概念关联度的语义检索模型,将检索结果按关联度排序显示.实验表明,该方法在确保查准率的前提下能有效提高查全率.  相似文献   

9.
针对聚类中的特征选择问题,提出一种基于特征语义权重的数据聚类方法。该方法由用户指定必需的特征集,通过计算特征之间的语义相关度,选择和指定特征集相关的特征集作为补充。利用语义相关度确定各个特征的语义权重,在特征语义权重计算的基础上对传统的K-Means聚类算法进行改进,提出具有特征语义权重的FSW-KMeans算法。实验结果表明,FSW-KMeans算法较大地提高了聚类算法准确率和效率。  相似文献   

10.
针对通用搜索引擎缺乏对网页内容的时态表达式的准确抽取及语义查询支持,提出时态语义相关度算法(TSRR)。在通用搜索引擎基础上添加了时态信息抽取和时态信息排序功能,通过引入时态正则表达式规则,抽取查询关键词和网页文档中的时态点或时态区间等时态表达式,综合计算网页内容的文本相关度和时态语义相关度,从而得到网页的最终排序评分。实验表明,应用TSRR算法可以准确而有效地匹配与时态表达式相关的关键词查询。  相似文献   

11.
周诗龙  徐俊刚 《软件学报》2013,24(S2):150-161
目前,微博搜索大多应用向量空间模型计算查询词与文档间的相关程度,通常使用TF-IDF(termfrequency-inverse document frequency)统计方法来确定词的权重.然而仅使用词进行微博搜索并不能检测到某条微博的信息含量,而这些往往是查询用户所关注的问题.为此提出了一种基于分析特征与动态步长的微博排序学习算法.首先,定义了一些微博分析特征,经过统计分析获得的这些分析特征可以用来预测用户行为;其次,在此基础上,提出了以词性为单位计算微博相关度的方法,结合信息熵计算方法得到微博词性信息的含量,并用来预测该微博的信息含量;最后,在现有ListNet排序学习算法的基础上,引入了动态步长的概念,对步长进行了动态优化,最终形成了一种基于动态步长的微博排序学习算法——RDLS(ranking based on dynamic learning stepsize)算法.实验结果表明,无论是基于直接特征还是加入分析特征,在相同迭代轮数情况下,相比ListNet算法,RDLS 算法可以训练出更优的模型,在微博排序方面有更好的表现.  相似文献   

12.
曾安平 《计算机应用》2012,32(8):2198-2201
针对传统关联规则算法产生的规则关联性弱、种类少的缺点,结合Spearman秩相关系数,提出了一种多类关联算法。该算法在传统算法产生的强规则基础上,利用Spearman秩相关方法计算出规则中产品间的同步异步等相关性。将其作为兴趣度阈值,算法可同时产生同步正规则、异步正规则、同步负规则和异步负规则四类关联规则,且规则间联系紧密。实验结果表明了算法的有效性和优越性。  相似文献   

13.
陈妤  秦威 《计算机系统应用》2022,31(11):387-392
随着网络规模的增大, 节点接近中心性的精确算法效率越来越低. 本文提出一种基于RankNet排序学习算法的模型以快速逼近复杂网络节点接近中心性排序. 首先通过相关性分析得到与接近中心性呈正相关的节点重要度指标作为模型的输入特征, 然后在给定网络中随机选取节点子集用于模型的训练样本数据. 在一个真实航空网络数据集和典型的复杂网络模型上对提出的模型进行了验证, 实验结果表明基于RankNet排序学习算法的模型能够在一定程度上降低计算时间复杂度, 而且保持了较高的近似准确性, 所提出的模型排序效果明显优于采用回归学习的基准模型.  相似文献   

14.
在文本搜索领域,用自学习排序的方法构建排序模型越来越普遍。排序模型的性能很大程度上依赖训练集。每个训练样本需要人工标注文档与给定查询的相关程度。对于文本搜索而言,查询几乎是无穷的,而人工标注耗时费力,所以选择部分有信息量的查询来标注很有意义。提出一种同时考虑查询的难度、密度和多样性的贪心算法从海量的查询中选择有信息量的查询进行标注。在LETOR和从Web搜索引擎数据库上的实验结果,证明利用本文提出的方法能构造一个规模较小且有效的训练集。  相似文献   

15.
HITS(Hyperlink-Induced Topic Search)算法是一种基于超链接结构的搜索结果排序算法。文章针对传统HITS算法存在的主题漂移问题提出了一种基于页面关联度的改进算法。通过引入搜索页面间关于查询主题的关联来为每个链接赋予不同的权重,进而改变邻接矩阵的项值。改进的HITS算法有效地抑制了主题漂移问题,并用实例得以验证。  相似文献   

16.
一种基于语义网中本体的排序算法   总被引:1,自引:0,他引:1       下载免费PDF全文
为提高本体的重用度,出现了许多本体搜索引擎.但由于其排序算法的局限性,效果都不理想.该文通过分析已有的本体排序算法,并针对排序结果与用户查询的相关性低以及检索响应时间过长等不足,给出了改进ImOntoRank算法.实验结果表明,改进后的算法可以满足用户的需求.  相似文献   

17.
针对属性权重未知且评价数据为多维时序的信任度排序问题,提出一种基于线性规划理论的信任度排序方法。首先使用线性规划模型确定一维时序下属性权重未知的多个节点信任度排序上下限向量,然后建立多维时序下信任度的最优协调排序模型,再将模型转化为典型指派问题并利用匈牙利算法进行求解,从而得到各个节点的信任度排序。实例分析表明,当最优协调排序模型中距离参数q取低值时,对极值数据不敏感,可以防止少数评价数据突变造成的误评; 当q选取高值时,对极值数据较敏感,可以识别受评对象中信任度摇摆不定的潜在不诚实对象。  相似文献   

18.
田枫  沈旭昆 《自动化学报》2014,40(8):1635-1643
传统的网络图像标注方法忽视了标签集整体相关性对标注结果的影响,导致标签集整体相关性缺乏和语义冗余. 为了解决上述问题,提出了一种基于标签集相关性学习的大规模网络图像在线语义标注方法. 给出了标签集对图像相关性和标签集内部相关性的概率估计算法,将上述约束形成一个优化问题,采用贪心搜索策略获取近似最优解,找到能合理地平衡上述因素的标签集,并针对大规模图像集和概念集进行了优化. 真实环境下大规模网络图像集上的测试表明,相比于目前的代表性网络图像标注方法,该方法获得的标签集能够更好的描述图像语义,性能提升明显.  相似文献   

19.
Most entity ranking research aims to retrieve a ranked list of entities from a Web corpus given a user query. The rank order of entities is determined by the relevance between the query and contexts of entities. However, entities can be ranked directly based on their relative importance in a document collection, independent of any queries. In this paper, we introduce an entity ranking algorithm named NERank+. Given a document collection, NERank+ first constructs a graph model called Topical Tripartite Graph, consisting of document, topic and entity nodes. We design separate ranking functions to compute the prior ranks of entities and topics, respectively. A meta-path constrained random walk algorithm is proposed to propagate prior entity and topic ranks based on the graph model.We evaluate NERank+ over real-life datasets and compare it with baselines. Experimental results illustrate the effectiveness of our approach.  相似文献   

20.
Statistical correlation analysis in image retrieval   总被引:7,自引:0,他引:7  
Mingjing  Zheng  Hong-Jiang 《Pattern recognition》2002,35(12):2687-2693
A statistical correlation model for image retrieval is proposed. This model captures the semantic relationships among images in a database from simple statistics of user-provided relevance feedback information. It is applied in the post-processing of image retrieval results such that more semantically related images are returned to the user. The algorithm is easy to implement and can be efficiently integrated into an image retrieval system to help improve the retrieval performance. Preliminary experimental results on a database of 100,000 images show that the proposed model could improve image retrieval performance for both content- and text-based queries.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号