排序方式: 共有10条查询结果,搜索用时 15 毫秒
1
1.
伪反馈一直以来都被认为是一种有效的查询扩展技术.但是近来的研究表明传统的伪反馈容易带来主题漂移并因此而影响检索性能.如何确定相关文档以及如何从相关文档中挑选有用的扩展词项是伪反馈中两个重要的方面.与传统查询扩展不同,XML查询扩展不仅需要内容扩展还需要考虑结构扩展.提出了一个解决框架,利用聚类和词组抽取技术来查找相关文档和选择有用的扩展信息.结合XML的语义特征,提出了一种全新的基于层次信息的文档相似性度量方案.基于此,将初始检索结果聚类,获得与查询请求最为相关的文档簇,然后在文档簇中抽取词组,找到符合用户查询意图的扩展查询词组,并在扩展查询词组的基础上进行结构扩展,最终形成完整的"内容+结构"的查询扩展表达式.IEEE CS实验数据上的实验结果表明,结合了聚类和抽取技术的XML伪反馈查询扩展方法能有效地降低主题漂移现象,获得更好的检索质量. 相似文献
2.
3.
基于超链接和标记文本的信息检索算法 总被引:6,自引:0,他引:6
在HITS超链接主题查找算法的基础上提出了一种检索改进算法,该算法首先通过网页之间的链接关系计算出每一网页的出度值和入度值,并将查询条件与超链接上的标记文本或网页全文内容进行相似度匹配。得出每一网页的权值,综合权值与出度或入度值,将检索结果进行排序输出。实验结果表明,与HITS、TF*IDF算法相比,该信息检索方法在相同查全率的条件下具有更好的查准率。 相似文献
4.
搜索引擎中网络蜘蛛搜索策略比较研究 总被引:9,自引:0,他引:9
何种策略访问Web,以提高搜索效率,是近年来专业搜索引擎研究的焦点之一。按照评价链接价值所采用方法的不同,对现有的网络蜘蛛搜索策略进行了分类,分析、比较了各类搜索策略的特点和优缺点,总结了提高网络蜘蛛搜索效率的几个关键因素。对未来的研究方向进行了展望。 相似文献
5.
查询词扩展要解决两个方面的问题:一是扩展词的来源,二是如何在来源集合里挑选扩展词项。对此,首先利用检索结果聚类和排序模型获取了较高质量的相关文档集合,并以此作为扩展源;然后结合XML文档的特点,通过词项间的局部共现特征进行查询扩展。相关实验结果表明,一方面,所采用的检索结果聚类和排序模型的相关文档集扩展源具有较高的用户查询相关性,相比传统的伪反馈扩展源,具有更高的质量;另一方面,提出的结合了XML结构特点的词共现查询扩展方案能获得与用户查询意图相关的扩展信息,与初始查询和无结构的词项扩展方法相比,所提方法能够更有效地提高搜索引擎检索性能。 相似文献
6.
针对现有算法很少考虑用户之间的共乘偏好需求,提出了一种考虑用户偏好的启发式动态共乘匹配算法。构建一个满足用户偏好需求的动态共乘匹配模型,旨在最大化系统匹配率和最小化车辆的绕行距离。算法首先根据出行请求的时间约束、车辆与用户的出行轨迹以及用户的兴趣偏好,过滤不满足用户偏好需求的车辆;其次,构建一个临时匹配图,设置边的权值为出行请求插入到车辆的当前行驶路线中的最小绕行距离;最后采用贪婪方式实现用户与车辆之间的匹配,并采用节点插入方式,将出行请求的出发地点和到达地点插入到车辆的当前行驶路线中。仿真结果表明,提出的启发式动态共乘匹配算法使车辆增加的平均绕行距离和运行时间低于现有算法,系统匹配率高于现有算法;用户的出行时间需求、兴趣偏好、信誉度等共乘需求对系统匹配率有显著影响。 相似文献
7.
8.
9.
网络蜘蛛搜索策略比较研究 总被引:8,自引:0,他引:8
以何种策略访问Web,以提高搜索效率,是近年来专业搜索引擎研究的主要问题之一。按照评价链接价值所采用方法的不同,对现有的网络蜘蛛搜索策略进行了分类,分析、比较了各类搜索策略的特点和优缺点,总结了提高网络蜘蛛搜索效率的几个关键因素。对未来的研究方向进行了展望。 相似文献
10.
针对现有插入操作方法因时间复杂度高而降低动态共乘系统的运行效率,设计了一种以最小化车辆绕行距离为优化目标的线性时间插入操作方法,考虑乘客上车、下车时间约束和车辆容量限制等条件的动态共乘路线优化问题.建立共乘路线模型,采用动态规划技术和固定源节点插入位置的策略,以及利用位置向量的计算结果,可在常量时间内找到车辆绕行距离最小的目标节点的插入位置.理论分析表明:方法能够在线性时间内找到源节点和目标节点的最佳插入位置.仿真结果表明,基于线性时间的插入操作方法能够迅速地得到共乘优化路线,显著提高了动态共乘系统的运行效率. 相似文献
1