共查询到20条相似文献,搜索用时 62 毫秒
1.
用户搜索网页行为的分析是目前信息搜索的研究的热点,本文针对云计算中的并行计算搜索存在的检索速度慢,效率低等缺点提出了一种基于Hadoop海量用户搜索网页行为的方法,该方法主要是在网页PageRank算法的基础上,将用户影响因子,时间向量和网页相关性因素加入到算法中,使得改进后的PageRank算法得到了提高,进一步提高用户搜索网页行为的效率,实验中通过使用优酷实验室中的查询日志分析证明了本文的算法具有良好的效果,并对云计算中的用户行为分析具有一定的指导意义. 相似文献
2.
与拼音文字不同,用户在进行中文输入时需要借助输入法软件完成从拼音串到汉字串的转换过程,输入法因此成为中文用户进行人机交互的基础性工具,而输入法的相关技术研发也一直是学术界与产业界的关注热点。在中文输入法技术的研究中,用户的行为特点对输入法软件的词库建立、算法设计、交互方式设计与性能评价等多方面都有着至关重要的作用,但由于数据获取与分析的困难,这方面的相关研究尚不多见。该文利用某中文输入法在用户许可下收集的超过4.1亿条用户输入行为记录,进行了中文输入法用户行为的分析研究,针对不同类别应用程序的输入词频差异,不同用户在同类应用程序中的不同候选词条的选择等行为特点进行了挖掘分析,研究结果会对深入了解中文输入法用户行为,进而改进输入法软件性能具有一定的指导意义。 相似文献
3.
随着问答社区信息的长期积累,越来越多的过时信息充斥在其中并被搜索引擎检索,给信息需求者带来不便。用户的网页浏览日志中隐性地包含用户的行为习惯,通过分析得到这些信息对判断网页信息时效性有着重要意义。文中提出针对网页浏览日志的查询过程划分方法,并在划分的基础之上对大量真实用户的浏览行为习惯做了统计分析。结果显示,用户查询一次信息平均浏览8.05个页面,用时6.28分钟,有将近1/3的查询在交替并发中进行,另外用户对于网站站内搜索的依赖较高。从浏览日志数据集中选取了一个社区网站的浏览记录来进行初步的网页信息时效性分析,结果表明造成用户不满意的原因主要是查询相关度不高,而过时信息只是其中一小部分。 相似文献
4.
随着移动互联网的迅速发展,移动搜索用户大规模增加,移动搜索引擎用户行为分析对改进搜索引擎性能,提高用户体验具有重要意义。该文选取某移动搜索引擎2011年6月第一周的日志,对移动互联网用户搜索行为进行分析和研究。我们从查询词分析、会话分析以及用户点击分析3个角度出发,对查询词长度和频度、问题式查询和网址查询比例、会话内查询个数、查询词修改方式以及用户点击位置进行研究,并与互联网搜索引擎相应指标进行对比。相关分析结论对于移动搜索引擎算法改进与系统优化具有一定参考意义。 相似文献
5.
因特网的飞速发展,网络资源呈爆炸式的增长。信息检索是人们上网的主要目的之一。目前的信息检索领域有许多检索方法与检索工具,为用户检索信息提供了许多途径。但如何利用搜索引擎实现更快更精确的搜索已经成为这一领域的研究热点。在研究现有的几种搜索引擎的基础上,提出了一种基于用户行为聚类的搜索引擎。通过分析不同的用户行为将搜索用户聚类成不同的用户组,为每组用户返回其喜欢的结果,优化查询结果。 相似文献
6.
7.
8.
随着本地搜索的发展,通用排序算法得出的排序结果已不能完全满足用户的需要,根据本地搜索的特点,可以更好地利用用户的搜索特征。文中提出通过对用户的行为分析,提取用户行为特征值,再运用排序学习的SVM(支持向量机)方法将分析得到的用户行为特征值融入本地搜索算法当中,以此实现对排序算法的优化。融人了用户行为特征后,本地搜索的排序结果平均准确率和前十名文档的相关性都有了一定的提高。实验结果显示,用户行为特征使得排序结果可以更容易、准确地反映用户的兴趣,提升了用户的搜索体验。 相似文献
9.
电子商务网站中,关键词搜索是用户查询的一种重要手段,计算搜索关键词中的切词权重,是搜索引擎查询处理时的一个重要内容.基于现有的切词权重的计算方法,对用户在网站进行信息查询等购物的决策过程中产生的多种类型的用户行为进行深入数据挖掘,并将其挖掘结果作用于切词权重词典,有效地提高了切词权重的准确性,提高了搜索排序准确率. 相似文献
10.
用户访问兴趣度的分析是Web日志挖掘中一个重要的研究课题.在概述Web日志挖掘过程的基础上,对日志挖掘各个阶段进行了分析,研究得出了用户对访问页面的兴趣度. 相似文献
11.
基于Web日志挖掘用户的浏览兴趣路径 总被引:1,自引:0,他引:1
提出一种基于Web日志发现用户浏览偏爱路径算法。引入了支持-兴趣度概念。建立用户访问矩阵以表示用户浏览网页行为,并获得访问矩阵的海明距离矩阵。通过对距离矩阵与相似度阈值的计算获得偏爱路径的候选2项子路径,再利用支持-兴趣度对候选集做进一步的过滤,最后进行合并并生产浏览偏爱路径。实验表明该算法可以有效地反映用户的浏览兴趣。 相似文献
12.
在互联网智能化的过程中,互联网用户行为的分析是一个必要的工作.通过架设网络代理,记录用户在互联网上发出的HTTP请求,建立用户行为日志库,并根据Web访问的特性对用户行为日志进行过滤、聚类,缩减数据规模,最后利用开放式分类目录ODP(Open Directory Project)对用户行为进行分类统计,将没有语义信息的... 相似文献
13.
查询扩展可以有效地消除查询歧义,提高信息检索的准确率和召回率.通过挖掘用户日志中查询词和相关文档的连接关系,构造关联查询,并在此基础上提出一种从关联查询中提取查询扩展词的查询扩展方法.同时,还提出一种查询歧义的判别方法,该方法可以对查询词所表达的检索意图的模糊程度进行有效度量,也可以对查询词的检索性能进行预先估计.通过对查询歧义的度量来动态调整扩展词的长度,提高查询扩展模型的灵活性和适应能力. 相似文献
14.
基于用户兴趣的搜索引擎 总被引:1,自引:0,他引:1
随着WWW的出现和发展,Internet上出现的信息迅速增长.如何从大量的信息中获取有用的信息,正成为信息领域的关键技术.传统的搜索引擎没有考虑不同用户的兴趣,因此搜索出来的结果往往无法满足不同用户的特定需求.提出一种用户兴趣模型,能够有效表示用户兴趣,并对传统搜索引擎的搜索结果进行匹配度计算,从而将符合用户兴趣的结果返回给用户.基于这种模型开发了一个基于用户兴趣的法律领域的搜索引擎MyLaw. 相似文献
15.
基于用户兴趣的元搜索结果合成算法研究 总被引:1,自引:0,他引:1
元搜索引擎将为用户提供更全面的搜索结果信息,但在庞大的搜索结果中快速找到自己感兴趣的结果并非易事.针对查询结果合成问题,提出了一种基于用户兴趣的结果合成方法,在摘要法计算用户查询与查询结果相关度的基础上引入了词条等级和用户兴趣,实现了元搜索引擎的个性化.通过程序实现此算法,分别与单个搜索引擎以及其他几种结果合成算法比较,证明此算法保证了搜索结果的查全率,又提高了查准率,大大改善了用户检索效果和效率. 相似文献
16.
在网络广告业中出现的欺诈点击行为,使得搜索引擎企业以及广告主的利益受到了严重损害,致使点击付费模式遭到质疑,欺诈点击已经成为阻碍网络广告业健康发展的一大顽疾。针对网络广告业发展所面临的此种困境,提出一种基于用户行为分析的广告欺诈点击检测技术。首先创建用户行为数据仓库,然后运用贝叶斯分类方法对用户行为数据进行点击合法等级预测,最后结合博弈控制机制对用户点击有效性进行最终判断。 相似文献
17.
校园BBS是高校网络舆论的主要载体,反应了大学生的舆论倾向以及生活的各个方面,高校BBS的实证研究具有重要的意义。如何高效地对帖子的热度进行预测是发现突发网络舆情的基础,对网络舆情的研究具有重要的意义。以一高校BBS实际的数据为研究对象,对帖子和用户进行深入分析,提出一种基于用户行为的高校BBS热帖预测模型,通过实验分析,该方法可以对论坛中的热帖进行较好的预测。 相似文献
18.
《计算机应用与软件》2014,(7)
图书馆数据库资源的网络化、数字化和资源共享共建化是现代图书馆学的发展方向。数据库资源的整合与利用是图书馆资源整合的核心与关键。针对图书馆用户的行为分析,提出基于用户行为分析的图书馆数据库资源整合与利用的整体框架,进行用户行为数据的分类和用户行为数据的挖掘,最终给出图书馆数据库资源整合与利用的发展方向。 相似文献
19.
《计算机应用与软件》2016,(7)
基于互联网数据的传染病疫情监测成为近年来传染病防治的热点研究内容。通过对2014年9月暴发的以广东省为中心的全国登革热疫情与登革热相关关键词的百度指数的关联性分析,发现地区(省、市)登革热疫情严重程度与该地区"登革热"关键词的百度指数呈很强的正相关性。为了实时地预测疫情动态,建立基于12个登革热相关关键词的百度指数的多元线性回归模型。在留一法交叉验证和反向测试中,该模型对于测试数据的预测值和实际值的皮尔森相关系数分别达到了0.89和0.73。经实验,该预测模型能够比较准确地预测登革热疫情动态,同时该研究对于基于互联网数据的传染病疫情监测和防治具有一定的指导意义。 相似文献
20.
《计算机应用与软件》2015,(10)
由于社交网络中人物与内容之间错综复杂的关系,如何合理地给用户推荐感兴趣的内容具有十分重要的意义。提出CCVR(Core user for Clustering interesting Vector for Recommend)算法。基于用户的兴趣矩阵,运用改进的K-means算法进行聚类从而推导类兴趣向量,由此预测用户对哪些内容标签感兴趣,从而形成推荐。实验结果证明CCVR算法具有良好的准确性。 相似文献