首页 | 本学科首页   官方微博 | 高级检索  
     

基于大规模日志分析的搜索引擎用户行为分析
引用本文:余慧佳,刘奕群,张敏,茹立云,马少平.基于大规模日志分析的搜索引擎用户行为分析[J].中文信息学报,2007,21(1):109-114.
作者姓名:余慧佳  刘奕群  张敏  茹立云  马少平
作者单位:1.清华大学 智能技术与系统国家重点实验室,北京 100084; 2.搜狗公司 研发中心,北京 100084
基金项目:国家重点基础研究发展计划(973计划);国家自然科学基金;教育部科学技术研究重点项目
摘    要:用户行为分析是网络信息检索技术得以前进的重要基石,也是能够在商用搜索引擎中发挥重要作用的各种算法的基本出发点之一。为了更好的理解中文搜索用户的检索行为,本文对搜狗搜索引擎在一个月内的近5 000万条查询日志进行了分析。我们从独立查询词分布、同一session内的用户查询习惯及用户是否使用高级检索功能等方面对用户行为进行了分析。分析结论对于改进中文搜索引擎的检索算法和更准确的评测检索效果都有较好的指导意义。

关 键 词:计算机应用  中文信息处理  网络信息检索  搜索引擎  用户行为分析  点击信息分析  
文章编号:1003-0077(2007)01-0109-06
收稿时间:2006-07-26
修稿时间:2006-10-11

Research in Search Engine User Behavior Based on Log Analysis
YU Hui-jia,LIU Yi-qun,ZHANG Min,RU Li-yun,MA Shao-ping.Research in Search Engine User Behavior Based on Log Analysis[J].Journal of Chinese Information Processing,2007,21(1):109-114.
Authors:YU Hui-jia  LIU Yi-qun  ZHANG Min  RU Li-yun  MA Shao-ping
Affiliation:1.Department of Computer Science and Technology, Tsinghua University, Beijing 100084;
2.Sogou R&D Centre, Beijing 100084
Abstract:User log analysis is important for both Web information retrieval technologies and commercial search engine algorithms.In order to better understand search behavior of Chinese Web search users,we presents an analysis of Sogou Search Engine query log consisting of approximately 50 million entries for search requests over a period of one month.The analysis includes search retrieval behavior in individual queries distribution,user request customs in the same session and whether using advanced search functions.Conclusions may help improve Web information retrieval algorithms and search performance evaluation methods.
Keywords:computer application  Chinese information processing  web information retrieval  search engine  user behavior analysis  click through data analysis  
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号