首页 | 本学科首页   官方微博 | 高级检索  
     

网页搜索引擎查询日志的Session划分研究
引用本文:张磊,李亚楠,王斌,李鹏,蒋在帆. 网页搜索引擎查询日志的Session划分研究[J]. 中文信息学报, 2009, 23(2): 54-61
作者姓名:张磊  李亚楠  王斌  李鹏  蒋在帆
作者单位:中国科学院 计算技术研究所 前瞻研究中心 北京 100190
基金项目:国家自然科学基金,北京市自然科学基金,国家高技术研究发展计划(863计划) 
摘    要:搜索引擎查询日志中的session (以下简称session)是指某特定用户为得到某个信息需求而在一段时间内的搜索行为的连续序列。Session的正确划分是进行用户搜索行为分析等一系列工作的重要基础,目前尚没有关于session的系统研究工作。本文针对相关研究工作的问题重新统一定义了session的概念并进行探索和比较研究,得出结论(1)统计语言模型因数据稀疏问题不适合做session划分;(2)利用多种属性的决策树方法可以得到比较理想的结果,以session为单位进行评价,F值达到了78.6%。

关 键 词:计算机应用  中文信息处理  网络信息检索  查询日志  session划分
  

Session Segmentation Based on Query Logs of Web Search
ZHANG Lei,LI Ya-nan,WANG Bin,LI Peng,JIANG Zai-fan. Session Segmentation Based on Query Logs of Web Search[J]. Journal of Chinese Information Processing, 2009, 23(2): 54-61
Authors:ZHANG Lei  LI Ya-nan  WANG Bin  LI Peng  JIANG Zai-fan
Affiliation:Center for Advanced Computing Research, Institute of Computing Technology,
Chinese Academy of Sciences, Beijing 100190, China
Abstract:The session in query logs of web search denotes a sequential series of queries from a user when he is searching for certain information during a period of time.Correct session segmentation is a fundamental work for various researches such as searching activities analysis.Due to the unsystematic research on session at present,this paper redefines the conception of session and does several comparative studies.We conclude that(1) the statistical language model is not suitable for session segmentation because o...
Keywords:computer application  Chinese information processing  web information retrieval  search logs  session segmentation  
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号