首页 | 本学科首页   官方微博 | 高级检索  
     

基于Carrot2聚类的垂直搜索引擎的研究与实现
引用本文:高凯,阳春辉,陶秋红,张洋,杨军伟. 基于Carrot2聚类的垂直搜索引擎的研究与实现[J]. 河北机电学院学报, 2012, 0(3): 155-157
作者姓名:高凯  阳春辉  陶秋红  张洋  杨军伟
作者单位:[1]河北科技大学信息科学与工程学院,河北石家庄050018 [2]石家庄职工大学,河北石家庄050041 [3]北京首都国际机场,北京100621
基金项目:河北省科技支撑计划项目(12213516D)
摘    要:给出了一个基于Nutch的垂直搜索引擎系统的实现,主要探讨了基于Lucene和Carrot2的信息检索与聚类的实现,并对分词、垂直信息采集等的实现进行了说明。

关 键 词:搜索引擎  Lucene  Nutch  分词  聚类

Research and implementation of vertical search engine based on Carrot2 clustering
GAO Kai,YANG Chun-hui,TAO Qiu-hong,ZHANG Yang,YANG Jun-wei. Research and implementation of vertical search engine based on Carrot2 clustering[J]. , 2012, 0(3): 155-157
Authors:GAO Kai  YANG Chun-hui  TAO Qiu-hong  ZHANG Yang  YANG Jun-wei
Affiliation:1. College of Information Science and Engineering, Hebei University of Science and Technology, Shijiazhuang Hebei 050018, China; 2. Shijiazhuang Staff and Workers University, Shijiazhuang Hebei 050041, China; 3. Beijing Capital International Air- port, Beijing 100621, China)
Abstract:This paper presents the implementation of vertical search engine based on Nutch, mainly the implementation of the Lucene and the Carrot2 for information retrieval and clustering. Moreover, the paper also introduces in some details the Chi- nese word segmentation and data collection.
Keywords:search engine  Lucene  Nutch  Chinese word segmentation  clustering
本文献已被 维普 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号